07 mei 2020

De verspreiding van het coronavirus in België (een update)

Terwijl Europa zich langzaam maar zeker opmaakt om de draad weer op te pakken, is het tijd om de ravage die het coronavirus heeft aangericht nader te bestuderen. Hoeveel mensen zijn er daadwerkelijk besmet, hoeveel mensen worden dan ook ziek en hoe groot is de kans om aan het virus te overlijden?

Foutloos en secuur werken is aan mij niet besteed. Doorgaans sluipt er altijd wel een foutje in mijn artikelen. Zelfs in mijn rubriek op schakers.info gebeurde dat constant. Een kwestie van veel zinnen herschrijven en niet goed nalezen. In mijn artikel van vorige week zaten echter wel drie storende fouten in het model van het verloop van de verspreiding van het coronavirus in België.

De eerste storende fout is dat ik het aantal actieve gevallen (de besmette personen minus de genezen en overleden personen) gebruikte in plaats van het totale aantal besmette personen. De tweede fout was dat ik de data van de besmettingen verkeerd had. Die werden in het Belgische artikel genoemd, maar niet in het Nederlandse artikel dat ik als bron gebruikte. En ten slotte was het model lang niet zo accuraat als ik dacht. Daarom wilde ik de gemaakte fouten in dit artikel even rechtzetten.

Het idee achter het model is weer als volgt: voor iedere dag is bekend bij hoeveel mensen het coronavirus is vastgesteld. Op basis van de steekproef onder bloeddonoren is voor twee dagen bekend hoeveel mensen (naar schatting) echt besmet zijn. Door deze twee gegevens met elkaar te combineren, kan het verloop van de besmettingen geconstrueerd worden.

Hierbij moet worden opgemerkt dat het aantal gerapporteerde besmettingen en de infectiegraad onder bloeddonoren altijd achterlopen op het werkelijke aantal besmettingen. Volgens het Belgische artikel zitten er twee weken tussen besmetting en het moment waarop de antilichamen in het bloed ook daadwerkelijk te detecteren zijn. Een bloeddonor die op 30 maart positief testte op corona, moet het virus dus uiterlijk 16 maart hebben opgelopen.

Om diezelfde reden zit er tijd tussen de besmetting en de tijd dat iemand ziek wordt (of het moment waarop de ziekte wordt vastgesteld). Deze incubatietijd is vermoedelijk langer dan de twee weken voordat iemand een detecteerbare hoeveelheid antilichamen in zijn of haar bloed heeft, aangenomen dat het een tijd duurt voordat de immuunrespons echt op gang komt. Aan de andere kant zou het ook kunnen zijn dat degenen die vatbaar voor het coronavirus zijn juist sneller ziek worden.

Het verloop van het werkelijke aantal besmettingen is dus het aantal gerapporteerde besmettingen, maar dan verschoven in de tijd en gedeeld door de kans dat iemand die besmet is ook ziek wordt. De beste schatting lijkt een extra incubatietijd van 5 dagen en een kans van 7,5% om ziek te worden. Dit betekent dat iemand met een kans van 7,5% 19 (14 + 5) dagen na de besmetting ziek wordt.

Gemodelleerd aantal besmettingen en overledenen in België als fractie van de totale bevolking. Het aantal werkelijke besmettingen is gekalibreerd aan de hand van de infectiegraden van bloeddonoren (de zwarte stippen).

De lijn van het aantal werkelijke besmettingen (op basis van de data van bloeddonoren) loopt dus 5 dagen voor op de officiële besmettingen en naar schatting dus 14 dagen achter op het moment waarop de besmettingen ook daadwerkelijk plaatsvonden. Tevens is de lijn een factor 1/7,5% opgehoogd. Het aantal werkelijke besmettingen kan vervolgens gebruikt worden om het aantal sterfgevallen (rood) te modelleren.

Hiervoor moet ik een sterftekans p bepalen en de verdeling van de sterfteduur. Het verloop van het aantal sterfgevallen laat zich echter niet makkelijk modelleren. Het lijkt erop dat een sterftekans van 1,3% en een sterfteduur van gemiddeld 11 ±2 dagen het best gemodelleerd wordt. Zelf vind ik de geringe standaarddeviatie een indicatie dat het model niet heel goed is, maar wellicht zijn de verschillen in sterfteduur ook echt gering. Bovendien heeft het model alsnog veel moeite om het verloop van het aantal sterfgevallen te modelleren.

Aantal sterfgevallen per dag in België. Rood: werkelijke aantallen, zwart: gemodelleerd.

Idem, maar dan met cumulatieve aantallen.

Te zien is dat het model de sterfgevallen tijdens de piek onderschat en aan de randen dus overschat. Het verloop van het aantal sterfgevallen was in werkelijkheid dus veel gepiekter dan mijn simpele model kan verklaren. Ik kan twee redenen bedenken waarom dat het geval is: 1) het sterftecijfer is niet constant over de tijd, bijvoorbeeld doordat eerst jongere mensen besmet werden (wintersporters, carnavalvierders) en daarna de oudjes in verzorgingstehuizen. Inmiddels hebben de kwetsbaarste mensen het loodje gelegd, waardoor het virus minder dodelijk is voor de overgebleven bevolking. 2) Wellicht is dit een aanwijzing dat het zorgsysteem tijdens de piek overbelast was, waardoor niet iedereen de benodigde zorg kreeg.

Doordat het model niet erg goed is, is het ook lastig om voorspellingen te doen. Hoeveel mensen gaan er nog overlijden als er de komende weken bijvoorbeeld 200 nieuwe besmettingen per dag bij komen? Wat als er helemaal geen nieuwe besmettingen meer bij komen? Doordat het model de overlijdenskans in de staart overschat, zullen de voorspellingen dus ook wel overschattingen zijn. Het goede nieuws voor onze zuiderburen is (voor zover dat nog nieuws mag heten) dat het aantal sterfgevallen al sinds halverwege april hard daalt, zodat ze hopelijk in het staartje van de crisis zitten. Hopelijk geldt dat voor hun lager gelegen buurland ook.

Het model suggereert dat:

  • 6% van de bevolking besmet is (iets lager dan in het vorige model)
  • 7,5% van de besmette personen ziek wordt (dit was 4%)
  • 17% van de zieke personen overlijden (dit was 38%)
  • 1,3% van de besmette personen overlijden (dit was 1,5%)
  • 95% daarvan tussen de 7 en 15 dagen overlijdt
  • de incubatietijd ongeveer 19 dagen is

Er is nog wel een kanttekening te plaatsen. Doordat de infectiegraad alleen van (lichamelijk) gezonde bloeddonoren is bepaald, kunnen er in werkelijkheid meer mensen besmet zijn dan gedacht. Dit betekent dat de kans om ziek te worden kleiner is dan gedacht. Aan de andere kant lijken de gerapporteerde coronadoden in België verbazingwekkend goed in de pas te lopen met de oversterfte, wat betekent dat het model met betrouwbare data gevoed wordt. Desondanks is het nog een hele kluif om op basis van deze puzzelstukjes de hele coronapuzzel te leggen, zoals vorige week duidelijk bleek. Hopelijk weet dit model de tand des tijds beter te weerstaan.

Geen opmerkingen:

Een reactie posten