Förutsägbart folk
I förra inlägget noterade jag att perioden med överdödlighet i Sverige
till följd av COVID-19 tycktes ha upphört och att förutsägelserna från
Nilsson (2020) på 5000–6000 dödsfall visat sig träffsäkra. Men Nilsson
förutsåg också att det månaderna efter epidemin skulle dö 3000–4000
färre än normalt
i Sverige, vilket han, precis som förutsägelserna för
överdödlighet, baserade på svåra influensasäsonger, som de 1988/89 och
1993/94, då det under tremånadersperioden efter dog 1800 färre personer
än normalt, vilket sedan får justeras för ökat antal äldre i
befolkningen.
Nu har vi börjat få in tillräckligt med data för att testa även denna del av Nilssons förutsägelser. Av SCB (2020b) framgår att det från och med vecka 27 inte varit någon överdödlighet i Sverige relativt genomsnittet för motsvarande veckor perioden 2015–19. Under veckorna 27–32 har det dött 9216 svenskar 2020, vilket kan jämföras med ett genomsnitt på 9393 personer dessa veckor 2015–19. Alltså ett visst mått av underdödlighet, men klart lägre än Nilsson förutsåg.
Vad är anledningen till att den ålderjusterade underdödligheten varit lägre efter denna våg med COVID-19 än efter influensasäsonger som medfört hög dödlighet? Enligt Nilsson skulle mönstret med underdödlighet efter influensorna kunna förklaras av selektiv överlevnad, där en stor andel av de som dött varit sköra personer, som skulle ha dött inom några månader om de inte drabbats av influensa. Säkert har detta varit en bidragande faktor. En annan viktig faktor kan dock vara att influensasäsongerna 1988/89 och 1993/94 toppade ovanligt tidigt, redan i december, för att därefter avta. När influensan normalt toppar, i februari eller mars, var influensaaktiviteten dessa säsonger mycket låg, vilket också medförde låg dödlighet. Som visas av diagrammen i mitt inlägg den 22 juni finns även vissa säsonger, som 1994/95, då influensan aldrig verkar ha tagit fart bland de äldre och dödligheten förblivit låg säsongen igenom.1 I februari 1995 dog 3631 kvinnor och 3754 män, jämfört med 3551 kvinnor och 3727 män februari 1994 (SCB 2020a). I februari 1989 dog 3426 kvinnor och 3574 män. Eftersom COVID-19 uppenbarligen inte är en sedan flera år etablerad säsongsinfektion som i år toppat några månader tidigare än vanligt, borde kanske februari 1989 eller 1994 ha jämförts med ett år som 1995 snarare än en genomsnittlig februarimånad kring 1990, som Nilsson tycks ha gjort, om vi varit intresserade av att predicera dödligheten i Sverige månaderna efter att överdödligheten i COVID-19 lagt sig.
När det gäller den mer framgångsrika delen av Nilssons prediktion, om överdödligheten, kan det vara intressant att fråga sig om det redan när hans artikel publicerades i april fanns andra indikationer än extrapoleringerna från influensasäsongerna att det skulle bli 5000–6000 dödsfall i Sverige. I mitt inlägg den 2 maj noterade jag att kvoten mellan den nedre gränsen för det intervallet och överdödligheten fram till påsk är 2,7. Sedan har flera forskare använt sig av Gompertzfunktionen, som annars ofta används för att modellera dödlighet i relation till ålder, för att modellera utvecklingen av COVID-19 (Levitt, Scaiewicz och Zonta 2020; Ohnishi, Namekawa och Fukui 2020). Antalet fall, eller dödsfall, närmar sig i en sådan modellering asymptotiskt ett värde \(a\), sådant att det kumulativa antalet fall vid den tidpunkt där flest nya fall tillkommer ges av \(a/\mathrm{e}\). Om detta tillämpas på dödligheten i Sverige skulle alltså 5000–6000 dödsfall motsvara att antalet dödsfall per dag är som högst när ca 1850–2200 personer dött totalt. Utifrån de data som fanns att tillgå mot slutet av april hade Åke Nilsson kunnat komplettera sin prediktion av överdödligheten med en observation av det sambandet.
Gompertzmodellen säger inget de underliggande mekanismer, i form av
immunitet, ändrat beteende etc., som avgör hur pandemin utvecklas. En
massa modeller som bygger på parametrar för sådan mekanismer, dels
fackmodeller, av typen S(E)IR, dels agentbaserade modeller har också
använts för att göra förutsägelser av COVID-19, med högst varierande
framgång. En av de mest robusta har varit den s.k. YYG-modellen
(Gu 2020), en SEIR-modell där data över antal döda använts för att med
maskinlärning uppskatta \(\mathcal{R}\)-värdet för smittan i olika länder
och regioner. Fig. 1 visar YYG-modellens prediktioner för antal döda i
Sverige den 4 augusti 2020 från 9 april till 3 augusti. Diagrammet kan
återskapas med Julia genom att klona
bloggförrådet och Gu (2020),
skapa en länk till underkatalogen ./projections
i
postdata/2020-08-29-folk
och köra ./yyg_se_0804.jl
.
Medelvärdet för prediktionerna låg alltså kring 6000 döda redan vid påsk, även om viss instabilitet kan ses i slutet av april och början av maj, kanske beroende av ett stort antal inrapporterade dödsfall efter påskhelgen, som kan ha lurat programmet att treden var uppåtgående. De 95-procentiga intervallen för prediktionerna var ganska vida under en stor del av perioden; först efter midsommar snävades de åt till ca 1000 personer.
Referenser
Dock rapporterar Kungliga biblioteket (2024) om en del yngre som drabbades under denna säsong.↩︎