Mellan blocken
Vid valet till Sveriges riksdag nu i september minskade de rödgröna partierna (S, V och MP) med 3,0 procentenheter jämfört med föregående val, 2014 (Wikipedia 2018). S ensamma minskade med 2,8 procentenheter. På så sätt kan de sägas förklara nästan hela minskningen av de rödgröna. Men även MP minskade med 2,5 procentenheter, och kan då med samma resonemang tillskrivas majoriteten av minskningen. Att de rödgröna inte minskade mer än de faktiskt gjorde förklaras av att V ökade med 2,2 procentenheter.
Det har gjorts undersökningar av väljarströmmar mellan partier, där det görs en matris över hur folk som röstat på ett visst parti vid ett val röstat vid ett senare val. Inga register håller reda på hur individer röstat, så det får baseras på stickprov. Ett exempel är Holmberg och Oscarsson (2018), där det ingår frågor både om vilket parti deltagarna skulle rösta på 2018 och vilket de röstade på 2014. Både bland de som röstade på S 2014 och de som röstade på MP 2014 var det drygt 75 procent som även 2018 röstade på något rödgrönt parti. I absoluta tal var då strömmarna ut från det rödgröna blocket betydligt större för S än för MP. Över 40 procent av de S-väljare 2014 som inte röstade rödgrönt 2018 hade röstat på SD. Flödet ut från S kan sägas vara mer relevant än flödet ut från MP för att förklara de rödgrönas nedgång. Sedan skedde förstås också ett flöde in till S och MP från andra partier, både rödgröna och andra.
När det gäller förändringar av dödsorsaksmönstret finns en i viss mån parallell situation. Det är mer än 1000 ICD 10-koder som används för underliggande dödsorsaker varje år. Dessa kan grupperas på olika sätt, och vi talar gärna om trender för fördelningen av grupper av dödsorsaker. Exempelvis har andelen dödsfall i någon cirkulationssjukdom, enligt den uppdelning jag använder i Mortalitetsdiagram (ICD-10 I00-I99+F01), minskat från 49,3/48,0 procent bland kvinnor/män 1997 till 35,5/35,0 procent 2017 (enligt den senaste svenska statistiken från Socialstyrelsen (2018), som ännu inte rapporterats till WHO (2022), men kan analyseras på det sätt som beskrevs i förra inlägget). Men inom den definierade gruppen finns det närmare 200 koder som används varje år. Vilka av dessa är det som förklarar minskningen?
Det har skett en kraftig minskning av åldersspecifika dödstal i hjärtinfarkter de senaste decennierna. Parallellt med detta har benägenheten att rapportera mer ospecifika orsaker relaterade till ateroskleros bland äldre minskat, som diskuterades i förra inlägget. I 1997 års statistik stod akut hjärtinfarkt (I21) och de både koderna för aterosklerotisk hjärtsjukdom (I25.1) och ospecifik ateroskleros (I70.9) för 19,6 procent av dödsfallen bland kvinnor. År 2017 hade summan av dessa koders andelar minskat till 6,0 procent. Bland män stod enbart I21+I25.1 för 21,7 procent av dödsfallen 1997. Denna andel hade minskat till 8,7 procent 2017.
För såväl kvinnor som män är alltså minskningen av dessa avgränsade kodmängder nästan exakt lika stor (i procentenheter) som minskningen av hela cirkulationsgruppen. Men bland de övriga koderna i denna grupp finns också sådana vara andelar minskat (och ökat). Vi kunde också täcka in minskningen för hela gruppen genom att kombinera dessa, eventuellt med en delmängd av I21+I25.1+I70.9. Matematiskt kan vi definiera omfördelning av dödsorsaker mellan två år på liknande sätt som för väljarströmmar. Om \(n_1\) är antalet koder som användes för dödsorsaker år 1 och \(n_2\) antalet koder som användes år 2, kan vi definiera en \(n_1\times n_2\) matris \(\mathbf{M}\), där \(\mathbf{M}_{ij}\) är andelen för dödsorsak \(i\) år 1 som fördelas om till dödsorsak \(j\) år 2. Har vi en \(n_1\) radvektor \(\mathbf{f}\) med fördelningen av dödsorsaker år 1, ger \(\mathbf{fM}\) fördelningen år 2.
Problemet är hur vi entydigt skall välja en sådan matris med hjälp av de
data som finns. I fallet med politiska val kan vi som sagt jämföra
exempelvis hur de som röstade 2014 röstade 2018. Det fungerar därför att
det finns en stor överlappning mellan de som röstat i de båda valen. Men
det finns ingen som dött både 1997 och 2017. Jag har någon intuitiv idé
om att det handlar om hur de som dog 1997 skulle ha dött under 2017 års
förhållanden
, vilket både inkluderar förändringar i dödstalen, som
gjort att de dött av något annat (eller samma sak), vid en högre ålder.
Men hur skall något sådant testas empiriskt? Vi kan konstruera
livslängdstabeller för folk som de olika orsakerna 1997 och se hur
personerna skulle ha dött med de förändringar av åldersspecifika dödstal
som skett till 2017, men en begränsning är att sådana jämförelser inte
kan hantera beroendeförhållanden mellan olika koder (utöver sådana som
följer av kodernas åldersfördelning), och sådana finns säkerligen, inte
minst när det gäller förändringar som beror på ändrad rapportering. Ett
möjligt sätt att testa sådana förändringar skulle vara att ge ett antal
läkare som arbetar med dödsorsaksintyg idag ett urval journaler eller
likande dokument för folk som dött 1997 (men blinda läkarna för dessa
personers faktiskt utfärdade intyg och rapporterade underliggande
dödsorsaker), be dem att skriva intyg efter samma principer som de
tillämpar idag, avgöra underliggande dödsorsaker utifrån intygen med de
metoder som används idag och sedan jämföra med de faktiskt rapporterade
orsakerna från 1997.