Bildat folk
Nu i dagarna har föreningen Vetenskap och Folkbildning annonserat förra årets folkbildare och förvillare, som de brukar göra vid nyår (Olausson 2018). Det första priset gick till epidemiologen Emma Frans, och det sista gick till den så kallade hälsokejdan Life. Förvillarkedjan tänkte jag lämna därhän i det följande. När det gäller Frans motiveras hennes pris av Vetenskap och Folkbildning (2018) med att hon på olika sätt pedagogiskt och humoristiskt spridit kunskap och förklarat myter och missförstånd kring vetenskap: hon har twittrat, haft en artikelserie i Svenska Dagbladet och även gett ut en bok (Frans 2017).
Folkbildarutmärkelsen var välförtjänt. Det florerar onekligen en hel del vilseledande information kring vetenskap. Dels finns förstås rent pseudovetenskapliga idéer, dels finns missvisande kommunikation av kanske i grunden seriös forskning. Denna kan i sin tur delas upp i sådan som forskarna själva förmedlar, t.ex. i syfte att blåsa upp betydelsen av sina resultat, och sådan som andra förmedlar utan deras medverkan och de kanske själva försöker korrigera, fast de då ofta har föga framgång. Flera av dessa teman diskuteras av Frans (2017).
Samtidigt exemplifierar Frans (2017) vissa problem när det gäller
kommunikation av vetenskapliga resultat, som jag har diskuterat
tidigare, och där ingen, vad jag sett, kunnat komma med någon riktigt
tillfredsställande lösning. I ett kapitel med rubriken [a]tt förstå
statistik
diskuteras bl.a. diagram och risker.
När vi läser diagram kan vi, för att undvika att bli lurade, kolla om
y-axeln är beskuren eller inte
(Frans 2017, st. 15.6). Det ges ett
exempel med ett linjediagram från Alliansen i Göteborg som visar på hur
andelen elever som lämnat Göteborgs kommunala grundskolor med godkända
betyg minskat från 79 procent 1998 till 65–70 procent åren 2011–16.
Variationsområdet på y-axeln är från 60 till 85 procent, så det ser ut
som en dramatisk minskning. Om y-axeln ändras så att variationsområdet
är från 0 till 100 procent ser minskningen betydligt mindre dramatisk
ut. Poängen illustreras med ett staplat diagram över andelen tillfällen
där det är vilseledande att kapa y-axeln: andelen är 99 procent, och
y-axelns variationsområde är från 98 till 100 procent. Någon definition
av vad som menas med beskuren y-axel
ges inte. Intrycket som förmedlas
är att det i alla fall är ett tillräckligt villkor att y-axeln börjar
ovanför 0.
Den 11 december 2016 skrev jag om denna
problematik. Jag refererade till Yanofsky (2015), som ger flera exempel
när det inte är rimligt att låta y-axeln börja på 0, som feberkurvor
för människor. För logaritmiska skalor är det rent omöjligt. Men mer
generellt går det att ställa sig frågan vad det egentligen innebär att
börja på 0. I S.S. Stevens klassifikation av måttskalor spelar
godtyckliga
nollpunkter en viktig roll för att skilja mellan
intervallskalor
(som våra vanliga temperaturskalor) och kvotskalor
(för längd, vikt, absolut temperatur etc.). Men senare forskare har i
sin tur argumenterat för att denna godtycklighet
inte kan avgöras
oberoende av de frågor som de statistiska undersökningarna är avsedda
att besvara.
Om den relevanta nollpunkten på detta sätt är beroende av kontexten, är
det tveksamt om det går att ge någon definition av beskuren y-axel
annat än y-axel som börjar ovanför en relevant baslinje för
undersökningen
. I så fall blir det svårt att förneka att det är
vilseledande med beskurna y-axlar, men det finns inget enkelt,
universellt sätt att avgöra om en y-axel är beskuren. Denna problematik
är dock kanske mest besvärlig för de som konstruerar diagram. För de som
läser ett diagram är det kanske tillräckligt att vara uppmärksam på vad
det egentligen är för variation diagrammet visar, därför att en trend
lätt kan fås att framstå som mer eller mindre dramatisk genom
manipulation av y-axeln.
Ett annat problemområde som diskuteras är tolkning av påståenden om att
något ökar risken
för negativa utfall, som cancer (Frans 2017, st. 15.52–15.59). Diskussionen handlar om skillnaden mellan absoluta och
relativa risker, som illustreras med ett exempel med processat kött. Det
sägs att [d]en relativa riskökningen
för kolorektal cancer för den
som äter motsvarande någon korv om dagen är 1,18, det vill säga 18
procent högre
än för den som äter mindre än så, vilket jämförs med
rökning, som ökar risken för lungcancer 20 gånger, det vill säga med
2000 procent
.1 Men, säger Frans, det är en relativ riskökning som
inte säger något om individens absoluta risk att drabbas. Livstidsrisken
för kolorektal cancer har uppskattats till ca 5 procent. Men då innebär
en riskökning på 18 procent att 6 procent av de som äter bacon eller
korv får denna cancerform.2
Jo, det är en viktig distinktion. Problemet, för den som börjar tillämpa
lärdomen vid tolkning av kohortstudier som refereras i media, är att
sådana kvoter mellan livstidsrisker sällan används som primärt
utfallsmått i detta slags studier. Ofta har studierna inte tillräckligt
med information (t.ex. inte tillräckligt lång uppföljningstid) för att
beräkna livstidsrisker på ett någorlunda tillförlitligt sätt. Utöver
detta kan risker över lång tid lätt påverkas av effekter på
konkurrerande utfall (som olika dödsorsaker). Det har definierats så
kallade hazardtal, mått på ögonblicklig risk
för de som överlevt till
en viss tidpunkt. Om hazardtalen inte minskar över tid och det inte
finns konkurrerande utfall (som vid total dödlighet), kommer risken över
tid att närma sig 1. Det är ofta kvoter mellan hazardtal som moderna
kohortstudier använder som utfallsmått. Dessvärre är dessa inte så lätta
att förklara på ett pedagogiskt sätt. Exempelvis den 17 februari förra
året har jag skrivit om hur medias rapportering
kring studier med detta mått tenderar att bli förvirrande. Fortfarande
har jag inte sett någon komma med någon bra lösning på problematiken.