Flunstagram

Postad 2018-04-07 av Karl Pettersson. Taggar:

Av de senaste rapporterna att döma har denna ovanligt intensiva säsong av influensa B nu lugnat ned sig (Folkhälsomyndigheten 2018). Nu är det influensa A, som ökat långsamt under februari och mars, som är dominerande när det gäller labbfall. Det vanliga är att det är tvärtom: att influensa A får en mer eller mindre intensiv topp i februari, eller tidigare, och att influensa B uppvisar en flackare kurva som toppar sent under säsongen. Påsklov och det, i jämförelse med marsvädret, milda och fuktiga väder vi fått kan bidra till att dämpa spridningen ytterligare.

Influensarapporterna innehåller resultat från flera övervakningssystem: dels labbfall och sentinelfall, från vårdcentraler och liknande, dels samtal till 1177 Vårdguiden om feber hos barn och sökningar relaterade till influensa hos 1177.se. Det kan vara av intresse att göra jämförelser med trender på andra webbplatser. För några år sedan hade Google en webbtjänst, Flu Trends, som sökte förutsäga influensaaktivitet baserat på Googlesökningar (Wikipedia 2018). Den är inte längre aktiv, men vem som helst kan studera trender för sökord som influensa för t.ex. Sverige på Google Trends, vilket jag exemplifierade den 24 november förra året. En sökning för denna säsong visar på en topp kring den 20 februari (Google Trends 2018), vilket stämmer med övervakningssystemen i influensarapporterna.

Kan även Instagram vara användbart i sammanhanget? Många taggar bilder med #influensa eller liknande när de själva eller deras familjer har influensa. Med hjälp av programmet Instagram Scraper (Arcega 2018), går det att hämta bilder eller metadata för en viss användare eller en viss tagg från Instagram. Följande kommando sparar metadata för bilder med #influensa till en JSON-fil data/influensa.json.

$ instagram-scraper influensa --tag --media_metadata -t none -d data

Argumentet -t none gör att själva bilderna inte skördas, endast metadata. Ingen inloggning görs, och det är endast metadata för publika bilder som skördas. Varje bild har en tidsstämpel taken_at_timestamp uttryckt i Unixtid (antalet sekunder sedan nyåret 1970 UTC). Listan över dessa tidsstämplar är den enda information som behövs för nedanstående analys, implementerad i Julia. Någon åtskillnad på geografiskt område görs inte, men influensa verkar endast förekomma i nordiska språk.

import JSON
using DataFrames, Loess, Query, PyPlot, StatsBase

instafludtimes = JSON.parsefile(joinpath("data", "influensa.json")) |>
    j -> map(x->Dates.unix2datetime(x["taken_at_timestamp"]), j)
instafludf = instafludtimes |> x->Date.(x) |> countmap |>
    x -> DataFrame(date=collect(keys(x)),
        count=collect(values(x))) |> sort

function dateslice(sdate, edate)
    @from i in instafludf begin
        @where i.date >= sdate && i.date <= edate
        @select {i.date, i.count}
        @collect DataFrame
    end
end

function plot_dateslice(df)
    datenum = convert(Array{Float64}, 1:size(df)[1])
    count = convert(Array{Float64}, df[:count])
    count_sm = Loess.predict(loess(datenum, count), datenum)
    plot(df[:date], count, "*", label="dagligt antal")
    plot(df[:date], count_sm, label="trend (loess)")
    legend(loc=2)
    grid(1)
    xlabel("Datum")
    ylabel("Antal")
    title("Publika Instagrambilder med #influensa")
    xticks(rotation=45)
    subplots_adjust(bottom=0.2)
end 

Med dateslice(Date(2017,12,01), Date(2018,03,31)) |> plot_dateslice kan sedan diagrammet i fig. 1 genereras. Det visar alltså antalet publika Instagrambilder med taggen #influensa per dag från december 2017 till mars 2018.

Publika Instagrambilder med #influensa december 2017–mars 2018
Figur 1: Publika Instagrambilder med #influensa december 2017–mars 2018

Även här har en topp nåtts omkring den 20 februari. Men ingen dag har fler än 50 publika taggade bilder, och antagligen detta slags analys inte tillräcklig styrka för att upptäcka tidiga ökningar av influensaaktiviteten.

Referenser

Arcega, Richard. 2018. ”Instagram Scraper”. https://github.com/rarcega/instagram-scraper.
Folkhälsomyndigheten. 2018. ”Influensarapport för vecka 13, 2018”. https://www.folkhalsomyndigheten.se/globalassets/statistik-uppfoljning/smittsamma-sjukdomar/veckorapporter-influensa/2017-2018/influensarapport-2018-13.pdf.
Google Trends. 2018. ”influensa – Utforska – Google Trender”. https://trends.google.se/trends/explore?date=2017-10-01%202018-04-06&geo=SE&q=influensa.
Wikipedia. 2018. ”Google Flu Trends – Wikipedia”. https://en.wikipedia.org/w/index.php?title=Google_Flu_Trends&oldid=834103414.