Flunstagram
Av de senaste rapporterna att döma har denna ovanligt intensiva säsong av influensa B nu lugnat ned sig (Folkhälsomyndigheten 2018). Nu är det influensa A, som ökat långsamt under februari och mars, som är dominerande när det gäller labbfall. Det vanliga är att det är tvärtom: att influensa A får en mer eller mindre intensiv topp i februari, eller tidigare, och att influensa B uppvisar en flackare kurva som toppar sent under säsongen. Påsklov och det, i jämförelse med marsvädret, milda och fuktiga väder vi fått kan bidra till att dämpa spridningen ytterligare.
Influensarapporterna innehåller resultat från flera övervakningssystem:
dels labbfall och sentinelfall, från vårdcentraler och liknande, dels
samtal till 1177 Vårdguiden om feber hos barn
och sökningar relaterade
till influensa hos 1177.se. Det kan vara av intresse att göra
jämförelser med trender på andra webbplatser. För några år sedan hade
Google en webbtjänst, Flu Trends, som sökte förutsäga influensaaktivitet
baserat på Googlesökningar (Wikipedia 2018). Den är inte längre aktiv,
men vem som helst kan studera trender för sökord som influensa
för
t.ex. Sverige på Google Trends, vilket jag exemplifierade den 24
november förra året. En sökning för denna
säsong visar på en topp kring den 20 februari (Google Trends 2018), vilket
stämmer med övervakningssystemen i influensarapporterna.
Kan även Instagram vara användbart i sammanhanget? Många taggar bilder
med #influensa
eller liknande när de själva eller deras familjer har
influensa. Med hjälp av programmet Instagram Scraper (Arcega 2018),
går det att hämta bilder eller metadata för en viss användare eller en
viss tagg från Instagram. Följande kommando sparar metadata för bilder
med #influensa
till en JSON-fil data/influensa.json
.
$ instagram-scraper influensa --tag --media_metadata -t none -d data
Argumentet -t none
gör att själva bilderna inte skördas, endast
metadata. Ingen inloggning görs, och det är endast metadata för publika
bilder som skördas. Varje bild har en tidsstämpel taken_at_timestamp
uttryckt i Unixtid (antalet sekunder sedan nyåret 1970 UTC). Listan över
dessa tidsstämplar är den enda information som behövs för nedanstående
analys, implementerad i Julia. Någon åtskillnad på geografiskt område
görs inte, men influensa
verkar endast förekomma i nordiska språk.
import JSON
using DataFrames, Loess, Query, PyPlot, StatsBase
instafludtimes = JSON.parsefile(joinpath("data", "influensa.json")) |>
j -> map(x->Dates.unix2datetime(x["taken_at_timestamp"]), j)
instafludf = instafludtimes |> x->Date.(x) |> countmap |>
x -> DataFrame(date=collect(keys(x)),
count=collect(values(x))) |> sort
function dateslice(sdate, edate)
@from i in instafludf begin
@where i.date >= sdate && i.date <= edate
@select {i.date, i.count}
@collect DataFrame
end
end
function plot_dateslice(df)
datenum = convert(Array{Float64}, 1:size(df)[1])
count = convert(Array{Float64}, df[:count])
count_sm = Loess.predict(loess(datenum, count), datenum)
plot(df[:date], count, "*", label="dagligt antal")
plot(df[:date], count_sm, label="trend (loess)")
legend(loc=2)
grid(1)
xlabel("Datum")
ylabel("Antal")
title("Publika Instagrambilder med #influensa")
xticks(rotation=45)
subplots_adjust(bottom=0.2)
end
Med dateslice(Date(2017,12,01), Date(2018,03,31)) |> plot_dateslice
kan sedan diagrammet i fig. 1 genereras. Det visar alltså antalet
publika Instagrambilder med taggen #influensa
per dag från december
2017 till mars 2018.
Även här har en topp nåtts omkring den 20 februari. Men ingen dag har fler än 50 publika taggade bilder, och antagligen detta slags analys inte tillräcklig styrka för att upptäcka tidiga ökningar av influensaaktiviteten.