Ingen röst

Postad 2018-04-30 av Karl Pettersson. Taggar: datavetenskap

Sveriges Radio rapporterar om smarta högtalare, det vill säga inbäddade system som kan styras med rösten och kan kopplas samman med olika apparater i ett hushåll (Lindblad 2018). Det sägs att [m]ånga teknikanalytiker anser att framtiden är att vi pratar med våra apparater istället för att knappa på dem. Jo, i vissa sammanhang kan detta säkert innebära effektivisering. Samtidigt är det lätt att tänka sig sammanhang där det skulle innebära ineffektivisering. För en person med normalt fungerande händer och syn som befinner sig i sitt kök går det t.ex. snabbare att vrida ugnsvredet till 200 grader än att säga något i stil med ugn, ställ in temperaturen på 200 grader.

Röststyrning av datorer är inte en ny idé. Hexmaster (2010) ger exempel från filmen Blade runner från 1982, som också illustrerar svårigheten att skapa ett vettigt röststyrt användargränssnitt för att göra mer komplexa saker än att starta ett program, göra en enkel Googlesökning eller läsa in löpande text. I detta inlägg diskuteras dessutom att det är lätt att sammanblanda förmågan hos ett datorsystem att tolka röstkommandon med förmågan att tolka instruktioner som ges i naturligt språk, där det senare kräver mycket mer utveckling av den mjukvara som används.

Den snabba utvecklingen av kapaciteten hos hårdvaran kan göra att det är lätt att tro att samma sak gäller mjukvaran, vilket i många avseenden inte stämmer, som jag diskuterade den 10 december förra året. De grafiska användargränssnitt som dominerar i våra persondatorer bygger på de system som utvecklades av Xerox PARC på 1970-talet. Pike (1991) skissar på ett nytt användargränssnitt, efter att ha konstaterat att utvecklingen går trögt. Med undantag för Macintosh, vars användare hittat kreativa sätt att slippa begränsas, eller förolämpas, av valet att de skulle finna mer än en musknapp förvirrande, har de nya datorerna inte inneburit någon befrielse från tidigare tangentbordstunga gränssnitt: universiteten använder sig av editorer som vi och emacs, kvarlevor från 1970-talet.

Pike vågar sig på en förutsägelse 10 år fram i tiden (alltså till 2001): CRT-skärmarna kommer att ha försvunnit, multimedia kommer inte längre att vara något buzzword, pennbaserade och röststyrda användargränssnitt kommer att finnas överallt, och studenter vid universitet1 kommer fortfarande att editera med emacs. Pikes gränssnitt är fokuserat på mer effektivt utnyttjande av musen, som han förutsäger kommer att överleva ett bra tag. Pennor och pekskärmar har, säger han, för dålig bandbredd för riktig interaktion, och röststyrning kommer nog inte heller att vara lösningen. Vem skulle vilja arbeta omgiven av folk som pratar med sina datorer? Jo, eller omvänt: vem skulle vilja att ens omgivning hörde alla ens inmatningar i datorn?

Nu har snart 30 år gått sedan Pike skrev sin uppsats, och utvecklingen har inte kommit mycket längre än de förutsägelser han som sagt gjorde för en 10-årsperiod. Vi har LCD-skärmar och liknande, i stället för CRT, både på stationära och mobila enheter. Folk går omkring med smarta telefoner försedda med små pekskärmar, som är klumpiga att använda för inmatning av text, fast de slog igenom först ca 2010. Röststyrning är något som fortfarande utgör framtiden. Jag vet inte vad just universitetsstuderande föredrar för program för textredigering, men bland utvecklare och systemadministratörer hör i varje fall vi (eller åtminstone dess efterföljare vim) och emacs fortfarande till de mest populära editorerna (Stack Overflow 2018).

Pikes användargränssnitt har alltså inte heller fått något större genomslag. En modifierad version av det kom att inkluderas i editorn acme i operativsystemet Plan 9, som aldrig haft någon större användarskara, även om editorn och andra Plan 9-program nu finns portade till Linux och andra system (9fans 2018). Det mest betydelsefulla arvet från Plan 9-projektet är annars Pikes och Ken Thompsons teckenkodning UTF-8, som nu blivit helt dominerande på webben. Kanske är den, med tanke på den röra av inkompatibla kodningar som varit förhärskande, ett av de största framsteg som gjorts på mjukvaruområdet de senaste 30 åren.

Referenser

9fans. 2018. ”Plan 9 from User Space”. https://9fans.github.io/plan9port/.

Hexmaster. 2010. ”Röststyrning 1982”. https://faktoider.blogspot.se/2010/03/roststyrningsproblemet.html.

Lindblad, Tomas. 2018. ”Smarta högtalare – snart en del av vår vardag”. https://sverigesradio.se/sida/artikel.aspx?programid=406&artikel=6942388.

Pike, Rob. 1991. ”A Minimalist Global User Interface”. http://doc.cat-v.org/plan_9/1st_edition/help/.

Stack Overflow. 2018. ”Developer Survey Results – Development Environments and Tools”. https://insights.stackoverflow.com/survey/2018#development-environments-and-tools.


  1. Han tänkte sig nog främst studenter inom datavetenskap och liknande.