Robin Linderborg, Jens Finnäs och Leo Wallentin - tre datajournalister som ska skapa standard för webbskrapning av myndighetsstatistik
Foto: Robin Linderborg, Jens Finnäs och Leo Wallentin - tre datajournalister som ska skapa standard för webbskrapning av myndighetsstatistik 

Robin Linderborg, Jens Finnäs och Leo Wallentin - tre datajournalister som ska skapa standard för webbskrapning av myndighetsstatistik

Datajournalister standardiserar statistikinhämtning

Av Anders Frick den 25 januari, 2017

Nu ska de grävande journalisterna Jens Finnäs, Leo Wallentin och Robin Linderborg bringa ordning i statistiska data från svenska myndigheter. Under det närmaste halvåret kommer journalisterna att skapa en standard för webbskrapning av myndighetsstatistik.

Många svenska myndigheter publicerar statistik av olika slag, utan att följa standarder eller erbjuda programmeringsgränssnitt i form av API:er. Statistik är perfekta underlag för journalister att skapa nyheter av, men då krävs samtidigt att det är möjligt att jämföra de olika underlagen – något som svenska datajournalister dagligen kämpar med.

Målet med Jens Finnäs, Leo Wallentins och Robin Linderborgs projekt är att göra myndighetsdata programmatiskt tillgänglig på ett standardiserat sätt. Projektet drivs av Journalism Robotics Stockholm och är ett av sex internetfrämjande projekt som nyligen fick pengar genom Internetfonden.

– Idén föddes efter att ha skrivit ett betydande antal webbskrapningsverktyg för att hämta data från svenska myndighetssajter. Varje gång vi tog fram ett verktyg hade vi en känsla av att någon säkert redan har gjort samma sak tidigare. Kort sagt tror vi att det finns ett gäng dataanvändare runtom i landet som på sin egen kammare sitter och uppfinner hjul helt i onödan. I väntan på att öppen data-revolutionen ska ta fart på riktigt hoppas vi att det här ska vara en spark i rätt riktning, säger Jens Finnäs.

Första steget blir att kartlägga datakällor och diskutera med avancerade databrukare i form av forskare, tjänstemän och andra journalister. Med det som grund kommer datajournalisterna ta fram ett verktyg i form av ett mjukvarupaket som hjälper användare att skriva webbskrapningsverktyg och harmonisera själva datainhämtningen.

– Användarna ska till exempel slippa behöva bry sig hur en viss myndighet väljer att stava ett kommunnamn. Vi hoppas genom projektet kunna bidra med en liten byggsten för en öppen internetinfrastruktur som kommer att vara till nytta för, framförallt, relativt avancerade dataanvändare, säger Jens Finnäs.

Projektkollegan Robin Linderborg är prisbelönt datajournalist och programmerare på SVT Pejl. Han är även initiativtagare till swe-scrapers, som är något av ett embryo till det nu aktuella projektet.

Leo Wallentin har bland annat skapat Thenmap, ett API för historiska kartgränser. I övrigt driver Jens Finnäs och kollegorna på frilansbyrån Journalism++ Stockholm bland annat projektet Marple, vars syfte är att med högre grad av automatisering hitta nyheter i statistik och öppna data. Genom en nyhetsbyrå levererar man autogenererade nyhetsingångar om brottslighet, arbetslöshet och fastighetspriser till svenska lokalredaktioner. Häromåret jobbade byrån med projektet Protokollen. Målet var att löpande samla in samtliga kommuners alla kommunstyrelseprotokoll och göra dem sökbara.

Etiketter: , ,