Mitä?
Helsingin Sanomissa julkaistiin 25.10. artikkeli, jossa kerrotaan Käypä hoito -suositusten laatijoiden sidonnaisuuksista.
Käypä hoito –artikkelin taustalla olevat tiedot on kerätty Duodecimin Käypä hoito –nettisivuilta tietokoneohjelman avulla.
Tampereen teknillisen yliopiston tutkija Jaakko Salonen laati ohjelman, joka kerää suositukset ja tekee niistä Excel-tiedoston. Näistä tiedoista laskettiin se, kenellä on eniten suosituksia.
Jaakko Salonen julkaisee artikkelin tekemiseen käytetyt ohjelmat avoimena lähdekoodina App4Finland kilpailussa.
Missä?
Zip-tiedosto sidonnaisuuksista täällä
Miten tiedot on tarkalleen haettu?
Salosen kirjoittama ohjelma on scraper, eli raapija. Se etsii Käypä hoito -suositusten nettiversiosta sidonnaisuuksia, jotka liittyvät suositusten laatijoihin. Ohjelma käyttää ennalta kerättyä listaa yrityksistä ja yhteisöistä, ja se tunnistaa niitä yhteensä 314.
Ohjelman käyttämä yritys- ja yhteisölista on tuotettu kevään 2012 datajournalismin kurssilla. Aineiston keräämiseen ovat osallistuneet kurssityöryhmän jäsenet Annina Vainio, Esa Koivuranta, Jaakko Salonen, Taina Rinta-Kauhajärvi sekä Tuomas Haakana. Kurssin verkkosivu on täällä.
Aineisto on luonteeltaan käsin syötettyä. Siksi ohjelma saatta tunnistaa vähemmän sidonnaisuuksia kuin niitä todellisuudessa on. Esimerkiksi kirjoitusvirheet ja oudot lyhenteet hämäävät ohjelmaa niin, ettei se tunnista sidonnaisuutta oikein. Joitain sidonnaisuuksia ei ole huomioitu, kuten esimerkiksi yliopistoja.
Yllä olevassa zip-tiedostossa on kaypahoito-yritykset.xls, joka sisältää täydellisen listan etsittävistä sidonnaisuuksista. Siihen voi tutustua yksinkertaistetussa muodossa täällä.
Lisenssi?
Tiedot julkaistaan Creative Commons 3.0 Nimeä -lisenssillä. Tietoja voi lisenssin mukaisesti käyttää melko vapaasti, kunhan niiden lähteeksi mainitaan Jaakko Salonen ja Helsingin Sanomat. Toivomme, että mahdollisten jatkokäyttöjen yhteydessä linkataan tähän blogikirjoitukseen.
