Archive for the ‘Google Books’ Category

Culturomics: sanat kertovat kulttuurista

Sunnuntai, Joulukuu 19th, 2010

Lingvistin unelma! Työkalu, joka hakee sanojen esiintymistiheyttä kirjoissa ja joka tekee tuloksista kätevän visualisoinnin.

Tätä tekee Googlen Ngram, netissä tomiva työkalu. Sen avulla voi tarkastalla, kuinka uudet sanat vakiintuvat kieleen. Kirjoita hakuun vaikkapa “computer” (tietokone), ja huomaat, kuinka sana alkaa yleistyä 1960-luvulta lähtien.

Kirjoita hakuruutuun sanat Finland (Suomi) ja Sweden (Ruotsi), ja huomaat, että ensimmäiset maininnat maista ilmaantuvat tämän arkiston kirjoihin 1700-luvun puolivälissä.

Ruotsi saa kirjoissa 1750-luvulla paljon enemmän mainintoja kuin Suomi. Ruotsi mainitaan tieteestä, kuningaskunnista ja maailmanpolitiikasta kertovissa kirjoissa. (lisää…)

Haalistunut muste, Googlen aarre

Torstai, Syyskuu 17th, 2009

Uskotko, että haalistuneella painomusteella on arvoa Googlelle? Kyllä on.

Google ilmoitti ostavansa reCAPTCHAn, joka tekee spämmiä estävää tunnistussysteemiä. Siinä käyttäjän pitää tunnistaa ja kirjoittaa ruudulla näkyvä epäselvä sana tai numerosarja päästäkseen eteenpäin netissä. (lisää…)

HS in English