Paljonko tästä päivästä puhutaan

Hakukoneella voi nopeasti muodostaa mitä mielenkiintoisempia tilastoja. Halusin tietää, montako hakutulosta löytyy tämän päivän päivämäärällä viimeisen sadan vuoden ajalta. Hakukonetestailuni onkin jatkoa eiliselle hakukonevertailulle, jossa tutkailin eri hakukoneiden hakutulosten määrää yhdellä ja samalla hakusanalla. Tällä kertaa käytin hakukoneena Googlen englanninkielistä palvelua ja hakusanana kuluvan päivän päivämäärää. Annoin päivämäärän lainausmerkeissä ja laskevassa järjestyksessä eli ensin vuoden, sitten kuukauden ja lopuksi päivän numeron. Lainausmerkkejä on hyvä käyttää, jotta hakukone etsisi tarkalleen haluttua päivämäärää eikä vain sen osia. Esimerkiksi tämän päivän päivämäärää etsin hakusanalla "2008-05-08". Toistin hakua jokaiselle vuodelle tästä taaksepäin aina vuoteen 1900 asti. Hakutulokset olivat mielenkiintoisia.

Tulosten määrään vaikuttavat monet tekijät. Tekemäni pienen tilaston perusteella 2000-luvulla olisi kirjoitettu lähes 200-kertainen määrä aineistoa verrattuna 1900-luvun eri vuosiin. Tämän valtavan eron voi selittää sillä, että Internetistä on muodostunut yhä tärkeämpi kommunikointikanava ja sitä myöten myös julkaisujen määrä on kasvanut räjähdysmäisesti. Sata vuotta sitten pääasiallisin vastaava julkaisuformaatti oli sanomalehti. Näitä juttuja ei netistä löydy samalla tavalla lukemattomia määriä kuin nykyaikanamme. Osittain tulosten määrää selittää myös tapahtumien eli juttujen aiheiden määrä maailmalla. Globalisaatio on tuonut uutiset kaikista maailman kolkista olohuoneisiimme toisin kuin 1900-luvulla, jolloin monet uutiset olivat paikallisia.

Laskin eri vuosikymmenten hakutulosten keskiarvon. Keskiarvoista näkee, miten tiedon määrä kasvaa eri vuosikymmeninä. Melko tarkalleen sata vuotta sitten eli vuosina 1900-1909 hakutulosten määrä on keskimäärin 3600 löydöstä. Määrä nousee noin tuhannella vuosikymmenestä toiseen ja on 1970-luvulla jo keskimäärin 11 500 löydöstä. Tästä eteenpäin informaation määrä alkaa kasvaa huomattavasti nopeammin. Seuraavalla vuosikymmenellä eli 1980-luvulla hakutuloksia löytyy keskimäärin 37 000 kappaletta. Tultaessa lähemmäksi Internetin aikakautta löytyy 1990-luvulla 129 000 hakutulosta eli noin 3,5-kertainen määrä kymmenen vuotta aikaisempaan tilanteeseen. Tässä vaiheessa tulosten määrä on lähes 35-kertainen 1900-luvun ensimmäisiin vuosikymmeniin verrattuna.

Oheinen viivadiagrammi näyttää, miten hakutulosten määrä kasvaa eksponentiaalisesti alun hiljaiselon jälkeen. Viime vuosisadan ensimmäiset vuosikymmenet eivät ole olleet puheenaiheena tai ainakaan uutisia ei ole netissä samassa suhteessa kuin 2000-luvulla. Diagrammi kertoo selkeästi myös, miten sananvapaus on vapautunut Internetin avulla. Löydösten määrä alkaa selvästi kasvaa 1990-luvulla ja 2000-luvulla määrä on kasvanut silmiinpistävästi. Yksittäisiä vuosia tarkasteltaessa tilastosta löytyy muutamia merkkipaaluja. Vuonna 1918 hakutulosten määrä hakusanalla "1918-05-08" kohoaa yllättäen lähes nelinkertaiseksi lähivuosikymmeniin verrattuna. Kyseisenä vuonna löytyy 17 600 löydöstä samalla kun ympäröivien 18 vuoden keskiarvo on 4400 tulosta. Mitä tapahtui keväällä 1918?

Keskimääräinen hakutulosten määrä eri vuosikymmeninä 1900-2008

Vastaavanlainen hyppäys löytyy vuodelta 1940, jolloin tulosten määrä nousee 12 600 löydökseen hakusanalla "1940-05-08". Viidentoista vuoden keskiarvo molemmilla puolilla on 5900 tulosta eli kyseisenä vuonna löytyy kaksinkertainen määrä tuloksia. Entä mitä tapahtui keväällä 1940? Yllättävän hiljaista on vuonna 1976, koska hakutulosten määrä hakusanalla "1976-05-08" on vain 709. Samanlaisia vuosia ovat 1970, jolloin tuloksia löytyy 776 ja vuonna 1967 löydöksiä on 567 kappaletta. Keskiarvo vuodesta 1960 vuoteen 1979 on 9900 hakutulosta, joten nämä hiljaiset vuodet ovat 14 kertaa vaisumpia kuin ympäröivät vuodet.

Hakukoneilla voi siis laatia jännittäviä tilastoja. Tämä pieni tilastoni saattaa sisältää hyödytöntä tietoa, mutta kertoo omalla tavallaan netin kehityksestä. Tuloksia pitää tietysti osata myös tulkita oikein. Pieniin tulosmääriin löytynee luonnollisia selityksiä samoin kuin suuriin hyppäyksiin. Esimerkiksi syitä kevään 1918 ja 1940 yllätysnousuihin voi yrittää etsiä vaikkapa englanninkielisiltä historiasivuilta. Loppupäätelmänä voisi esittää, että netti on saanut tärkeän aseman ihmiskunnassa. Siitä on muodostunut tärkeä kommunikointiväline ja sananvapauden ilmaisualusta.

Julkaistu torstaina 8.5.2008 klo 18:57 avainsanalla Internet.

Edellinen
Hakutulosvertailua
Seuraava
Perjantaipulma 19/2008