AfterDawn logo

Tarjolla 17 000 DVD-levyllistä Internet-historiaa

Teemu Laitila Teemu Laitila
3 kommenttia

Nimensä mukaisesti nettisivuja jälkipolville tallentava Internet Archive tarjoaa erityisesti tutkijoiden käyttöön yhteensä 80 teratavun kokoisen paketin nettisivuja sisältöineen. Järjestö kertoo olevansa kiinnostunut selvittämään, millaisia koosteita ulkopuoliset tutkijat saisivat aineistosta rakennettua.

Internet Archive tarjoaa kiinnostuneiden käyttöön vuodelta 2011 olevan paketin, joka on kerätty maaliskuusta joulukuuhun ulottuvalla ajanjaksolla. Palvelun algoritmit tallensivat yhteensä huimat 2,7 miljardia sivua ja kaiken niiden tallennettavissa olevan sisällön mukaanlukien kuvat sekä videot. Hakurobotit vierailivat 2,2 miljardissa eri yksittäisessä URL-osoitteessa.

Kaikkiaan 80 teratavun kokoinen paketti täyttäisi DVD-levyille poltettuna 17 000 levyä. Pienellä laskutoimituksella yksittäisen sivun kooksi saadaan keskimäärin 31 kilotavua.


Koko paketti ei kuitenkaan ole avoimesti ladattavissa, sillä järjestöstä kerrotaan, että edes siellä ei olla varmoja onko paketin julkinen levittäminen hyvä asia. Tutkimuksesta kiinnostuneita pyydetään kuitenkin olemaan yhteydessä.

3 KOMMENTTIA

jorgga1/3

Vihdoin ja viimein ratkesi lodetin ongelma, ainakin osittain. http://keskustelu.afterdawn.com/thread_view.cfm/698197

ProfaneX2/3

Lainaus, alkuperäisen viestin kirjoitti jorgga:

Vihdoin ja viimein ratkesi lodetin ongelma, ainakin osittain. http://keskustelu.afterdawn.com/thread_view.cfm/698197

Tuli sama mieleen :D

teme5653/3

Yhtä hauskaa oli "varotella", ku joku joskus kyseli jotain neuvoa, miten saada joku tietty sivusto talteen webreaperilla tms. lataussoftalla, että kato tarkkaan ettei vaan imaise vahingossa koko internettiä koneelle.

On kyllä tuolta archivesta joskus ihan kiva katsella, miltä joku sivu näytti 2000-luvun alkupuolella.

TÄMÄN UUTISEN KOMMENTOINTI ON PÄÄTTYNYT