Wayback-maskin

Article

July 4, 2022

Wayback Machine är ett digitalt arkiv av World Wide Web grundat av Internet Archive, en ideell organisation baserad i San Francisco, Kalifornien. Skapad 1996 och lanserades för allmänheten 2001, låter den användaren gå "bakåt i tiden" och se hur webbplatser såg ut förr. Dess grundare, Brewster Kahle och Bruce Gilliat, utvecklade Wayback Machine för att ge "universell tillgång till all kunskap" genom att bevara arkiverade kopior av nedlagda webbsidor. Wayback Machine, som lanserades den 10 maj 1996, hade mer än 38,2 miljoner poster vid slutet av 2009. I juni 2022 har maskinen sparat mer än 698 miljarder webbsidor. Mer än en miljon webbsidor läggs till dagligen. 1996 utvecklade Brewster Kahle, grundare av Internet Archive, och Bruce Gilliat, en doktorand vid Massachusetts Institute of Technology (MIT), Wayback Machine som ett verktyg för att skapa ett universellt tillgängligt digitalt bibliotek, vilket stöder Internet Archives uppdrag att universell tillgång till all kunskap.

Historik

Wayback Machine började arkivera cachade webbsidor 1996. En av de tidigast kända sidorna sparades den 10 maj 1996 klockan 14:42. Internetarkivets grundare Brewster Kahle och Bruce Gilliat lanserade Wayback Machine i San Francisco, Kalifornien, i oktober 2001 , främst för att ta itu med problemet med att webbinnehåll försvinner när det ändras eller när en webbplats stängs. Tjänsten gör det möjligt för användare att se arkiverade versioner av webbsidor över tid, vilket arkivet kallar ett "tredimensionellt index". Kahle och Gilliat skapade maskinen i hopp om att arkivera hela Internet och ge "universell tillgång till all kunskap". Namnet "Wayback Machine" är en referens till en fiktiv tidsresande och översättningsenhet, "Wayback Machine", som används av karaktärerna Mister Peabody och Sherman i den tecknade filmen The Adventures of Rocky och Bullwinkle and Friends. I ett av seriernas avsnitt, "Peabody's Improbable History", använde karaktärerna maskinen för att bevittna, delta i och ofta förändra kända händelser i historien. Från 1996 till 2001 förvarades informationen på digitala band, och Kahle lät ibland forskare och forskare ta del av den "klumpiga" databasen. När arkivet nådde femårsjubileum 2001, avtäcktes det och öppnades för allmänheten vid en ceremoni vid University of California, Berkeley. När Wayback Machine lanserades innehöll den redan över 10 miljarder arkiverade sidor. Datan lagras på Internet Archives stora kluster av Linux-noder. Den återbesöker och arkiverar nya versioner av webbplatser ibland (se tekniska detaljer nedan). Webbplatser kan också fångas upp manuellt genom att ange en webbadress i sökrutan, förutsatt att webbplatsen tillåter Wayback Machine att "crawla" den och spara data. Den 30 oktober 2020 började Wayback Machine faktakontrollera innehåll. Från och med januari 2022 är domäner för annonsservrar inaktiverade från att fångas. För Internet Archives 25-årsjubileum introducerade Wayback Machine "Wayforward Machine" som gjorde det möjligt för användare att "resa till Internet 2046, där kunskapen är under belägring".

Teknisk information

Programvara har utvecklats för att "crawla" webben och ladda ner all allmänt tillgänglig information och datafiler på webbsidor, Gopher-hierarkin, Netnews (Usenet) anslagstavla och nedladdningsbar programvara. Informationen som samlas in av dessa "sökrobotar" inkluderar inte all information som finns tillgänglig på Internet, eftersom mycket av informationen är begränsad av utgivaren eller lagras i databaser som inte är tillgängliga. För att övervinna inkonsekvenser i delvis cachade webbplatser utvecklades Archive-It.org 2005 av Internet Archive som ett sätt att tillåta institutioner och innehållsskapare att frivilligt skörda och bevara samlingar av digitalt innehåll och skapa digitala arkiv. Genomsökningar görs från olika källor, vissa importerade från tredje part och andra genererade internt av arkivet. Till exempel,