Wayback-machine

Article

July 4, 2022

The Wayback Machine is een digitaal archief van het World Wide Web, opgericht door het Internet Archive, een non-profitorganisatie in San Francisco, Californië. Gemaakt in 1996 en gelanceerd voor het publiek in 2001, stelt het de gebruiker in staat om "terug in de tijd" te gaan en te zien hoe websites er in het verleden uitzagen. De oprichters, Brewster Kahle en Bruce Gilliat, ontwikkelden de Wayback Machine om "universele toegang tot alle kennis" te bieden door gearchiveerde kopieën van ter ziele gegane webpagina's te bewaren. De Wayback Machine, gelanceerd op 10 mei 1996, had aan het einde meer dan 38,2 miljoen records van 2009. In juni 2022 heeft de machine meer dan 698 miljard webpagina's opgeslagen. Dagelijks worden er meer dan een miljoen webpagina's toegevoegd. In 1996 ontwikkelden Brewster Kahle, oprichter van het internetarchief, en Bruce Gilliat, een afgestudeerde student aan het Massachusetts Institute of Technology (MIT), de Wayback-machine als een hulpmiddel voor het creëren van een universeel toegankelijke digitale bibliotheek, ter ondersteuning van de missie van het internetarchief van universele toegang tot alle kennis.

Geschiedenis

De Wayback Machine begon in 1996 met het archiveren van webpagina's in de cache. Een van de vroegst bekende pagina's werd opgeslagen op 10 mei 1996 om 14.42 uur. De oprichters van Internet Archive, Brewster Kahle en Bruce Gilliat, lanceerden de Wayback Machine in San Francisco, Californië, in oktober 2001 , voornamelijk om het probleem aan te pakken dat webinhoud verdwijnt wanneer deze wordt gewijzigd of wanneer een website wordt afgesloten. De service stelt gebruikers in staat om gearchiveerde versies van webpagina's in de loop van de tijd te bekijken, wat het archief een "driedimensionale index" noemt. Kahle en Gilliat creëerden de machine in de hoop het hele internet te archiveren en "universele toegang tot alle kennis" te bieden. De naam "Wayback Machine" is een verwijzing naar een fictief tijdreis- en vertaalapparaat, de "Wayback Machine", gebruikt door de personages Mister Peabody en Sherman in de tekenfilm The Adventures of Rocky en Bullwinkle and Friends. In een van de segmenten van de cartoon, "Peabody's Improbable History", gebruikten de personages de machine om getuige te zijn van, eraan deel te nemen en vaak beroemde gebeurtenissen in de geschiedenis te veranderen. Van 1996 tot 2001 werd de informatie op digitale tape bewaard, waarbij Kahle af en toe onderzoekers en wetenschappers toestond om gebruik te maken van de "onhandige" database. Toen het archief in 2001 zijn vijfde verjaardag bereikte, werd het onthuld en voor het publiek geopend tijdens een ceremonie aan de University of California, Berkeley. Tegen de tijd dat de Wayback Machine werd gelanceerd, bevatte deze al meer dan 10 miljard gearchiveerde pagina's. De gegevens worden opgeslagen op het grote cluster van Linux-knooppunten van het Internet Archive. Het bezoekt en archiveert af en toe nieuwe versies van websites (zie technische details hieronder). Sites kunnen ook handmatig worden vastgelegd door de URL van een website in het zoekvak in te voeren, op voorwaarde dat de website de Wayback Machine toestaat deze te "crawlen" en de gegevens op te slaan. Op 30 oktober 2020 begon de Wayback Machine met het controleren van de inhoud. Vanaf januari 2022 kunnen domeinen van advertentieservers niet meer worden vastgelegd. Ter gelegenheid van het 25-jarig jubileum van Internet Archive introduceerde de Wayback Machine de "Wayforward Machine", waarmee gebruikers "in 2046 naar internet konden reizen, waar kennis wordt belegerd".

Technische informatie

Er is software ontwikkeld om het web te "crawlen" en alle openbaar toegankelijke informatie- en gegevensbestanden op webpagina's, de Gopher-hiërarchie, het Netnews (Usenet) bulletin board-systeem en downloadbare software te downloaden. De informatie die door deze "crawlers" wordt verzameld, omvat niet alle informatie die op internet beschikbaar is, aangezien veel van de gegevens worden beperkt door de uitgever of worden opgeslagen in databases die niet toegankelijk zijn. Om inconsistenties in gedeeltelijk in de cache opgeslagen websites te verhelpen, werd Archive-It.org in 2005 ontwikkeld door het internetarchief als een middel om instellingen en makers van inhoud in staat te stellen vrijwillig collecties van digitale inhoud te verzamelen en te bewaren, en digitale archieven te creëren. bronnen, sommige geïmporteerd van derden en andere intern gegenereerd door het Archief. Bijvoorbeeld,