Wayback Machine

Article

July 5, 2022

Wayback Machine — це цифровий архів Всесвітньої павутини, заснований некомерційною організацією Internet Archive у Сан-Франциско, Каліфорнія. Створений у 1996 році та запущений у 2001 році, він дозволяє користувачеві повернутися «в минуле» та побачити, як веб-сайти виглядали в минулому. Його засновники, Брюстер Кале та Брюс Гілліат, розробили Wayback Machine, щоб забезпечити «універсальний доступ до всіх знань», зберігаючи архівні копії неіснуючих веб-сторінок. Запущена 10 травня 1996 року Wayback Machine мала понад 38,2 мільйона записів. 2009 року. У червні 2022 року машина зберегла понад 698 мільярдів веб-сторінок. Щодня додається більше мільйона веб-сторінок. У 1996 році Брюстер Кале, засновник Інтернет-архіву, і Брюс Гілліат, аспірант Массачусетського технологічного інституту (MIT), розробили Wayback Machine як інструмент для створення універсально доступної цифрової бібліотеки, підтримуючи місію Інтернет-архіву універсальний доступ до всіх знань.

Історія

Wayback Machine почала архівувати кешовані веб-сторінки в 1996 році. Одну з перших відомих сторінок було збережено 10 травня 1996 року о 14:42. Засновники Internet Archive Брюстер Кале та Брюс Гілліат запустили Wayback Machine у ​​Сан-Франциско, штат Каліфорнія, у жовтні 2001 року. , насамперед для вирішення проблеми зникнення веб-вмісту, коли він змінюється або коли веб-сайт закривається. Сервіс дозволяє користувачам переглядати заархівовані версії веб-сторінок у часі, які в архіві називають «тривимірним індексом». Кале та Гілліят створили машину, сподіваючись заархівувати весь Інтернет і забезпечити «універсальний доступ до всіх знань». Назва «Wayback Machine» є відсиланням до вигаданого пристрою для подорожей у часі та трансляції, «Wayback Machine», який використовувався персонажами містера Пібоді та Шермана в мультфільмі «Пригоди Роккі, Булвінкла та друзів». В одному з сегментів мультфільму, «Неймовірна історія Пібоді», герої використовували машину, щоб стати свідками, брати участь і часто змінювати відомі події в історії. З 1996 по 2001 рік інформація зберігалася на цифровій стрічці, а Кале час від часу дозволяла дослідникам і вченим підключатися до «незграбної» бази даних. Коли в 2001 році архіву виповнилося п’ять років, його було відкрито та відкрито для публіки на церемонії в Каліфорнійському університеті Берклі. На момент запуску Wayback Machine вона вже містила понад 10 мільярдів архівних сторінок. Дані зберігаються у великому кластері вузлів Linux Internet Archive. Час від часу він переглядає та архівує нові версії веб-сайтів (див. технічні відомості нижче). Сайти також можна захопити вручну, ввівши URL-адресу веб-сайту у вікно пошуку, за умови, що веб-сайт дозволяє Wayback Machine «сканувати» його та зберігати дані. 30 жовтня 2020 року Wayback Machine почала перевірку фактів вмісту. Станом на січень 2022 року домени рекламних серверів вимкнено для захоплення. До 25-ї річниці Інтернет-архіву Wayback Machine представила «Wayforward Machine», яка дозволила користувачам «подорожувати в Інтернет у 2046 році, де знання знаходяться в облозі».

Технічна інформація

Було розроблено програмне забезпечення для «сканування» Інтернету та завантаження всієї загальнодоступної інформації та файлів даних на веб-сторінках, ієрархії Gopher, системі дошок оголошень Netnews (Usenet) і програмному забезпеченні, яке можна завантажити. Інформація, зібрана цими «сканерами», не включає всю інформацію, доступну в Інтернеті, оскільки велика частина даних обмежена видавцем або зберігається в базах даних, до яких немає доступу. Щоб подолати невідповідності на частково кешованих веб-сайтах, Archive-It.org був розроблений у 2005 році Internet Archive як засіб, що дозволяє установам і творцям вмісту добровільно збирати та зберігати колекції цифрового вмісту, а також створювати цифрові архіви. джерела, деякі імпортовані від третіх сторін, а інші створені всередині Архіву. Наприклад,