На прошлой неделе общественная организация Internet Archive и компания Alexa Internet презентовали интернет-сообществу поисковую машину Wayback Machine, которая позволяет путешествовать в прошлое Интернета и отыскивать сайты, которых уже не существует.
В качестве базы для поиска Wayback Machine использует не сам Интернет, а Архив Интернета, основанный в 1996 году Брюстером Кейлом в сотрудничестве с Библиотекой Конгресса США. Архив обновляется каждые два месяца (это чуть меньше, чем средний срок жизни страницы). Сейчас объем архива более 100 терабайт, и каждое обновление приносит по 12 терабайт. В архиве уже собрано более 10 миллиардов сайтов, созданных с 1996 по 2001 год.
Архив Интернета и его поисковая машина Wayback Machine уже используются специалистами самых разных профессий. Например, исследователи из Xerox PARC используют его для изучения истории развития пользовательских интерфейсов.
"В этом архиве собраны записи того, что в противном случае просто исчезает, - говорит Поль Грабович из Университета Калифорнии в Беркли. - Подобные исчезновения - одна из проблем Интернета".
По его словам, Wayback Machine очень полезна для журналистов, поскольку сохраняет "снимки" электронных газет так же, как микрофильмы сохраняют старые бумажные издания. Особенно это актуально в случае электронных изданий, которые не имеют собственного архива, как, например, знаменитый Drudge Report.
Правда, на момент написания данной заметки система Wayback Machine почему-то отказывалась демонстрировать сайты, заархивированные ранее сентября 2001 года. Да и российские ресурсы представлены в архиве очень выборочно.