Интернет страдает амнезией. Ежедневно в виртуальном пространстве появляется полтора миллиона новых сайтов, а за неделю исчезает 15 тысяч. Авторы и владельцы потеряли к ним интерес и перестали платить за их поддержание. По оценкам экспертов, средняя продолжительность жизни сайта составляет 75 дней. Если даже на другой странице вы найдете ссылку на этот документ, найти его самого не удастся - ссылка устарела. Компьютер отвечает: нет такого адреса.
В середине 90-х годов прошлого века один из пионеров Интернета американец Брюстер Кале решил сохранить память Всемирной сети и основал "архив Интернета". И сейчас, набрав на компьютере адрес www.waybackmachine.org, можно попасть в этот своеобразный музей. На экране появляется приглашение набрать адрес пропавшего сайта, и можно найти несколько копий за разные этапы его существования. Правда, и здесь найдется не все, что по разным причинам пропало из Интернета. И дело не только в том, что команда Кале, состоящая из тридцати человек, не успевает проследить за всеми изменениями в Сети. Авторы некоторых сайтов не хотят, чтобы их скончавшееся естественной смертью детище кто-то возвращал к жизни. В таких случаях по требованию первоначального владельца Кале удаляет сайт из своего хранилища. Кроме того, для доступа к некоторым страницам требуется заплатить или надо знать пароль.
Всего в архиве сейчас свыше десяти миллиардов страниц, которые могли бы оказаться безвозвратно утерянными. Объем архива - свыше ста терабайт (сто терабайт - это единица с 14 нулями, а по размеру - 1000 экземпляров Британской энциклопедии). Если перенести всю эту информацию на компакт-диски, она заняла бы около полутора миллионов дисков. Созданная самим Кале поисковая машина постоянно обшаривает Сеть в поисках новинок. Накопленную информацию обновляют примерно каждые два месяца, заново перенося на несколько больших серверов. С каждым обновлением объем данных увеличивается примерно на 12 терабайт. Уже сейчас это самая большая база данных в мире. Расходы на ее поддержание составляют несколько миллионов долларов в год. Деньги поступают от спонсоров, самый крупный из которых - сетевой книжный магазин "Амазон".
Задумано, что раз в десять лет вся информация будет переписываться в новом формате, так как операционные системы развиваются быстро. "Мы можем сегодня читать книги, напечатанные Гутенбергом, - говорит Кале, - но уже не способны прочесть дискету, записанную 15 лет назад".
Организатора архива беспокоит то, что в Интернет все чаще выставляют видеозаписи, а это такой объем информации, хранить который даже на нескольких больших серверах не представляется возможным.