Блог DFCenter

Нырнуть в омут памяти

Суды иногда принимают в качестве доказательств весьма интересные вещи. Арбитражные и СИП уж точно. Например, автоматически сделанные зарубежным непонятно кому принадлежащим сайтом скриншоты других сайтов. И эти скриншоты показывают, как выглядел это другой сайт в прошлом. Месяц, год или даже десять лет тому назад. И суды мало того, что принимают такие доказательства, так еще и делают на их основе какие-то выводы, выносят решения по существу спора. Это что вообще такое?

Это самое «такое» называется Wayback Machine. Он же интернет-архив, архив Интернета, веб-архив и так далее. Это такой сервис, который более двадцати лет назад создали члены некоммерческой организацией Internet Archive. Создали, чтобы сохранить наследие этого самого Интернета, который постоянно меняется и уже никто и не помнит, с чего все начиналось. А это, как ни крути, целая эпоха в жизни человечества. Такое нужно сохранить для потомков. Вот Wayback Machine это и делает. И надо сказать насохранялось там уже под 1 триллион копий страниц разных сайтов.

Как все это работает? Wayback Machine – это по сути своей умная копировально-сохраняльная машинка. Она беспрерывно ходит по интернету и делает копии (скриншоты, но не совсем) популярных на данный момент времени сайтов. И сохраняет эти копии в свою «базу данных», снабдив метками даты и времени сохранения.

Чтобы понять, какой сайт популярный, то есть ценный для потомков, а какой не очень, используются данные из анализа трафика посещения сайтов. Например, достаточно известный рейтинг Alexa Rank – это такая статистическая система построения рейтингов сайтов, учитывающая количество посетителей и количество просмотров страниц. Для каждого сайта численное выражение рейтинга в Alexa Rank выражает уровень популярности сайта. Чем выше в этих списках находится сайт, тем чаще Wayback Machine создает копии такого сайта. Таким образом, наиболее популярные сайты архивируются веб-архивом ежедневно. Сайты, имеющие небольшую аудиторию, могут иметь только одну копию в веб-архиве, либо вообще не попасть в него.

Более того, Wayback Machine ничего (кроме файла robot.txt) не мешает не просто наделать «картинок» сайта, но и создать его достаточно приближенную к реальности «модель». Для элементов, доступных на оригинальной странице по внешним ссылкам (изображений, скриптов, таблиц стилей, загружаемых файлов), WM скорее всего дополнительно создаст отдельные страницы. И если перейти по таким ссылкам, можно увидеть копии этих элементов, сделанные в ближайшую дату к дате создания копии основной страницы. То есть ту самую «модель» сайта, причем не в вакууме, а на плюс-минус конкретную дату.

А в чем, собственно, вот этого всего польза кому-то кроме интернет-энтузиастов и их потомков интернет-археологов (да, есть и такие)?

Дело в том, что эта свойство Wayback Machine, а также то, что этот сервис изначально некоммерческий и вроде как не заинтересован в подтасовке сохраненных данных (а даже если бы и бы заинтересован – все продублировано в нескольких местах, так что непросто будет это сделать) сделал его реальным инструментом для осмотра сайтов «в прошлом». Как еще доказать, что конкретная страница год назад или даже целый сайт, которого уже нет, выглядели определенным образом? Вот Wayback Machine тут и придет на выручку. Полезная вещь в руках юристов. Особенно при условии, что и суды о WB знают и принципы работы его в целом понимают. И принимают результаты этой работы в качестве доказательств. А посему и вам этим пользоваться при случае рекомендуем.