Веб-архив – доказательство или нет?

Что такое веб-архив?

Интернет-архив, архив интернета, веб-архив — все это названия одного и того же сервиса «Wayback Machine» (https://archive.org). Сервис был создан в 1996 году калифорнийской некоммерческой организацией «Internet Archive» в целях создания цифровой библиотеки интернет-сайтов и других культурных артефактов в цифровом формате. Как сказано на сайте самой организации: «Подобно бумажной библиотеке, мы предоставляем бесплатный доступ исследователям, историкам, учёным, людям с ограниченными возможностями восприятия печатной информации и широкой публике. Наша миссия — обеспечить всеобщий доступ ко всем знаниям». С 2001 года сервис стал публично доступным. С этого момента объем сохраненных страниц в Архиве превысил 900 миллиардов.

Такая объемная база и глубина истории сохранений со временем заинтересовала не только исследователей истории интернета, но и профессионалов, которым такие данные нужны для проверки и подтверждения каких-либо фактов — журналистов и юристов. Интернет-архив стал все чаще упоминаться в судах, как источник доказательственной информации. В связи с чем все чаще стал возникать и вопрос о достоверности и допустимости такой информации в качестве доказательства. Для обоснованного ответа на него следует глубже разобраться как в общем принципе работы сервиса, так и в судебной практике.

Интернет-архив, а именно так в своих документах называют сервис его владельцы, в общем виде работает следующим образом: для создания копий интернет-страниц внутреннее программное обеспечение сервиса формирует списки целевых сайтов для сохранения. Важно отметить, что
интернет-архив сохраняет копии не всех имеющихся сайтов без ограничения, а только тех, которые подходят для реализации его миссии — сохранить ценные цифровые знания.

Определяющим критерием определения ценности в данном случае является популярность страницы, то есть ее посещаемость пользователями сети интернет. То есть если на сайт приходит много пользователей, для Интернет-архива это показатель того, что на сайте есть что-то «значимое» для таких пользователей и эта информация должна быть архивирована.

Для определения популярности используются общепринятые (в рамках интернет-сообщества) рейтинги, например, Alexa Rank (https://www.iseo.ru/glossary/alexa-rank). И чем выше место сайта в этом рейтинге — тем чаще происходит «архивирование» его страниц. То есть наиболее популярные сайты (страницы сайтов) архивируются ежедневно или даже чаще. Сайты, имеющие небольшое количество посещений, могут иметь только одну копию в архиве, либо вообще не попасть в него.

Вместе с тем, в том числе для таких «непопулярных» сайтов, есть возможность создания копии страницы «в ручном режиме», по запросу пользователя. Такая копия страницы ничем не отличается от созданной автоматически.

Какие технические особенности есть у веб-архива и почему они важны для юристов?

В работе Интернет-архива есть три важные особенности.

Во-первых, никто, кроме разработчиков и владельцев сервиса, не знает достоверно его технические характеристики. Какая-либо техническая документация на него отсутствует либо не раскрывается. Установить алгоритм сохранения копии, выбора целевых страниц и прочее можно только экспериментально.

Во-вторых, в процессе архивирования Интернет-архив создает страницы с адресами вида «https://web.archive.org/web/timestamp/address/…», где «timestamp» — закодированные дата и время создания копии, а «address» — полный адрес скопированной в веб-архив страницы. Например, копия сайта site-primer.ru, сделанная 23.04.2024 г. в 10:02 (GMT) будет доступна по адресу web.archive.org/web/20240423100232/https://site-primer.ru/.

Если на оригинальной странице были какие-то элементы, доступные по внешним ссылкам, например изображения или загружаемые файлы, то в Интернет-архиве создаются отдельные страницы. Причем это может произойти как в момент копирования основной страницы, так и после копирования. Например, если на сайте из примера — «site-primer.ru», был pdf-документ «Правила», который лежал на сервере, то Интернет-архив сделает на него отдельную ссылку web.archive.org/web/20240423100232/https://site-primer.ru:80/load/Pravila. Когда пользователь переходит по таким ссылкам, он перенаправляется к копиям, сделанным в ближайшую дату к дате создания копии основной страницы.

Это важно, например, в случаях необходимости найти и показать, какие были Правила на такую-то дату в прошлом. Иногда, особенно в случае спора с интернет-магазином, это бывает полезным.

Третья особенность заключается в том, что Интернет-архив имеет географически распределенную структуру. В связи с чем сетевой адрес, с которого Интернет-архив подключается к целевой странице, может быть разным. А это, в связи с адаптивностью многих современных сайтов, приводит к тому, что отдельные элементы отображения сайта могут зависеть не только от типа устройства и настоек системы пользователя, но и от его географического положения и массы других факторов. Поэтому есть вероятность, что сохраненные Интернет-архивом копии страниц не будут в деталях совпадать с имевшим когда-то место оригиналом. Однако это не касается основного информационного наполнения страницы — там все сохранится. Поэтому отличие в визуальном отображении не всегда является показателем недостоверности сохраненной копии.

Аргументы за и против доказательственной силы веб-архива

В российской юридической практике достаточно долго существует мнение, что данные из Интернет-архива и его аналогов (об этом более подробно ниже) могут использоваться в качестве доказательств. Это мнение продвигается как профессиональными юридическими изданиями, так и отчетливо прослеживается при анализе дел (постановление АС УО от 05.02.2024 № А71−19 002/2018, постановление АС МО от 17.02.2023 № А40−229 438/2019, решения АС г. Москвы от 27.07.2023 № А40−58 858/2023, А С Омской области от 13.12.2023 № А46−18 020/2023).

Вместе с тем существуют и противоположные. Так, в деле № А23−9402/2022 Суд по интеллектуальной собственности установил, что «достоверность данных Web.Archive.Org исследовалась судами первой и апелляционной инстанции, для чего суды изучили данные о работе названного ресурса, представленные Калужским филиалом федерального государственного бюджетного образовательного учреждения высшего образования «Московский государственный технический университет имении Н.Э. Баумана…», которым подтверждена недостоверность данного ресурса как единственного или основного источника информации о содержании сайтов». То есть сохраненная Интернет-архивом информация может использоваться и обладает какой-либо доказательственной силой только в совокупности с другими доказательствами, но не сама по себе.

Есть и другие аргументы, также юридические, но уже касающиеся правил самого сервиса. Так, в Правилах использования Интернет-архива в явном виде указывается, что «доступ к коллекциям Архива предоставляется вам бесплатно и только в научных и исследовательских целях» и «никакой другой доступ или использование Сайта, Коллекций или услуг Архива не разрешено», также «Архив не дает никаких гарантий или заявлений относительно точности, актуальности, полноты, надежности или полезности содержимого Коллекций…».

Кроме того актуальным риском являются неоднократные хакерские взломы инфраструктуры Интернет-архива. Информацию о реальном ущербе и проведенных по данным фактам расследованиях организация «Internet Archive» официально не раскрывала.

Таким образом, ссылаясь в обоснование своей позиции на доказательства, сформированный сервисом, сторона по делу по сути, во-первых, прямо выходит за пределы ограничений использования, установленных Правилами использования сервиса, который для этого не создавался. А во-вторых, использует информацию, в отношении которой сам ее обладатель (то есть сервис) не дает никаких гарантий в отношении ее полноты, достоверности и неизменности.

Какие бывают веб-архивы

Приведенная выше информация касается «оригинального» Интернет-архива — «Wayback Machine» (https://archive.org). Однако существуют и иные сервисы, как в России, так и зарубежом, решающие аналогичные задачи.

Наиболее известным в России аналогичным сервисом является «Веб-архив» (web-arhive.ru) от компании Webjustice. Его нередко путают с оригинальным Интернет-архивом, считая вплоть до российского представительства — функционал сервисов действительно схожий.

Веб-архив — это зарегистрированный в Роспатенте «Программный комплекс «Веб-архив.ру», который «предоставляет собой службу, назначением которой является формирование, обработка и передача запросов на предоставление информации о внешнем виде и содержании страниц в сети Интернет по состоянию на определенную дату в прошлом (архивные копии интернет-страниц) в международную организацию The Internet Archive, а также визуальное отображение полученных от нее архивных копий интернет-страниц в русскоязычном интерфейсе». То есть Веб-архив — это не совсем аналог Интернет-архива, а скорее инструмент более удобного взаимодействия с оригинальным Интернет-архивом. С одной стороны это удобно, но с другой — он перенимает и все ограничения и правовые риски, присущие «оригиналу».

Однако нельзя назвать Веб-архив лишь удобным интерфейсом доступа к Интернет-архиву. Дело в особенностях работы Веб-архива — он «ретранслирует» сведения с некоторыми ограничениями. Визуальное отображение страницы, сохраненной в оригинальном Интернет-архиве, Веб-архив покажет без изменений. Однако, судя по всему имеет ограничения на количество копий страниц в рамках одного дня (что было установлено экспериментально). Так, например, для страницы ya.ru за дату 10.03.2023 г. в оригинальном сервисе «Интернет-архив» доступно 64 копии. А сервис Веб-архив показывает только одну копию для этой конкретной даты и не позволяет выбрать иную копию в пределах этой даты. Это может стать важным ограничением, если контент на целевом сайте меняется быстрее, чем раз в день. Кроме того, не ретранслируются технические данные — например, изучение исходных текстов страниц, а также их служебных заголовков, возможно только при работе с оригинальным Интернет-архивом напрямую.