Бытует миф, что информация, которая попадает в интернет, остается там навсегда. Увы, это не так. За последние десять лет каждая третья веб-страница безвозвратно исчезла из сети.
Исследование Pew Research Center показало, что за 10 лет (с 2013 по 2023 год) 38% веб-страниц перестали быть доступными. Более того, четверть страниц, существовавших в тот же период, исчезли к октябрю 2023 года. Чаще всего это связано с удалением отдельных страниц на по-прежнему работающих сайтах, реже – с отключением целых доменов.
Тревожная тенденция касается не только старого контента. По данным Pew Research, около 8% страниц, существовавших в 2023 году, уже недоступны в 2024.
Глубже изучив ситуацию, исследователи обнаружили, что битые ссылки присутствуют на 23% новостных сайтов, 21% правительственных сайтов и даже на 54% изученных статей в Wikipedia (в разделе "Ссылки").
“Вымирание” соцсетей
Социальные сети также подвержены цифровым потерям. Исследование выборочных твитов (с платформы X, на тот момент известной как Twitter) весной 2023 года показало, что через несколько месяцев каждая пятая запись стала недоступна. В 60% случаев аккаунт, изначально опубликовавший контент, становился закрытым, приостанавливался или вовсе удалялся.
Кроме того, вероятность исчезновения записи со временем выше для публикаций на определенных языках. Так, более 40% постов на арабском и турецком языках пропали в течение трех месяцев после публикации.
Существуют некоммерческие организации, занимающиеся архивированием веб-контента (например, Internet Archive), однако им часто не хватает средств, а рост платного контента сильно затрудняет их работу.
Что с этим делать?
Интернет создает иллюзию того, что информация в нем вечна, но это не так. Потому, если вы нашли что-то по-настоящему интересное и ценное для вас, сохраните это в личный архив. Жесткие диски большого объема сегодня стоят не так дорого, так что каждый может позволить себе иметь небольшую базу данных.