Пока компании, разрабатывающие генеративный искусственный интеллект, лихорадочно ищут «чистые» и надежные данные для обучения своих моделей, одно из старейших учреждений интернета quietly меняет правила игры. Фонд Wikimedia, управляющий Wikipedia, подтвердил заключение платных соглашений с крупными игроками ИИ-рынка — среди них Amazon, Meta, Microsoft, Mistral AI и Perplexity.

Речь идет о формализации платного доступа к огромному массиву структурированных данных энциклопедии. Тому самому контенту, который десятилетиями был открытым ресурсом и одновременно лакомым куском для автоматических веб-сканеров. Финансовые условия сделок не раскрываются, но сам факт означает поворотный момент: Wikipedia начинает дополнять модель, основанную на пожертвованиях, коммерческими партнерствами с разработчиками больших языковых моделей.
Почему Wikipedia меняет подход
Формально все выглядит прагматично. По словам представителей фонда, новые контракты позволяют компаниям получать доступ к данным Wikipedia в масштабах и на скоростях, соответствующих их техническим потребностям. Но за этим стоит более глубокая причина — резко возросшая нагрузка на инфраструктуру.
Автоматический сбор данных для обучения ИИ, часто маскирующийся под обычный пользовательский трафик, за последние годы заметно усилился. В результате серверы Wikipedia испытывают все больший стресс, даже несмотря на то, что число живых читателей за прошлый год сократилось примерно на 8%.
А масштаб у проекта колоссальный: более 65 миллионов статей на почти 300 языках, поддерживаемых усилиями около 250 тысяч волонтеров. Исполнительный директор Wikimedia Foundation Марьяна Искандер в интервью Associated Press прямо заявила: поддержка такой инфраструктуры стоит дорого.
Проще говоря, открытые знания — не бесплатны в обслуживании. Серверы, каналы передачи данных и системы доступа требуют постоянных вложений, особенно когда основными потребителями информации становятся не люди, а машины.
Платный доступ вместо ограничений
В отличие от издателей и медиакомпаний, которые подают иски против ИИ-разработчиков за несанкционированное использование данных, Wikimedia выбрала другой путь. Вместо того чтобы закрывать доступ или ужесточать лицензии, фонд делает ставку на сотрудничество и компенсацию.
Логика проста: Wikipedia исторически стала центральным элементом ИИ-экосистемы именно благодаря своей открытости. Но чтобы эта открытость сохранялась, ей нужна финансовая поддержка — особенно со стороны тех, кто извлекает из нее коммерческую выгоду.
Основатель Wikipedia Джимми Уэйлс поддерживает такой подход. Он подчеркивает, что модели ИИ выигрывают от обучения на материалах, прошедших человеческую редактуру: с проверкой источников, фильтрацией дезинформации и соблюдением стандартов качества. А значит, справедливо, чтобы компании «скидывались» на издержки, которые сами же и создают.
Как Wikipedia использует ИИ сама
Интересно, что Wikimedia не ограничивается ролью «поставщика данных». Фонд активно изучает собственные сценарии применения искусственного интеллекта. По словам Уэйлса, речь идет не о замене редакторов, а об автоматизации рутинных задач: поиске битых ссылок, предложениях по замене источников и анализе контекста статей.
В более долгосрочной перспективе Wikipedia может превратить поиск по сайту в своего рода разговорный интерфейс — систему, которая будет отвечать на вопросы пользователей, напрямую цитируя проверенные фрагменты энциклопедии. Что-то вроде ИИ-ассистента, но с опорой на верифицированный текст, а не вероятностные догадки.
Критика, споры и конкуренты
За 25 лет существования Wikipedia пережила немало конфликтов — от редакционных войн до обвинений в идеологической предвзятости. Критика звучит и сегодня, в том числе со стороны некоторых американских политиков и технологических фигур вроде Илона Маска. Уэйлс, впрочем, считает подобные обвинения неизбежными в условиях поляризованного интернета.
Любопытно, что Маск продвигает собственный проект — Grokipedia, визуально напоминающий Wikipedia, но основанный на больших языковых моделях. По мнению Уэйлса, такие системы пока не способны сравниться с «живой» энциклопедией по точности и глубине редакторской проработки.
Несмотря на новые контракты, Wikimedia подчеркивает: речь не идет об отказе от первоначальных идеалов. Некоммерческая организация по-прежнему получает основную часть доходов от примерно восьми миллионов индивидуальных доноров. Однако в мире, где главными потребителями знаний становятся алгоритмы, появление корпоративных клиентов выглядит логичным шагом.
Wikipedia остается одним из десяти самых посещаемых сайтов планеты — и одновременно зеркалом того, как меняется интернет. Ее новая экономическая модель отражает простой факт: эпоха, когда крупнейшие базы знаний обслуживали ИИ бесплатно и без ограничений, подходит к концу.
