Электронные библиотеки заполонили книги, сгенерированные искусственным интеллектом

6 февраля 2025, 15:30 456

Современные модели генеративного ИИ открывают широкие возможности для создания текстов, однако они также становятся инструментом в руках мошенников и недобросовестных «авторов». Эти технологии позволяют в неограниченном количестве генерировать связные тексты, что уже привело к засорению платформ, предоставляющих цифровые услуги публичным библиотекам.

Сегодня интернет наполняется автоматически созданным контентом, вытесняя живое взаимодействие пользователей. По данным представителей индустрии электронного книговыдачи, проблема низкокачественных текстов, сгенерированных ИИ, становится всё более актуальной для библиотек, финансируемых из государственных источников. Автоматические фильтры и человеческие модераторы сталкиваются с огромным объемом сомнительных публикаций, что усложняет задачу контроля качества.

Согласно отчету 404 Media, основными жертвами этой проблемы стали платформы OverDrive и Hoopla – ключевые сервисы, на которые опираются публичные библиотеки для управления электронными книгами. OverDrive позволяет библиотекам самостоятельно выбирать, какие книги предлагать читателям, тогда как Hoopla предоставляет доступ ко всему своему каталогу, не давая библиотекам возможности фильтровать контент.

Главная сложность работы Hoopla – массовое распространение так называемого «vendor slurry» – низкокачественного контента, заполнившего платформу. Еще до появления генеративного ИИ библиотеки и издательства боролись с наплывом книг сомнительного содержания, включая любительские пересказы популярных произведений. Однако теперь, благодаря инструментам вроде ChatGPT, поток бессмысленного автоматизированного контента достиг беспрецедентных масштабов.

Лука Бартломейчик, библиотекарь из Мемориальной библиотеки Эдит Уилер в Монро, Коннектикут, отмечает, что значительная часть каталога Hoopla представляет собой некачественные книги, не имеющие ценности для читателей. «Если заявляется, что на платформе 15 000 электронных книг, но 5 000 из них – это низкокачественные, сгенерированные ИИ или не прошедшие никакой редакторской проверки тексты, то что именно вы предлагаете библиотекам?» – задается вопросом Бартломейчик.

Одним из примеров компаний, использующих генеративный ИИ для массового создания контента, является IRB Media. Она заполнила каталог Hoopla сотнями книг, которые представляют собой автоматически сгенерированные пересказы популярных произведений. В результате пользователи, ищущие конкретную книгу, могут случайно скачать её бессмысленный пересказ, что приводит к напрасным расходам библиотек и разочаровывает читателей.

Читайте также: ИИ разработал белок, на эволюцию которого потребовалось бы 500 млн лет

Еще два года назад организации Library Futures и Library Freedom Project призвали OverDrive и Hoopla принять меры против распространения низкокачественного контента, включая книги, содержащие дезинформацию или разжигающие ненависть. Hoopla удалила часть подобных материалов, объяснив, что как автоматические алгоритмы, так и человеческие модераторы не смогли своевременно предотвратить их появление в каталоге.

Сегодня библиотекари, такие как Бартломейчик, требуют большей ответственности от цифровых платформ по распространению книг. Полное запрещение ИИ-контента никто не предлагает, но эксперты сходятся во мнении, что подобные материалы должны быть четко помечены, чтобы читатели понимали, что именно они скачивают.