Техногиганты без разрешения используют видео с YouTube для обучения ИИ / Все новости / Главная

Известные компании, такие как Apple и Nvidia, использовали текстовые расшифровки видеороликов тысяч авторов YouTube для обучения искусственного интеллекта без их согласия и компенсации. Расследование Proof News выявило, что эти компании, наряду с Anthropic, Salesforce и другими, применяли материалы с YouTube-каналов для тренировки своих моделей ИИ.

Такая практика напрямую нарушает условия использования YouTube, запрещающие сбор данных с платформы без разрешения. Однако подобные действия, к сожалению, не являются чем-то новым. Ранее похожие обвинения выдвигались против Google, OpenAI и Meta.

Данные, названные "YouTube Subtitles" (Субтитры YouTube), являются частью более крупного набора под названием "The Pile" (Куча). Он включает в себя транскрипты с 173 536 видеороликов с более чем 48 000 каналов, охватывающих образовательный контент (Khan Academy, MIT, Harvard), материалы СМИ (The Wall Street Journal, NPR, BBC) и развлекательные шоу ("The Late Show With Stephen Colbert"). В базе данных присутствует контент даже от популярных YouTube-авторов, таких как MrBeast, Jacksepticeye и PewDiePie.

Обеспокоенность этичностью подобных действий выражают как авторы YouTube-каналов, так и эксперты. Дэвид Пакман, ведущий шоу "The David Pakman Show", обнаружил в базе данных почти 160 своих видеороликов. Он считает использование его материалов без разрешения кражей, ведь создание контента требует значительных усилий и ресурсов.

Существуют опасения, что с развитием генеративного ИИ творческая индустрия может понести ущерб, а отдельные авторы – быть вытеснены. Ситуацию усугубляет тот факт, что крупные компании вроде Associated Press заключают выгодные сделки с разработчиками ИИ, в то время как работы менее известных авторов используются без их ведома.

Пока законодательство отстает от технологического прогресса. Однако в США, после ряда скандалов с технологией deepfake, был предложен законопроект "COPIED Act", направленный на борьбу со злоупотреблениями в сфере ИИ. В числе прочего, законопроект призван обеспечить прозрачность и положить конец несанкционированному сбору интеллектуальной собственности в Сети.

 

Похожие новости
Комментарии

comments powered by Disqus
Мы в социальных сетях: