С момента появления генераторов изображений на основе искусственного интеллекта опасения по поводу их использования для распространения дезинформации стали одним из главных вопросов. Несмотря на то, что со временем пользователи начинают распознавать характерные черты ИИ-картинок, исследование Microsoft показало: даже опытные зрители всё ещё часто ошибаются.
По данным исследования, люди в среднем правильно отличают реальные фотографии от сгенерированных лишь в 63% случаев. Для сравнения, разрабатываемый Microsoft инструмент для обнаружения ИИ-изображений демонстрирует точность на уровне 95%.
Онлайн-тест
В рамках эксперимента Microsoft запустила интерактивный онлайн-тест realornotquiz.com, где пользователям предлагалось определить, какие из 15 случайных изображений являются настоящими, а какие — сгенерированы ИИ. Всего было проанализировано 287 000 изображений, просмотренных 12 500 участниками из разных стран.
Наилучшие результаты участники показали при распознавании портретов, созданных ИИ — в 65% случаев им удавалось выявить подделку. Тем не менее, наиболее убедительными оказались изображения, созданные с помощью нейросетей на базе GAN (Generative Adversarial Networks), особенно если они представляли только профиль лица или включали «инпейтинг» — добавление искусственных элементов в настоящие фотографии. Такие изображения обманули около 55% зрителей.
Исследователи объясняют это тем, что GAN-изображения часто имеют характерные дефекты, типичные для реальных снимков, например, низкое качество или «шум». В результате такие изображения кажутся более правдоподобными.
Стиль и эстетика: глянцевость выдает фейк
Популярность генераторов изображений сделала зрителей более восприимчивыми к их визуальному стилю — слишком гладкая, «стерильная» картинка всё чаще вызывает подозрения. Некоторые пользователи отмечают, что при создании более реалистичных фейков помогает включение в запросы к ИИ таких элементов, как обычные имена файлов изображений или попытки имитировать повседневную фотографию.
Согласно исследованию, сгенерированные системой Flux Pro изображения, имитирующие снимки на смартфон, воспринимались как более достоверные. Однако большая часть ИИ-картинок по-прежнему выглядит слишком «профессионально» и неубедительно в контексте спонтанных кадров.
Сложнее всего участникам было отличить ИИ-сгенерированные изображения пейзажей и городов, особенно если на них не было людей. Например, два изображения, которые обманули наибольшее число пользователей (лишь 21% и 23% узнали в них фейк), были созданы с помощью настоящих фотографий в качестве ориентировочной композиции. Такие изображения имели схожий уровень шума, яркости и энтропии, как и настоящие фотографии.
Наиболее удивительные результаты показали три настоящих снимка, которые участники ошибочно приняли за подделки. Их идентифицировали как реальные лишь 12%, 14% и 18% участников соответственно. Все три изображали военных США в необычных условиях — с нестандартным освещением, цветами и параметрами съемки.
В Microsoft подчеркивают, что понимание того, какие запросы и визуальные приемы наиболее убедительно обманывают зрителей, может быть использовано для создания более эффективной дезинформации в будущем. Исследование напоминает о необходимости четкой маркировки изображений, созданных с помощью ИИ, чтобы предотвратить массовое заблуждение.