Искусственный интеллект преодолел очередную символическую планку: в новом масштабном исследовании он показал результаты выше, чем средний человек, в признанном психологическом тесте на креативность. В эксперименте приняли участие около 100 тысяч человек — и именно на их фоне современные генеративные модели ИИ выглядели впечатляюще. Но, как это часто бывает, за сухими цифрами скрывается куда более сложная и интересная картина.

Исследование провела команда Университета Монреаля под руководством профессора психологии Карима Джерби. Учёные поставили перед собой амбициозную задачу: сравнить креативные способности людей и больших языковых моделей (LLM) — таких как ChatGPT, Claude и Gemini — используя один и тот же инструментарий. По словам авторов, это крупнейшее в истории сравнительное исследование подобного рода.
Как измерить неизмеримое?
Креативность обычно считают субъективным качеством — чем-то, что трудно загнать в рамки формул и баллов. Тем не менее психологи давно пытаются подойти к этому вопросу системно. В данном случае исследователи использовали тест дивергентных ассоциаций (Divergent Association Task, DAT), предназначенный для оценки одного из аспектов творческого мышления.
Суть DAT проста: за четыре минуты участнику нужно придумать десять слов. Чем менее связаны эти слова друг с другом по смыслу, тем выше считается уровень так называемой дивергентной креативности — способности выходить за привычные ассоциативные рамки. То же задание предложили и ИИ-моделям.
«Мы разработали строгую методологию, которая позволяет сравнивать человеческую и машинную креативность с помощью одних и тех же инструментов, опираясь на данные более чем 100 тысяч участников», — объясняет Карим Джерби.
Кто оказался креативнее?
Результаты оказались неоднозначными. В среднем большие языковые модели действительно набрали более высокие баллы, чем среднестатистический участник-человек. Однако примерно половина людей превзошла ИИ, а самые креативные 10% участников показали результаты, значительно превосходящие возможности машин.
Иными словами, да — некоторые люди уступили, скажем, Claude в тесте на дивергентное мышление. Но огромное число других — нет. Это наглядно показывает, насколько сложно даже самым продвинутым алгоритмам воспроизвести работу человеческого мозга, несмотря на то, что они обучались на колоссальных массивах текстов практически на всех языках мира.
Важно и другое: сами авторы подчёркивают ограниченность такого подхода. Измерять человеческую креативность количественно — задача заведомо непростая, а любые выводы неизбежно зависят от выбранных метрик и условий эксперимента.
Тексты, стихи и сюжеты
Помимо DAT, исследователи изучили, как ИИ и люди справляются с более привычными творческими задачами: написанием хайку, синопсисов фильмов и коротких рассказов. Картина повторилась: в среднем модели выглядели сильнее обычных участников, но самые талантливые авторы снова уверенно обошли машины.
Любопытная деталь — максимальную «креативность» ИИ демонстрировал тогда, когда его хорошо направляли люди. Грамотные подсказки, контекст и уточнения заметно повышали качество результата. Это ещё один аргумент против идеи скорой «замены» человека: без участия и воображения автора ИИ пока работает значительно слабее.
Не соревнование, а инструмент
Авторы исследования призывают не воспринимать результаты как очередной раунд в борьбе «человек против машины». По мнению Джерби, такой подход лишь создаёт иллюзию соперничества.
«Даже если ИИ достигает человеческого уровня креативности в отдельных тестах, нам нужно уйти от этого вводящего в заблуждение ощущения конкуренции, — отмечает он. — Генеративный ИИ прежде всего стал мощным инструментом на службе человеческого творчества. Он не заменит создателей, но радикально изменит то, как они придумывают, исследуют и создают — если, конечно, решат им пользоваться».
На этом фоне неслучайно растёт и общественная дискуссия вокруг «AI-slop» — потоков бездушного контента, а также использования ИИ в обход интересов художников и писателей. Недавно около 800 представителей творческих профессий объединились в кампанию против распространения AI-контента в ряде креативных сфер.
Работа канадских учёных показывает не только текущие возможности ИИ, но и уязвимость самих бенчмарков. Числовые оценки креативности плохо подходят для прямых сравнений и уж точно не исчерпывают богатство человеческих способностей.
«Сопоставляя возможности людей и машин напрямую, такие исследования заставляют нас заново задуматься о том, что мы вообще называем креативностью», — подытоживает Джерби.
Исследование опубликовано в научном журнале Scientific Reports — и, похоже, дискуссия о границах машинного творчества только начинается.
