ИИ обошёл человека в тесте Тьюринга: нейросети теперь кажутся человечнее нас / Все новости / Главная

Представьте, что вы общаетесь в чате одновременно с двумя собеседниками и должны угадать, кто из них настоящий человек. А теперь представьте, что в большинстве случаев вы ошибаетесь — и «человеком» оказывается искусственный интеллект. Именно такой результат получили учёные из Калифорнийского университета в Сан-Диего. Они провели первое в истории строгое экспериментальное исследование, которое показало: современные большие языковые модели уже проходят знаменитый тест Тьюринга, причём иногда даже убедительнее, чем реальные люди.

Работа, опубликованная в журнале Proceedings of the National Academy of Sciences, возвращает нас к 1950 году, когда Алан Тьюринг предложил свой знаменитый тест. Тогда вопрос звучал просто: сможет ли машина вести разговор так, чтобы человек не смог отличить её от другого человека? Сегодня ответ уже не «может», а «делает это лучше».

Как проходил эксперимент

Участники эксперимента (студенты UCSD и обычные люди из интернета) общались в специальном чате сразу с двумя собеседниками: одним реальным человеком и одной нейросетью. После пятиминутного (а в отдельном исследовании — пятнадцатиминутного) разговора нужно было решить, кто из них человек. Учёные тестировали четыре модели: самые современные GPT-4.5 и LLaMa-3.1-405B, а также старые GPT-4o и классический чат-бот ELIZA 1960-х годов для сравнения.

GPT-4.5 распознавали как человека в 73% случаев — то есть чаще, чем реального собеседника. LLaMa-3.1-405B набрала 56% — это статистически неотличимо от настоящих людей. Старые модели провалились с треском: их выбирали как человека всего в 21–23% случаев.

Почему ИИ побеждает

Ключевой секрет — не в огромных знаниях, а в умении копировать человеческие социальные черты. Нейросети с правильным «persona-промптом» (инструкцией на роль) начинали говорить с теми же интонациями, юмором, прямотой и даже ошибками, которые свойственны людям. Они не блистали эрудицией, а вели себя «по-человечески».

Без таких подсказок результат резко падал: GPT-4.5 — всего 36%, LLaMa — 38%. То есть модели умеют имитировать человека, но сами не всегда догадываются, как именно это делать.

Соавтор исследования Бен Берген (Ben Bergen) объясняет: раньше тест проверял, способен ли ИИ соперничать с человеческим интеллектом. Сегодня ИИ уже превосходит нас по скорости и точности знаний. Теперь тест измеряет нечто другое — то, насколько убедительно машина может притворяться человеком.

Результаты заставляют серьёзно задуматься о доверии в интернете. Когда ИИ может часами вести естественный разговор, отличить его от реального человека становится всё сложнее. Это открывает новые возможности для обмана: от мошенничества до манипуляции общественным мнением. Как отмечает ведущий автор Кэмерон Джонс (Cameron Jones), теперь «мы должны быть гораздо осторожнее, когда общаемся с незнакомцами онлайн».

 

Похожие новости
Комментарии

comments powered by Disqus
Мы в социальных сетях: