Современные роботы уже могут довольно точно предсказывать, чем закончится та или иная ситуация — упадёт ли ребёнок с полной кружкой кофе или справится ли гуманоид с прыжком между блоками. Однако, когда дело доходит до чтения эмоций людей, наблюдающих за этими событиями, искусственный интеллект терпит сокрушительное поражение.

Исследователи из Корнелльского университета провели эксперимент с несколькими передовыми моделями зрения и языка (Vision Language Models). Им показывали короткие видео напряжённых ситуаций и просили предсказать, чем всё закончится — хорошо или плохо. Лучшие модели справлялись с задачей на уровне 63–70%, что сопоставимо или даже немного лучше, чем средний человек.
Затем учёные убрали само действие и оставили только реакции людей на эти события — их мимику и выражения лиц. Здесь точность моделей резко упала до 44,5–53,8%. Некоторые ИИ вообще давали один и тот же ответ на все видео, независимо от того, что показывали лица.
«Мы постоянно испускаем социальные сигналы, взаимодействуя с миром, — говорит Мария Тереза Паррейра (Maria Teresa Parreira), аспирантка и ведущий автор исследования. — Для робота, который работает в общем пространстве с людьми, умение считывать эту информацию критически важно».
Почему роботы не понимают лица
По словам старшего автора исследования, профессора Венди Джу (Wendy Ju), люди очень чувствительны к реакциям окружающих. Это позволяет нам предугадывать события, о которых мы сами ещё не знаем. Исследователи пытаются передать эту способность и роботам.
Проблема в том, что современные модели хорошо справляются с анализом самого действия, но почти не умеют интерпретировать эмоциональные сигналы человека. Это серьёзный пробел в так называемом «предвосхищающем социальном интеллекте» — навыке, без которого полноценное взаимодействие робота с людьми в реальной среде крайне затруднено.
Исследование было представлено на конференции ACM/IEEE International Conference on Human-Robot Interaction в Эдинбурге в марте 2026 года.
Что это значит для будущего
Учёные подчёркивают: роботов нужно разрабатывать и тестировать вместе с людьми, а не доводить до «идеального» состояния в лаборатории. Только в реальном взаимодействии можно понять, какие ошибки они допускают и как на них реагируют окружающие.
«Роботы могут учиться на работе», — говорит Венди Джу. По её мнению, раннее внедрение в реальные условия помогает быстрее адаптировать системы и делать их по-настоящему полезными.
Исследователи планируют продолжить работу над тем, почему модели плохо справляются с чтением лиц, и можно ли улучшить их результаты с помощью специальных подсказок. В конечном итоге такие навыки станут ключевыми для роботов, которые будут работать бок о бок с людьми — от помощников в домах до коллег на производстве.
