200 тысяч 3D-лиц: новый ИИ делает гуманоидных роботов почти неотличимыми от людей

8 марта 2026, 12:00 870

Гуманоидные роботы и виртуальные аватары стремительно приближаются к тому моменту, когда их будет трудно отличить от настоящих людей. За этим стоят не только улучшенные материалы и анимация, но и серьёзные достижения в области компьютерного зрения и искусственного интеллекта.

Новое исследование китайских учёных показывает, что ключ к реалистичности может скрываться в точном анализе геометрии человеческого лица. Команда разработала масштабную базу трёхмерных лиц и алгоритм, который способен находить ключевые точки лица прямо в 3D-данных — без использования двумерных изображений или шаблонных моделей.

Работу возглавили профессор Song Zhan из Shenzhen Institutes of Advanced Technology при Chinese Academy of Sciences и исследователь Ye Yuping из Fujian University of Technology.

Что такое 3D-ключевые точки лица

Чтобы робот или виртуальный персонаж выглядел естественно, ему нужно правильно воспроизводить мимику и распознавать лица людей. Для этого используются так называемые facial landmarks — ключевые точки лица.

К ним относятся, например:

уголки глаз
кончик носа
контуры губ
линии скул и подбородка

Когда эти точки точно определены в трёхмерном пространстве, система может корректно анимировать выражения лица, отслеживать эмоции или идентифицировать человека.

Однако большинство существующих технологий работают через двумерные изображения, а затем пытаются восстановить трёхмерную форму. Такой подход часто приводит к неточностям: текстуры могут быть искажены, а цифровые модели — отличаться от реальной анатомии.

Новый метод решает проблему иначе — он работает непосредственно с геометрией лица.

Огромная база реальных 3D-лиц

Чтобы обучить систему, исследователи сначала создали собственную установку для захвата трёхмерных данных лица.

В результате появилась база данных примерно из 200 тысяч высокоточных 3D-сканов лиц. Помимо этого, в неё вошли:

набор 3D-лиц с различными выражениями
стандартизированная база ключевых точек лица
высокоточная 3D-модель человеческого тела
динамический набор 4D-мимики (трёхмерная геометрия плюс движение во времени)

По сути, это один из крупнейших в мире структурированных наборов реальных биометрических 3D-данных. Проект был включён в региональную программу развития качественных датасетов для ИИ.

Как работает новая модель ИИ

Главная технологическая новинка — нейросеть CF-GAT (Curvature-Fused Graph Attention Network).

Вместо обычных изображений она анализирует облака точек (point cloud). Это набор координат в пространстве, которые описывают форму лица без текстур и цветов.

Алгоритм работает в несколько этапов:

Геометрическая выборка — система уменьшает количество точек, сохраняя важные изгибы поверхности лица.
Анализ кривизны — форма поверхности кодируется как геометрический признак.
Механизм внимания графовой сети — модель выделяет важные участки лица и отслеживает взаимосвязи между ними.

В результате нейросеть напрямую вычисляет координаты ключевых точек лица в 3D-пространстве, не опираясь на текстуры или заранее заданные шаблоны.

Точнее и устойчивее к шуму

Во время испытаний новая система показала несколько преимуществ по сравнению с традиционными методами:

более высокая точность определения ключевых точек
лучшая устойчивость к шумам и ошибкам сканирования
способность работать с разными формами лиц

Особенно заметно улучшилась точность для мелких деталей мимики — именно тех элементов, которые делают выражения лица естественными.

Где пригодится такая технология

Точная 3D-геометрия лица открывает множество практических применений. Среди них:

гуманоидные роботы с более реалистичной мимикой
биометрические системы распознавания личности
виртуальные аватары для метавселенных и игр
медицинские системы анализа лица
цифровые персонажи в кино и анимации

По мере того как андроиды начинают появляться в сфере услуг, медицине и развлечениях, именно такие технологии будут определять, насколько «живыми» они кажутся людям.

Результаты исследования опубликованы в научном журнале IEEE Transactions on Circuits and Systems for Video Technology.