200 тысяч 3D-лиц: новый ИИ делает гуманоидных роботов почти неотличимыми от людей / Все новости / Главная

Гуманоидные роботы и виртуальные аватары стремительно приближаются к тому моменту, когда их будет трудно отличить от настоящих людей. За этим стоят не только улучшенные материалы и анимация, но и серьёзные достижения в области компьютерного зрения и искусственного интеллекта.

Новое исследование китайских учёных показывает, что ключ к реалистичности может скрываться в точном анализе геометрии человеческого лица. Команда разработала масштабную базу трёхмерных лиц и алгоритм, который способен находить ключевые точки лица прямо в 3D-данных — без использования двумерных изображений или шаблонных моделей.

Работу возглавили профессор Song Zhan из Shenzhen Institutes of Advanced Technology при Chinese Academy of Sciences и исследователь Ye Yuping из Fujian University of Technology.

Что такое 3D-ключевые точки лица

Чтобы робот или виртуальный персонаж выглядел естественно, ему нужно правильно воспроизводить мимику и распознавать лица людей. Для этого используются так называемые facial landmarks — ключевые точки лица.

К ним относятся, например:

  • уголки глаз
  • кончик носа
  • контуры губ
  • линии скул и подбородка

Когда эти точки точно определены в трёхмерном пространстве, система может корректно анимировать выражения лица, отслеживать эмоции или идентифицировать человека.

Однако большинство существующих технологий работают через двумерные изображения, а затем пытаются восстановить трёхмерную форму. Такой подход часто приводит к неточностям: текстуры могут быть искажены, а цифровые модели — отличаться от реальной анатомии.

Новый метод решает проблему иначе — он работает непосредственно с геометрией лица.

Огромная база реальных 3D-лиц

Чтобы обучить систему, исследователи сначала создали собственную установку для захвата трёхмерных данных лица.

В результате появилась база данных примерно из 200 тысяч высокоточных 3D-сканов лиц. Помимо этого, в неё вошли:

  • набор 3D-лиц с различными выражениями
  • стандартизированная база ключевых точек лица
  • высокоточная 3D-модель человеческого тела
  • динамический набор 4D-мимики (трёхмерная геометрия плюс движение во времени)

По сути, это один из крупнейших в мире структурированных наборов реальных биометрических 3D-данных. Проект был включён в региональную программу развития качественных датасетов для ИИ.

Как работает новая модель ИИ

Главная технологическая новинка — нейросеть CF-GAT (Curvature-Fused Graph Attention Network).

Вместо обычных изображений она анализирует облака точек (point cloud). Это набор координат в пространстве, которые описывают форму лица без текстур и цветов.

Алгоритм работает в несколько этапов:

  1. Геометрическая выборка — система уменьшает количество точек, сохраняя важные изгибы поверхности лица.
  2. Анализ кривизны — форма поверхности кодируется как геометрический признак.
  3. Механизм внимания графовой сети — модель выделяет важные участки лица и отслеживает взаимосвязи между ними.

В результате нейросеть напрямую вычисляет координаты ключевых точек лица в 3D-пространстве, не опираясь на текстуры или заранее заданные шаблоны.

Точнее и устойчивее к шуму

Во время испытаний новая система показала несколько преимуществ по сравнению с традиционными методами:

  • более высокая точность определения ключевых точек
  • лучшая устойчивость к шумам и ошибкам сканирования
  • способность работать с разными формами лиц

Особенно заметно улучшилась точность для мелких деталей мимики — именно тех элементов, которые делают выражения лица естественными.

Где пригодится такая технология

Точная 3D-геометрия лица открывает множество практических применений. Среди них:

  • гуманоидные роботы с более реалистичной мимикой
  • биометрические системы распознавания личности
  • виртуальные аватары для метавселенных и игр
  • медицинские системы анализа лица
  • цифровые персонажи в кино и анимации

По мере того как андроиды начинают появляться в сфере услуг, медицине и развлечениях, именно такие технологии будут определять, насколько «живыми» они кажутся людям.

Результаты исследования опубликованы в научном журнале IEEE Transactions on Circuits and Systems for Video Technology.

 

Похожие новости
Комментарии

comments powered by Disqus
Мы в социальных сетях: