Искусственный интеллект научился превращать плоские картинки в трехмерные объекты

11 декабря 2019, 13:50 5398

Компания NVIDIA представила искусственный интеллект, который может создать подробную 3D модель объекта, основываясь на единственном плоском изображении.

Система, получившая название “дифференцированное средство визуализации на основе интерполяции” (DIB-R), является первым ИИ в истории, который умеет производить подобные действия, причем делает это менее чем за 100 миллисекунд. По мнению разработчиков, скорость очень важна, ведь она делает систему идеальным кандидатом для использования в “мозгах” автономной робототехники.

Согласно описанию алгоритма в блоге NVIDIA, тренировка DIB-R на создание моделей определенного типа занимает около двух дней. Например, после обучения системы на фотографиях птиц, ИИ научился создавать трехмерные модели по фото знакомых ему видов. На данный момент качество моделей не отличается высокой детализированностью, но система практически безошибочно определяет трехмерные габариты и объем объекта.

По словам разработчиков, автономные машины могут использовать DIB-R для улучшения восприятия глубины. Проще говоря, им будет намного легче ориентироваться в пространстве и распознавать различные объекты на пути.

Для человека DIB-R тоже может быть полезна, ведь она позволяет мгновенно создавать 3D-модели среды, запечатленной на простых фотографиях.

“Представьте, что вы можете просто сделать фото, и на выходе получить целую 3D-сцену, которую можно будет рассматривать с разных ракурсов. Старые фотографии из своей коллекции вы можете превратить в трехмерное пространство и при помощи устройства виртуальной реальности перенестись в это пространство лично”, - поясняют разработчики.

Подробное описание новой технологии опубликовано в статье на Github.