Искусственный интеллект в десятки раз улучшает четкость портретных фото / Все новости / Главная

Исследователи Университета Дьюка (Северная Каролина, США) разработали искусственный интеллект PULSE, который может умеет превращать размытые, неузнаваемые изображения лиц людей в невероятно детализированные портреты. Раньше такое можно было увидеть только в плохом шпионском кино.

Существующие алгоритмы позволяют масштабировать изображение лица примерно в восемь раз относительно его исходного разрешения. PULSE повышает четкость в 64 раза. ИИ может выдать четкое изображение буквально из нескольких пикселей. При этом он просто “додумывает”, как могут выглядеть мелкие особенности, вроде тонких морщин, ресниц и волос, которых нет на исходном кадре. 

“Никогда раньше на основе некачественных изображений не генерировались фотографии в высоком разрешении с таким количеством мелких деталей”, - говорит Синтия Рудин, ведущий автор проекта.

Важно отметить, что PULSE не может быть использован для идентификации людей. Даже самый мощный ИИ не может превратить расфокусированную фотографию с камеры наблюдения в точное изображение реального человека. Скорее, алгоритм генерирует новые лица на основе крайне ограниченной информации.

Вот, например, как PULSE обработал фотографии своих создателей:

Верхний ряд - оригинальные портреты. Средний ряд - портреты с сильно ухудшенным качеством. Нижний ряд - результат работы искусственного интеллекта. Как видите, портреты PULSE ощутимо отличаются от оригинальных снимков. Но даже такой результат впечатляет. Ведь алгоритм может работать не только с портретами.

Фотографии лиц были взяты разработчиками лишь для демонстрации концепции. На деле же, после должного переобучения PULSE сможет улучшать качество любых снимков. Например, скан небольшой пейзажной фотографии он сможет превратить в гигантские детализированные фотообои. Технология может найти применение в медицине, микроскопии и астрономии. 

Как это работает?

Традиционные алгоритмы для повышения качества фото пытаются дорисовывать изображения попиксельно. Они попросту “угадывают”, какие дополнительные пиксели необходимо вставить в фото на основании соседних точек. Такой подход хорошо восстанавливает общую форму объекта, но плохо работает с мелкими деталями. Например, на портретах часто теряются или размываются волосы

Команда Университета Дьюка придумала другой подход. Вместо того, чтобы восстанавливать изображение попиксельно, система сразу генерирует лица в высоким разрешении, а затем ухудшает результат собственной работы, пытаясь добиться его точного соответствия с низкокачественным исходником. 

В основе такой разработки лежит инструмент, известный как “генеративная состязательная сеть” (GAN). В состав GAN входят две нейросети, обученные на одном наборе данных фотографий. Одна сеть придумывает человеческие лица, другая - ухудшает их и сравнивает ухудшенный результат с оригиналом. Если картинки не совпадают, первая сеть повторяет попытку. И так - до тех пор, пока вторая сеть не сообщит о точном совпадении. В динамике это выглядит так:

PULSE может преобразовать 16x16-пиксельное изображение лица в фотографию с разрешением 1024 x 1024 за несколько секунд. При этом к изображению добавляется более миллиона пикселей.

Подробнее с разработкой можно познакомиться на официальной странице проекта PULSE на сайте Университета Дьюка.

 

 

Если хотите получать новости через мессенджер, подписывайтесь на новый Telegram-канал iGate

 

Похожие новости
Комментарии

comments powered by Disqus
Мы в социальных сетях: