NVIDIA представила ИИ, который превращает текст в видео / Все новости / Главная

Новый искусственный интеллект от NVIDIA превращает тестовое описание в готовое сгенерированное видео.

Система представлена на конференции IEEE по компьютерному зрению и распознаванию образов 2023. Сначала ИИ генерирует набор изображений по заданному тексту, а затем вводит дополнительный шаг, на котором пытается эти картинки анимировать. В процессе он использует опыт, полученный после изучения тысяч существующих видео.

Система была протестирована на видеоматериалах низкого качества, снятых видеорегистратором. Оказалось, что ИИ может генерировать несколько минут реалистичного видео подобного типа с разрешением 512x1024.

Впрочем, ИИ может работать и с более высоким разрешением. Так, команда смогла создавать образцы видео с разрешением 1280x2048 из текстовых подсказок. Каждое видео содержит 113 кадров и воспроизводится со скоростью 24 кадра в секунду, поэтому они длятся менее 5 секунд.

Безусловно, качество сгенерированных видео все еще выдает в них подделку, но это все равно впечатляющий результат. Инженеры NVIDIA намерены продолжать работу над системой. Насколько можно судить, они не планируют выкатывать на рынок потребительский продукт, по крайней мере, в ближайшее время.

 

Похожие новости
Комментарии

comments powered by Disqus
Мы в социальных сетях: