Искусственный интеллект может подделать не только ваш голос, но и манеру речи / Все новости / Главная

Одна из главных проблем, связанных с компьютерным синтезом речи, заключается в том, что результат всегда ощущается немного “неживым”. Как бы хорошо компьютер не копировал голос человека, он не может повторить интонации, паузы, ударения. В общем, мелкие детали, которые делают речь по-настоящему живой и уникальной, неподвластны машине. По крайней мере, так было еще пару дней назад. Но теперь искусственный интеллект способен и на это.

Инженеры ИИ-лаборатории Facebook создали алгоритм, способный клонировать не только голос, но и манеру речи человека. Система получила название MelNet. На днях ее возможности были продемонстрированы с использованием образцов голоса Билла Гейтса и других знаменитостей.

Основное отличие новой системы от предшественников заключается в материалах, которые были использованы для обучения ИИ. Другие исследователи тренируют свои алгоритмы, скармливая им человеческий голос, представленный в форме волны. Инженеры Facebook пошли иным путем и решили тренировать свой ИИ, используя спектрограммы. По словам разработчиков, такой формат данных содержит больше информации и позволяет синтезировать речь более точно.

Результаты работы просто поражают. Вы можете самостоятельно прослушать образцы, доступные по ссылке и убедиться, что “синтезированный” Билл Гейтс звучит не менее правдоподобно, чем настоящий.

Но хотя новая система намного совершеннее предшественников, она все еще не идеальна. Проблема заключается в интонациях. Когда человек говорит долго, он меняет интонацию и скорость речи в зависимости от ее содержания. На это искусственный интеллект пока не способен. Он может может достоверно синтезировать короткие фразы и копировать произношение конкретного человека. Но во время длинных монологов начинает проскальзывать фальшь. Чтобы исправить это, необходимо, чтобы машина буквально понимала, о чем говорит. Впрочем, вероятно, скоро будет найдено решение и этой проблемы.

Похожие новости
Комментарии

comments powered by Disqus
Мы в социальных сетях: