Новая разработка учёных из Калифорнийского университета в Беркли и Сан-Франциско даёт надежду людям с тяжёлыми формами паралича на естественное общение. Исследователям удалось преодолеть ключевую проблему речевых нейропротезов — задержку в преобразовании сигналов мозга в речь.
Как это работает?
Технология использует искусственный интеллект для мгновенного декодирования активности двигательной коры — области мозга, отвечающей за речь. Сигналы преобразуются в звучащие слова практически в реальном времени.
«Наш подход обеспечивает такую же скорость декодирования речи, как у голосовых помощников вроде Alexa или Siri», — пояснил Гопала Ануманчипалли, соавтор исследования.
Чтобы научить ИИ распознавать намерения человека, участникам эксперимента предлагали беззвучно произносить фразы, например: «Привет, как дела?». Нейросеть анализировала паттерны мозговой активности и сопоставляла их с предполагаемой речью.
«Мы перехватываем сигналы на этапе, когда мысль уже сформирована, но ещё не превратилась в артикуляцию», — объяснил Чоль Джун Чо, один из авторов работы.
Для создания реалистичного голоса использовались старые аудиозаписи участников и технологии синтеза речи.
Почему это прорыв?
Ранее подобные интерфейсы работали с задержкой до 8 секунд. Новая система сокращает этот промежуток до 1 секунды, делая общение почти естественным.
«Теперь человек может говорить непрерывно, а устройство будет декодировать его речь без пауз», — отметил Ануманчипалли.
Чтобы убедиться, что ИИ не просто запоминает фразы, его протестировали на новых словах — например, из фонетического алфавита NATO. Результаты подтвердили, что система действительно учится распознавать базовые элементы речи.
Следующий шаг — добавление эмоциональной окраски в синтезированный голос. Технология открывает огромные возможности для людей, лишённых возможности говорить, позволяя им озвучивать мысли почти так же быстро, как при обычном разговоре.