Исследовательское подразделение Microsoft объявило о достижении высочайшей точности в распознавании человеческой речи компьютерными системами. Специалистам компании удалось продемонстрировать в метрике Word Error Rate впечатляющий результат в 6,3%. Этот показатель отображает долю неверно опознанных системой слов. Для сравнения, в прошлом году Google объявила о достижении 8%, а в 2013 году данный показатель составлял целых 23%. Увеличение качества распознавания речи играет одну из ключевых ролей в совершенствовании голосовых помощников, таких как, например, Cortana, Siri или Google Assistant.
Глава исследовательской группы Microsoft Speech & Dialog Джеффри Цвейг отмечает, что столь низкий процент ошибок достигнут благодаря освоению новых алгоритмов обучения. Важным шагом вперед является прорыв в параллельном обучении на графических процессорах.
Информация предоставлена по материалам mspoweruser
Комментарии