E-mail рассылка

Сегодня
Вчера
18.09.2017
10.03.2017, 12:38 639

Почти 7 лет компания Apple приобрела стартап, разработавший «умный» голосовой ассистент Siri, который за годы своего существования прошел значительный путь эволюционирования и сейчас способен общаться с пользователем на двух десятках языках. В недавнем интервью Reuters Алекс Асеро, курирующий обучение Siri новым языкам, рассказал, из каких этапов состоит процесс приобщения цифрового ассистента к новому языку.

Асеро работает над проектом с 2013 года и в настоящее время возглавляет команду разработчсиков, обучающих Siri новым языкам. Основной сложностью его работы является прежде всего распознавание речи. Ранее для этого использовался алгоритм от Nuance, однако в дальнейшем «яблочная» компания перешла на собственную разработку, в снове котрой лежит машинное обучение, улучшающее систему с каждым новым запросом.

На первом этапе обучения Apple собирает группу носителей языка для зачитывания отрывков текста и длинных списков слов с разным акцентом. Человеческая речь записывается и транскрибируется другими людьми. Это формирует широкое представление о том, как могут звучать слова. Именно эти данные вводятся в алгоритмическую модель машинной подготовки. Система пытается предсказать транскрипцию произвольных строк слов для лучшего распознавания будущего текста, инженеры вносит корректировки, и со временем работа алгоритмов улучшается.

Однако прежде чем начать использовать новыя язык в Siri, компания делает его доступным в функции «Диктовка» на macOS и iOS, а также в клавиатуре для iPhone. Apple собирает анонимные данные о часто встречающихся речевых оборотах, а также учит систему распознавать слова на фоне помех, шума, кашля, чтобы улучшить процесс понимания слов в сложных условиях. Как рассказал Асеро, такая своеобразная репетиция позволяет уменьшить число ошибок практически вдвое. Доступ Siri к новому языку открывают только тогда, когда инженеры решат, что ассистент набрался достаточно опыта для самостоятельной работы. Перед запуском специально отобранные люди записывают несколько фраз-заготовок, а также ответы на часто задаваемые вопросы, включая «Siri, расскажи анекдот». Ответы же на вопросы в духе «Найди ресторан поблизости» формируются динамически в зависимости от условий. Каждые две недели компания обновляет базу вопросов с готовыми ответами. К сожалению, на данный момент ни Siri, ни другие цифровые ассистенты не умеют формулировать ответы автономно и нуждаются в доступе к облачным базам данных.

9to5mac

Комментарии