Шумоподавляющие наушники идеально подходят для изоляции от внешнего шума - будь то громкие разговоры или хаотичные звуки города. Но что если существуют определенные звуки, которые пользователь все-таки хочет слышать? С этим может помочь экспериментальная технология "семантического слуха", над которой в настоящее время работают ученые из Университета Вашингтона.
Как это работает?
Технология включает в себя алгоритмы глубокого обучения, работающие на смартфоне, к которому подключены к наушникам с системой шумоподавления.
Звук окружающей среды передаются с микрофонов наушников в приложение на телефоне, где они цифровым образом фильтруются. Большая часть звуков блокируется, но пользователь все еще может слышать определенные звуки по собственному выбору. И наоборот, система может блокировать конкретные нежелательные звуки, пропуская все остальные. В настоящее время доступно 20 типов звуков, которые можно разрешить или заблокировать.
Чтобы система работала, наушники обязательно должны быть беспроводным путем подключены к смартфону, так как именно на нем обрабатываются соответствующие алгоритмы. Электроника в самих наушниках недостаточно мощная для этого, а подключение к облачному серверу работает недостаточно быстро.
"Понимание того, как звучит птица, и выделение ее голоса из общего фонового шума требует от искусственного интеллекта работы в режиме реального времени. Современные шумоподавляющие наушники еще не имеют таких возможностей. Проблема заключается в том, что звуки, которые слышат пользователи наушников, должны синхронизироваться с их зрительными ощущениями. Вы не можете слышать чей-то голос через две секунды после того, как он обратился к вам. Это означает, что нейроалгоритмы должны обрабатывать звуки менее чем за сотую долю секунды”, - говорит профессор Шьям Голлакота, старший автор исследования.
Испытания, проведенные на 22 добровольцах в парках, на улицах и в офисах показали, что система семантического слуха успешно выделяет целевые звуки, такие как щебет птиц, сигналы тревог и гудки машин. Однако еще нужна дополнительная работа, поскольку технологии трудно различать схожие звуки, такие как человеческая речь и пение.