Google совместно с исследователями из Технологического института Джорджии и организации Wild Dolphin Project (WDP) разрабатывает уникальную систему для расшифровки и понимания звуков, которые издают дельфины. Основой этой инициативы стал новый языковой ИИ-модель DolphinGemma, способная интерпретировать различные звуки морских млекопитающих — от свистов и щелчков до резких всплесков и «вскриков».
Проект опирается на более чем 40-летнюю базу данных WDP, где тщательно фиксировались акустические сигналы дельфинов и их поведение. Например, дельфины используют уникальные "подписные" свисты — своего рода имена — для поиска друг друга. Щелчки часто сопровождают ухаживание или взаимодействие с хищниками, а бурные пульсирующие звуки можно услышать в моменты конфликта.
Модель DolphinGemma, построенная на архитектуре искусственного интеллекта Google Gemma, была обучена на этих аудиозаписях и полевых заметках. Интересно, что исследователи используют для записи звуков дельфинов обычные смартфоны Pixel. Эти устройства обрабатывают сигналы с помощью технологии SoundStream, преобразуя их в формат, пригодный для анализа моделью прямо на месте.
Google подчеркивает, что 400-миллионная модель DolphinGemma оптимизирована для работы прямо на смартфонах Pixel, что делает проект более мобильным и экономичным, снижая затраты на дорогостоящее оборудование.
Алгоритмы DolphinGemma работают по принципу других крупных языковых моделей: анализируют последовательности звуков, выявляют закономерности и предсказывают возможные продолжения "фраз" дельфинов.
Отдельное направление проекта — система CHAT (Cetacean Hearing Augmentation Telemetry), разработанная совместно с Georgia Tech. Она использует смартфоны Pixel 6 для воспроизведения синтетических свистов, которые связываются с определёнными предметами, вызывающими интерес у дельфинов — например, саргассом, морской травой или разноцветными шарфами. Учёные надеются, что дельфины начнут повторять эти сигналы, чтобы "запросить" нужный объект.
Конечная цель — наладить элементарное двустороннее общение между человеком и дельфином. Уже летом 2025 года команда планирует использовать обновлённую версию системы CHAT на базе нового Pixel 9.
DolphinGemma и CHAT работают в тандеме: модель помогает заранее распознать возможные имитации звуков со стороны дельфинов, ускоряя реакцию исследователей и делая взаимодействие с животными более естественным и последовательным.