Google Gemini представляет модель DolphinGemma: новый инструмент для изучения сложных систем коммуникации дельфинов

С 1985 года исследователи из проекта Wild Dolphin Project (WDP), специализирующегося на изучении дельфинов, вместе с компанией Google стремятся сделать серьёзный шаг вперёд в понимании сложной системы свистов и щелчков, которые дельфины используют в общении. WDP применяет ненасильственные методы изучения социальной структуры атлантических пятнистых дельфинов, записывая видео и аудио их поведенческих особенностей и делая соответствующие заметки.

Основная задача WDP заключается в исследовании того, как дельфины используют свои вокализации и какое это оказывает влияние на их социальные взаимодействия. За десятилетия работы учёные смогли связать некоторые простые действия с определёнными звуковыми сигналами. Например, установлено, что у данных дельфинов имеются индивидуальные свисты, напоминающие имена, которые помогают им находить друг друга. Более того, данные млекопитающие во время конфликтных ситуаций издают специфические «квакающие» звуки.


Google Gemini представляет модель DolphinGemma: новый инструмент для изучения сложных систем коммуникации дельфинов
Фото: Wild Dolphin Project

Специалисты из WDP уверены, что разгадывание структуры и закономерностей дельфиньих звуковых сигналов является ключевым этапом в определении, можно ли считать эту форму общения языком. Основная цель — научиться «говорить на языке дельфинов», при наличии такового. Для этого WDP создали обширный и тщательно размеченный корпус данных, который компания Google считает идеальной основой для анализа с помощью генеративного искусственного интеллекта.

Для анализа дельфиньих вокализаций исследователи назначили модель DolphinGemma, базирующуюся на открытых AI-моделях Google Gemma и имеющей ту же основу, что и коммерческие модели Gemini. Эта модель использует технологию SoundStream от Google для токенизации дельфиньих звуков, так что они могут быть обработаны в их исходной записи.

Внутренние механизмы крупных языковых моделей (LLM) работают по принципу предсказания последовательностей. Они получают входной сигнал и многократно прогнозируют следующий элемент, пока не будет достигнут требуемый выходной результат. При качественном обучении этот результат звучит так, будто создан человеком. Google и WDP надеются достичь подобного эффекта с моделью DolphinGemma в изучении морских млекопитающих.

Использование AI в изучении дельфинов может стать значительным скачком вперёд в понимании их языка и социальной динамики. Через модель DolphinGemma учёные надеются добиться новых открытий в области коммуникации дельфинов и, возможно, приблизиться к расшифровке их «языка».

 

Источник: iXBT

Читайте также