Компания Google совместно с исследовательским проектом Wild Dolphin Project (WDP) представила инновационную технологию, направленную на расшифровку звуковых сигналов, издаваемых дельфинами. Новая модель искусственного интеллекта, получившая название DolphinGemma, использует возможности больших языковых моделей (LLM), аналогичных тем, что применяются в системах, подобных ChatGPT.
Сотрудничество Google и Wild Dolphin Project
Wild Dolphin Project занимается изучением дельфинов с 1985 года, собирая обширный архив аудио- и видеозаписей поведения атлантических пятнистых дельфинов. Эти данные включают различные звуковые сигналы, такие как свисты, щелчки и другие вокализации, которые дельфины используют для общения. Исследователи WDP связывают определённые звуки с конкретными действиями или состояниями животных, что позволяет предположить наличие у дельфинов сложной системы коммуникации.
В рамках сотрудничества с Google, специалисты WDP предоставили свои данные для обучения модели DolphinGemma. Эта модель, основанная на технологии SoundStream, анализирует звуковые сигналы дельфинов, преобразуя их в токены, которые затем обрабатываются с помощью LLM. Такой подход позволяет не только распознавать уже зафиксированные звуки, но и предсказывать возможные последующие сигналы, что открывает новые возможности для понимания коммуникации дельфинов.
Технология DolphinGemma: принципы работы и возможности
Модель DolphinGemma функционирует по принципу предсказания последовательности звуковых сигналов. Получив аудиосигнал, система анализирует его и предсказывает, какой звук может последовать далее, основываясь на обучении на большом объёме данных. Это позволяет создавать своего рода "словарь" дельфиньих звуков, связывая их с определёнными действиями или объектами.
Для реализации проекта использовались модифицированные смартфоны Google Pixel, оснащённые специальными устройствами для записи подводных звуков. Такая настройка позволяет исследователям собирать данные в реальном времени, что значительно упрощает процесс анализа и делает его более доступным.
Потенциал и перспективы применения технологии
Ожидается, что использование модели DolphinGemma приведёт к созданию более точного и обширного "словаря" дельфиньих звуков, что позволит глубже понять их поведение и социальные взаимодействия. Это, в свою очередь, может способствовать улучшению условий содержания дельфинов в неволе, а также более эффективному их защите в естественной среде обитания.
Кроме того, успешное применение данной технологии может открыть новые горизонты в области межвидовой коммуникации, предоставив людям уникальную возможность "общаться" с дельфинами. Это также поднимет вопросы этики использования таких технологий и их воздействия на животных.
Заключение
Разработка модели DolphinGemma является значительным шагом вперёд в области изучения коммуникации дельфинов. Сотрудничество между Google и Wild Dolphin Project демонстрирует, как современные технологии могут быть использованы для решения сложных научных задач. Ожидается, что дальнейшее развитие этой технологии приведёт к новым открытиям в области зоологии, лингвистики и искусственного интеллекта.