谷歌AI助解码海豚音 开启(人类)对话契机

在4月14日「全美海豚日」当天,Google宣布一项结合人工智慧(AI)与长期生态研究的创新计划「DolphinGemma」,正逐步揭开海豚语言的奥秘,并朝著人类与海洋哺乳动物沟通的目标迈进。

谷歌AI助解码海豚音 开启(人类)对话契机

此计划由Google、乔治亚理工学院(Georgia Tech)与野生海豚计划(Wild Dolphin Project, WDP)合作进行。WDP自1985年起即在巴哈马进行全球最长期的水下海豚研究,累积大量录音与影像资料,并详细标注每只大西洋斑点海豚的身分、行为与声音,例如母海豚用「招牌哨音」呼唤幼崽,打斗时出现「爆发音」,求偶或追逐鲨鱼时则用「点击音」。

这些资料成为训练AI的基础。Google开发的DolphinGemma语音模型约有4亿个参数,使用SoundStream技术将海豚声音数位化,并参考人类语言模型的架构来预测下一个可能的声音单位,尝试解构海豚的语言结构与规律。该模型可直接运行于Pixel手机,便于研究人员在海上即时分析与辨识声音模式,大幅提升效率。

除了被动解码,团队也在实验主动沟通的可能性。他们开发了一套名为CHAT(Cetacean Hearing Augmentation Telemetry)的系统,利用机器合成哨音与特定物品(如海草或围巾)建立连结,并希望透过示范让好奇的海豚模仿哨音,以「请求」物品,实现初步人机互动。

新一代CHAT系统预计于2025年夏季实地测试,采用Pixel 9手机作为运算核心,整合录音、播放与AI分析功能,不仅降低硬体成本与耗能,也提升反应速度与准确率,让研究人员能即时回应海豚的「请求」,强化双向沟通的可能性。

Google计划在今年夏季将DolphinGemma模型开放共享,供全球研究人员针对不同海豚物种如宽吻海豚、旋转海豚等进行调整与应用,推动跨领域合作。

「这是一条艰难但值得的旅程。我们不仅在倾听海豚,现在也开始理解它们的语音规律。」WDP创办人何经博士(Dr. Denise Herzing)表示。Google DeepMind研究员斯塔内博士(Dr. Thad Starner)则认为,AI让我们首次有机会系统性掌握这些海洋哺乳类的复杂声音模式,是人类与自然互动方式的一大进展。CHAT系统硬体中Google Pixel 9手机。(谷歌提供)

avatar

知识博士 管理员

发布了:21112篇内容
查阅文章

发布评论

验证码

QQ交谈

在线咨询:QQ交谈

工作时间:每天9:00 - 18:00
若无特殊,节假日休息

我的微信