Connect with us

人工智能

谷歌的 AI 如何解锁海豚交流的秘密

mm

海豚以其智慧、复杂的社会行为和错综复杂的交流系统而闻名。多年来,科学家和动物爱好者一直被海豚是否拥有与人类类似的语言这一想法所吸引。近年来,人工智能(AI)为探索这个问题开辟了令人兴奋的新可能性。该领域最具创新性的发展之一是谷歌与 野生海豚项目(WDP) 的合作,创建了 DolphinGemma,一种旨在分析海豚声学化的 AI 模型。这一突破不仅可以帮助解码海豚交流,还可能为与这些令人难以置信的生物进行双向交互铺平道路。

AI 在理解海豚声音中的作用

海豚使用点击、口哨和身体运动的组合来交流。这些声音在频率和强度上各不相同,这可能会根据社会背景(例如觅食、交配或与他人互动)发出不同的信号。尽管经过多年的研究,理解这些信号的全部范围仍然具有挑战性。传统的观察和分析方法难以处理海豚声学化产生的海量数据,使得难以获得见解。
AI 有助于克服这一挑战,通过使用机器学习和自然语言处理(NLP)算法来分析大量的海豚声音数据。这些模型可以识别出人类耳朵无法识别的声学化中的模式和联系。AI 可以区分不同的海豚声音类型,根据特征对其进行分类,并将某些声音与特定的行为或情绪状态联系起来。例如,研究人员已经注意到,某些口哨似乎与社会交往有关,而点击通常与导航或回声定位有关。
虽然 AI 在解码海豚声音方面具有巨大的潜力,但收集和处理海豚群体的海量数据以及训练 AI 模型以处理如此大量的数据集仍然是重大挑战。为了解决这些挑战,谷歌和 WDP 开发了 DolphinGemma,一种专门用于分析海豚交流的 AI 模型。该模型在大量数据集上进行训练,可以检测海豚声学化中的复杂模式。

了解 DolphinGemma

DolphinGemma 建立在 谷歌的 Gemma 上,后者是一种具有约 400 万参数的开源生成式 AI 模型。DolphinGemma 的设计目的是学习海豚声学化的结构并生成新的、类似海豚的声音序列。该模型由 WDP 和佐治亚理工学院共同开发,使用自 1985 年以来收集的大西洋斑点海豚声学化数据集。该模型利用 谷歌的 SoundStream 技术对这些声音进行标记化,使其能够预测序列中的下一个声音。就像语言模型生成文本一样,DolphinGemma 预测海豚可能发出的声音,这有助于它识别可能代表海豚交流中的语法或语法的模式。
该模型甚至可以生成类似海豚的声音,类似于预测文本中句子的下一个单词。这一能力可以帮助确定海豚交流的规则,并提供对理解其声学化是否形成结构化语言的见解。

DolphinGemma 在行动

DolphinGemma 特别有效的原因是它可以在像谷歌 Pixel 手机这样的设备上实时运行。凭借其轻量级架构,该模型可以在无需昂贵的专用设备的情况下运行。研究人员可以直接在手机上记录海豚的声音,并立即使用 DolphinGemma 进行分析。这使得该技术更易于使用,并有助于降低研究成本。
此外,DolphinGemma 集成到 CHAT(鲸类听觉增强遥测)系统中,允许研究人员播放合成的海豚声音并观察响应。这可能会导致通过使人类和海豚之间的双向交流成为可能而发展出共享词汇。

更广泛的影响和谷歌的未来计划

DolphinGemma 的开发不仅对于理解海豚交流具有重要意义,也是研究动物认知和交流的重要一步。通过解码海豚声学化,研究人员可以更深入地了解海豚的社会结构、优先事项和思维过程。这不仅可以通过了解海豚的需求和关切来改善保护工作,还有可能扩大我们对动物智慧和意识的知识。
DolphinGemma 是使用 AI 探索动物交流更广泛运动的一部分,类似的努力正在针对乌鸦、鲸鱼和狐獴等物种进行。谷歌计划在 2025 年夏天将 DolphinGemma 作为开源模型发布给研究社区,目标是通过进一步微调将其应用扩展到其他鲸类物种,例如瓶鼻海豚或旋转海豚。这一开源方法将鼓励全球范围内的动物交流研究合作。谷歌还计划在即将到来的季节中测试该模型,这可能会进一步扩大我们对大西洋斑点海豚的理解。

挑战和科学怀疑主义

尽管 DolphinGemma 具有巨大的潜力,但它也面临着几个挑战。海洋录音通常受到背景噪音的影响,使得声音分析变得困难。佐治亚理工学院的研究人员 Thad Starner 指出,大量数据包括环境海洋声音,需要先进的过滤技术。一些研究人员也质疑海豚交流是否可以真正被认为是一种语言。例如,动物学家 Arik Kershenbaum 建议,海豚声学化可能是一个比人类语言更简单的信号系统。萨塞克斯海豚项目主任 Thea Taylor 提出,存在训练海豚模仿声音的风险。这些观点强调了对 AI 生成的见解进行严格验证和谨慎解释的必要性。

结论

谷歌对海豚交流的 AI 研究是一项开创性的努力,它使我们更接近于理解海豚如何与彼此和环境进行交互。通过人工智能,研究人员正在检测海豚声音中的隐藏模式,提供了对其交流系统的新见解。虽然仍然存在挑战,但迄今为止取得的进展凸显了 AI 在动物行为研究中的潜力。随着这一研究的发展,它可能会为保护、动物认知研究和人类动物交往开辟新的机会。

Dr. Tehseen Zia 是 COMSATS University Islamabad 的终身副教授,拥有来自奥地利维也纳科技大学的人工智能博士学位。专攻人工智能、机器学习、数据科学和计算机视觉,他在著名的科学期刊上发表了重要贡献。 Dr. Tehseen 还作为首席调查员领导了各种工业项目,并担任人工智能顾问。