关注我们.

人工智能

谷歌人工智能如何揭开海豚交流的秘密

mm

海豚以其高智商、复杂的社会行为和精妙的沟通系统而闻名。多年来,科学家和动物爱好者一直对海豚是否拥有与人类相似的语言这一问题着迷。近年来,人工智能 (AI) 为探索这一问题开辟了令人兴奋的新可能性。该领域最具创新性的进展之一是谷歌与 野生海豚项目(WDP) 创建 海豚杰玛,一个旨在分析海豚发声的人工智能模型。这一突破不仅有助于解读海豚的交流,还可能为与这些非凡生物的双向互动铺平道路。

人工智能在理解海豚声音中的作用

海豚通过咔哒声、哨声和肢体动作进行交流。这些声音的频率和强度各不相同,可能根据不同的社交环境(例如觅食、交配或与其他动物互动)传递不同的信息。尽管经过多年的研究,但要完全理解这些信号仍然极具挑战性。传统的观察和分析方法难以处理海豚发声产生的海量数据,因此很难得出深刻的见解。

人工智能 (AI) 通过使用机器学习和自然语言处理 (NLP) 算法分析大量海豚声音数据,帮助克服这一挑战。这些模型可以识别人耳无法识别的发声模式和联系。AI 可以区分不同类型的海豚声音,根据其特征进行分类,并将某些声音与特定的行为或情绪状态联系起来。例如,研究人员注意到,某些口哨声似乎与社交互动有关,而咔哒声通常与导航或回声定位有关。

虽然人工智能在解码海豚声音方面拥有巨大潜力,但收集和处理来自海豚群的海量数据,并在如此庞大的数据集上训练人工智能模型仍然是一项重大挑战。为了应对这些挑战,谷歌和海豚发展计划 (WDP) 开发了 DolphinGemma,这是一个专门用于分析海豚交流的人工智能模型。该模型基于海量数据集进行训练,能够识别海豚发声的复杂模式。

了解 DolphinGemma

DolphinGemma 建立在 谷歌的杰玛,一个拥有约 400 亿个参数的开源生成式 AI 模型。DolphinGemma 旨在学习海豚发声的结构,并生成新的类似海豚的声音序列。该模型由 WDP 和佐治亚理工学院合作开发,使用了自 1985 年以来收集的大西洋斑点海豚发声数据集。该模型利用 谷歌的 SoundStream 技术将这些声音标记化,使其能够预测序列中的下一个声音。与语言模型生成文本的方式非常相似,DolphinGemma 可以预测海豚可能发出的声音,这有助于它识别可能代表海豚交流中语法或句法的模式。

该模型甚至可以生成新的类似海豚的声音,类似于预测文本提示句子中下一个单词的方式。这种能力有助于识别海豚交流的规则,并为理解它们的发声是否构成一种结构化语言提供见解。

DolphinGemma 行动

DolphinGemma 之所以如此高效,是因为它能够在 Google Pixel 手机等设备上实时运行。凭借其轻量级架构,该模型无需昂贵的专业设备即可运行。研究人员可以直接在手机上录制海豚的声音,并立即使用 DolphinGemma 进行分析。这使得这项技术更容易普及,并有助于降低研究成本。

此外,DolphinGemma 还集成到 客服 鲸类听觉增强遥测系统(Cetacean Hearing Augmentation Telemetry,简称CETACE)允许研究人员播放类似海豚的合成声音并观察其反应。这有望通过实现海豚与人类之间的双向交流,从而发展出共同的词汇。

更广泛的影响和谷歌的未来计划

DolphinGemma 的开发不仅对理解海豚的交流方式意义重大,也对推进动物认知和交流的研究至关重要。通过解码海豚的发声,研究人员可以更深入地了解海豚的社会结构、优先级和思维过程。这不仅可以通过了解海豚的需求和担忧来改进保护工作,还可能拓展我们对动物智力和意识的认识。

DolphinGemma 是利用人工智能探索动物交流的更广泛运动的一部分,类似的研究也正在针对乌鸦、鲸鱼和猫鼬等物种展开。谷歌计划于 2025 年夏季将 DolphinGemma 作为开放模型向研究界发布,目标是通过进一步微调,将其应用扩展到其他鲸类物种,例如宽吻海豚或飞旋海豚。这种开源方法将鼓励全球动物交流研究合作。谷歌还计划在即将到来的季节对该模型进行实地测试,这将进一步加深我们对大西洋斑点海豚的了解。

挑战与科学怀疑论

尽管DolphinGemma潜力巨大,但它也面临着诸多挑战。海洋录音经常受到背景噪音的影响,使得声音分析变得困难。参与该项目的佐治亚理工学院研究员Thad Starner表示, 指出 很多数据包含周围的海洋声音,需要先进的过滤技术。一些研究人员也质疑海豚的交流是否真的可以被视为语言。例如,动物学家阿里克·克申鲍姆(Arik Kershenbaum) 提示与人类语言的复杂性不同,海豚的发声可能是一种更简单的信号系统。 苏塞克斯海豚项目引发了人们对无意中训练海豚模仿声音的风险的担忧。这些观点凸显了对人工智能生成的洞察进行严格验证和仔细解读的必要性。

底线

谷歌对海豚交流的人工智能研究是一项开创性的成果,它使我们更深入地了解海豚之间以及与周围环境互动的复杂方式。通过人工智能,研究人员正在检测海豚声音中隐藏的模式,从而为它们的交流系统提供新的见解。尽管挑战依然存在,但迄今为止取得的进展凸显了人工智能在动物行为研究中的潜力。随着这项研究的进展,它可能为动物保护、动物认知研究以及人与动物互动带来新的机遇。

Tehseen Zia 博士是伊斯兰堡 COMSATS 大学的终身副教授,拥有奥地利维也纳科技大学的人工智能博士学位。 他专注于人工智能、机器学习、数据科学和计算机视觉,在著名科学期刊上发表论文,做出了重大贡献。 Tehseen 博士还作为首席研究员领导了多个工业项目,并担任人工智能顾问。