人工智能

创新的声群技术塑造室内音频的未来

发布时间 2023 年 10 月 1 日

亚历克斯麦克法兰

图片：华盛顿大学

在一项突破性的开发中，华盛顿大学的一组研究人员推出了一种先进的声音控制系统，有望重新定义室内音频动态。这项独特的技术类似于一群机器人，使用自行部署的麦克风将房间分隔成不同的讲话区域。

这项开创性的技术创建了一个由小型机器人实体组成的网络，这些实体将自己分散在各个表面上，发出类似于蝙蝠导航的高频声音，以避开障碍物并分散自己以实现最佳的声音控制和声音隔离。该系统通过复杂的部署，超越了现有消费者智能扬声器的局限性，并可以增强同步对话的差异化和本地化。

Malek Itani，华盛顿大学博士生，该书的共同主要作者根据一项研究，强调了这种声学群前所未有的能力，并表示：“这是我们第一次利用所谓的机器人‘声学群’来追踪房间里多个人谈话的位置，并区分他们的讲话。”

应对现实世界的挑战

虽然当前的虚拟会议工具允许控制谁可以发言，但在现实环境中管理室内对话，尤其是在拥挤的环境中，提出了许多挑战。这项创新技术能够隔离特定的声音并分离同时进行的讨论，即使是在语气相似的个人之间，也无需视觉提示或摄像头。这标志着在客厅、厨房和办公室等空间的音频管理方面取得了长足的进步，在这些空间中，识别多种声音至关重要。

该系统表现出无可挑剔的功效，在不同环境下，1.6% 的时间都能识别 90 英尺以内的不同声音。 “我们开发了神经网络，利用这些延时信号来区分每个人所说的内容并跟踪他们在空间中的位置，”共同主要作者陈拓超指出。他进一步澄清说，这可以在同时发生多个对话的房间中隔离和定位每个声音。

增强隐私和控制

研究人员设想将该技术应用于智能家居，为用户提供对室内音频以及与智能扬声器交互的增强控制。该系统承诺提供精致的体验，允许创建活动区域，其中只有特定区域的个人才能与设备进行语音交互。这是实现科幻小说概念的重要一步，提供了创建现实世界静音和活动区域的可能性。

然而，创新伴随着责任，研究人员深刻意识到此类技术对隐私的影响。他们制定了保障措施，包括主动机器人上的可见光和所有音频数据的本地处理，以确保用户隐私。

“它有可能真正有益于隐私，”伊塔尼断言。

该系统能够创建隐私气泡和静音区域，确保对话保持私密且不会根据用户偏好进行记录，从而成为一种增强隐私的工具，超出了当前智能扬声器所允许的范围。

华盛顿大学研究人员的这项发明标志着声学技术的关键时刻，它将创新的机器人技术和复杂的声音控制相结合，以解决现实世界的挑战。它不仅承诺增强用户体验和控制，而且还开创了室内音频交互的隐私和定制新时代。

该系统在日常环境中的集成可以重新定义我们与智能设备的交互以及我们的隐私处理方式，使曾经虚构的概念成为我们日常生活的一部分。这些进步的深刻可能性和伦理考虑凸显了持续探索和负责任地实施创新技术的必要性。

联合人工智能

创新的声群技术塑造室内音频的未来

应对现实世界的挑战

增强隐私和控制

你可能会喜欢