监控
人工智能可以通过单个脚步识别一个人

一项新的研究计划开发了一种低成本系统,能够根据脚步声识别一个人,哪怕只是一步。
在 纸 通过深度脚步分离和识别进行被动多人识别 (PURE) 是南洋理工大学和肯塔基大学等研究人员合作的项目,根据极其简短的音频样本,识别率高达 90%。
PURE 的架构依赖于来自一系列商用麦克风的数据,并通过背景对原始音频捕获进行降噪 光谱减法。 在信噪比较高的情况下,包括在捕获时发生的对话,源分离算法被激活以执行脚步的离散提取。
脚步音频通过以下方式进行澄清和分析 领域对抗适应,框架包括特征提取器、身份预测器和域鉴别器。
PURE 硬件
PURE 使用的设备是一个麦克风阵列,嵌入在基于 Raspberry Pi 4 的定制装置中。
麦克风以最高可用速率捕获“结构传播”信号(脚接触地面)的音频,因为该数据持续时间极短,并且需要尽可能详细。 然而,空中脚步声(声音脚在下次接触地面时形成的弧线)被下采样至 16kHz,以节省结构传播脚步的本地处理能力。
研究人员合成了一个训练数据集 脚步声音效音板以及 脚步声音效 来自流行之声。 来自各种 Ted Talk 的音频组件用于生成从背景对话中提取脚步声的过程的训练数据。
防止脚步识别中的“重放攻击”
这种性质的系统需要能够抵御“重放攻击”,其中犯罪分子可能会记录特定的脚步模式并重放它,希望系统将记录识别为实时用户。
为了防止这种情况发生,PURE 分析了“接触”脚步中的到达时间 (ToA) 和空中脚步中的到达角度 (AoA)。
尽管在处理数据时有必要考虑到这一点,但重放的脚步中缺乏动态信息很容易揭示它们。 通过观察脚步的自然不规则性以及它们在环境中的速度(因为人们不太可能在办公室环境中跑步或磨蹭),可以确保接收到的数据是真实的。
该项目采用 波束成形 计算 ToA 的技术,但 AoA 的提取更为复杂,需要 R-Net 神经网络,该网络再次使用对抗性学习来计算足迹的范围。 这本质上与早期的神经网络是相同的模型,只是身份预测器被范围估计器取代。
准确性
PURE 在各种声学环境中进行了测试,并在一定距离内使用了各种步行速度。 随着创建足迹的人数增加,准确性自然会下降,当多个足迹源的速度增加时也是如此。
然而,根据领域适应情况,超过100次试验的结果发现,系统可以从3-5个脚步声中识别出用户,准确率在90.73%到96.53%之间; 2-3 步,准确度范围为 88.16% 至 95.92%; 单步检测的准确率范围为 81.75% 至 88.6%。
研究人员预计 PURE 具有广泛的适用性,因为所涉及的商用硬件成本低廉,而且它在延迟和准确性方面也优于类似系统,同时对环境干扰和重放攻击具有鲁棒性。
步态分析的发展
在过去的十年里,机器学习研究的这个特殊领域主要集中在计算机视觉上,并且在 用过的 作为情节设备 不可能的任务:流氓国家 (2015)。
迄今为止,步态识别技术已被提议用于 老年护理, 术后 复原,以及在零售环境中的个性化广告服务方面更具争议性,尽管这样的系统显然具有在安全环境中监控员工的潜在用途。
2018 年是 报道 中国当局使用人工智能开发公司基于视觉的步态分析 Watrix 作为其闭路公共监控系统的一个方面。
步态识别也已实现 监控 Wi-Fi 信号的反射率。
然而,所有这些方法都有固有的局限性,要么需要无法保证的照明条件、视野开阔、昂贵的专用设备、过于具体的当地条件,要么需要随身携带的设备等障碍。