Anderson 视角

通过磨牙进行生物识别认证

发布于 2022年4月18日

更新于 2026年5月24日

作者

Martin Anderson

最近，美国和中国的两篇研究论文提出了一个新颖的解决方案，用于基于牙齿的认证：只要轻轻咬或磨牙，耳戴设备（也称为“earable”）就会识别出牙齿摩擦产生的独特音频模式，并生成一个有效的生物识别“通行证”，以便通过挑战系统进行验证。

各种耳戴式原型设备，用于两种系统。 来源:https://arxiv.org/ftp/arxiv/papers/2204/2204.07199.pdf（ToothSonic）和https://cis.temple.edu/~yu/research/TeethPass-Info22.pdf（TeethPass）

以前的牙齿认证方法需要用户“露齿笑”或“龇牙咧嘴”，以便牙齿识别系统能够确认他们的牙齿与生物识别记录相符。2021年夏天，印度的一个研究小组以这样的系统——DeepTeeth——而引起了人们的关注。

这两种新提出的系统，分别称为ToothSonic和TeethPass，分别来自美国佛罗里达州立大学和罗格斯大学之间的学术合作，以及中国北京理工大学、清华大学和北京工业大学与美国宾夕法尼亚州费城的坦普尔大学计算机和信息科学系之间的联合努力。

ToothSonic

完全由美国开发的ToothSonic系统在论文Ear Wearable（Earable）用户认证通过声学牙齿印记中被提出。

ToothSonic的作者们指出：

‘ToothSonic利用用户执行牙齿手势时产生的声学牙齿印记效应来实现耳戴式认证。在特定情况下，我们设计了能够产生有效声波的代表性牙齿手势，这些声波携带了牙齿印记的信息。 ‘

‘为了可靠地捕获声学牙齿印记，我们利用了耳道的闭塞效应和耳戴式设备的内置麦克风。然后，我们提取多级声学特征以反映牙齿印记的内在信息，用于认证。’

形成耳戴式设备中独特音频牙齿印记的贡献因素。 来源:https://arxiv.org/ftp/arxiv/papers/2204/2204.07199.pdf

研究人员指出，音频牙齿/颅骨签名模式具有多个优势，这些优势也适用于主要由中国领导的项目。例如，模仿或伪造牙齿印记将极为困难，因为它必须通过头部组织和颅骨通道的独特结构传递，然后才能被记录为模板，以便在未来进行认证测试。

此外，基于牙齿印记的识别不仅消除了用户可能因“露齿笑”或“龇牙咧嘴”而感到尴尬的可能性，还消除了用户在进行可能至关重要的活动（如操作车辆）时分心的需要。

除了这些之外，这种方法适用于许多有运动障碍的人，而设备可以潜在地集成到耳塞中，其主要用途更为常见（即听音乐和打电话），这消除了对专用、独立认证设备或移动应用程序的需求。

此外，复制某人牙齿的可能性（即从未受限制的社交媒体照片帖子中打印照片），甚至在不太可能的情景下获得复杂且完整的牙齿模型，都被音频牙齿印记通过下颌和听觉管的完全隐藏内部几何形状进行过滤这一事实所排除。

来自ToothSonic论文的耳道闭塞效应，使得随意复制或模仿几乎是不可能的。

作为攻击向量，唯一剩下的机会（除了对用户进行强制和身体胁迫之外）是获得对主机安全系统的数据库访问权限，并完全用攻击者的自己的模式替换用户的记录音频牙齿模式（因为非法获得某人的牙齿印记将不会导致任何实用的认证方法）。

ToothSonic的工作流程。

尽管有一个微小的机会让攻击者在自己嘴里播放咀嚼的声音，但中国领导的项目发现这种方法不仅很明显，而且很不幸，成功的机会很小（见下文）。

独特的微笑

ToothSonic论文概述了用户牙齿的许多独特特征，包括咬合类型（如上牙咬合）、釉质密度和共振、缺失的音频信息、瓷器和金属替代品的独特特征（以及其他可能的材料）以及牙尖形态等许多其他可能的区别特征。

作者指出：

‘牙齿印记诱发的声波通过用户的私人牙齿-耳道通道被捕获。因此，我们的系统对高级模仿和重放攻击具有抵抗力，因为用户的私人牙齿-耳道通道保护了声波，这些声波不太可能被对手发现。’

由于下颌运动具有有限的活动范围，作者设想了十种可能的操作，可以被记录为可行的生物识别印记，如下所示为“高级牙齿手势”：

其中一些运动比其他运动更难以实现，尽管更难的运动不会产生更容易或更难以复制的模式。

使用高斯混合模型（GMM）提取对应牙齿运动的宏观特征。对于每种可能的运动，提取出梅尔频率倒谱系数（MFCCs），这是声音的表示形式。

在ToothSonic系统下，对同一主题进行MFCC提取时的六种不同滑动手势。

组成独特生物识别签名的结果声波对某些人体振动非常敏感；因此，ToothSonic在20-8000Hz之间施加了滤波带。

通过隐马尔可夫模型（HMM）实现声波分段，这是根据德国之前的两项工作进行的。

对于认证模型，派生的特征被输入到一个全连接神经网络中，遍历多个层，直到通过ReLU激活。最后一个全连接层使用Softmax函数生成结果和预测标签，以便进行认证场景。

训练数据库是通过要求25名参与者（10名女性，15名男性）在真实环境中佩戴经过篡改的耳塞，并进行正常活动而获得的。原型耳塞（见上图）是使用几美元的消费级硬件制作的，具有一个麦克风芯片。研究人员声称，商业实现此类设备的成本将非常低廉。

学习模型包括MATLAB中的神经网络分类器，训练速率为0.01，使用LBFGS作为损失函数。认证的评估方法为FRR、FAR和BAC。

总体而言，ToothSonic的性能非常好，取决于内部口腔手势的难度：

结果是在三种口腔手势难度级别下获得的：舒适、不太舒适和有困难。其中一个用户偏好的手势实现了95%的准确率。

在局限性方面，用户承认，随着时间的推移，牙齿的变化可能需要用户重新录制音频牙齿签名，例如在进行显著的牙科手术之后。另外，釉质质量可能会随着时间的推移而降低或发生变化，研究人员建议老年人可能需要定期更新他们的个人资料。

作者们还承认，这种类型的多用途耳塞将需要用户在认证期间暂停音乐或对话（与中国领导的TeethPass相同），并且许多目前可用的耳塞没有必要的计算能力来支持此类系统。

尽管如此，他们观察到：

‘令人鼓舞的是，最近发布的Apple H1芯片和Qualcomm的QCS400芯片能够支持基于语音的设备内AI。这意味着在耳戴式设备上实现ToothSonic可能在不久的将来成为现实。’

然而，该论文承认，这种额外的处理可能会影响电池寿命。

TeethPass

在论文TeethPass：基于牙齿闭合的用户认证，通过耳内声学感知中发布，中国-美国项目在基本原理上与ToothSonic相同，考虑到牙齿摩擦产生的特征音频通过听觉管和骨结构传递。

空气噪音消除是在数据收集阶段进行的，结合了噪音减少和——与ToothSonic方法一样——对音频签名施加了适当的频率滤波器。

TeethPass的系统架构。

最终提取的MFCC特征用于训练Siamese神经网络。

TeethPass的Siamese神经网络结构。

系统的评估指标为FRR、FAR和混淆矩阵。与ToothSonic一样，该系统被证明对三种可能的攻击类型具有鲁棒性：模仿、重放和混合攻击。在一次尝试中，研究人员通过在攻击者嘴里播放用户牙齿运动的声音，使用小型扬声器进行混合攻击，发现在20cm距离内，这种混合攻击方法有超过1%的成功机会。

在所有其他场景中，模仿目标的内颅结构（例如在重放攻击期间）的障碍，使得“劫持”场景成为生物识别认证框架中最不可能的风险之一。

大量实验表明，TeethPass实现了98.6%的平均认证准确率，并且能够抵御98.9%的伪造攻击。

* 我将作者的内联引用转换为超链接

首次发布于2022年4月18日。2022年4月19日8:30上午EET更新，以纠正字幕中的软件包误归属。

Martin Anderson

机器学习作家，人类图像合成领域专家。曾任 Metaphysic.ai 研究内容负责人。
个人网站： martinanderson.ai
联系： [email protected]
Twitter：@manders_ai

Unite.AI

通过磨牙进行生物识别认证

ToothSonic

独特的微笑

TeethPass

发现更多