Anderson 视角

使用机器学习分析眼睛来判断醉酒状态

mm

来自德国和智利的研究人员开发了一种新的机器学习框架,能够根据近红外眼部图像评估一个人是否醉酒。

研究旨在开发“适合职责”的实时系统,能够评估个人的驾驶或操作机械的准备度。该系统使用了一种新颖的从零开始训练的对象检测器,可以从单个图像中个性化眼部组件,并将其与包含醉酒和未醉酒眼部图像的数据库进行比较。

你只看一次(YOLO)个性化眼睛,然后框架分离实例并执行分割以将眼睛图像分解为其组成部分。来源:https://arxiv.org/pdf/2106.15828.pdf

你只看一次(YOLO)个性化眼睛,然后框架分离实例并执行分割以将眼睛图像分解为其组成部分. 来源:https://arxiv.org/pdf/2106.15828.pdf

最初,系统使用你只看一次(YOLO)对象检测框架捕获和个性化每个眼睛的图像。之后,使用两个优化网络将眼睛图像分解为语义区域——2020年由华中科技大学发布的Criss Cross注意力网络(CCNet)和由智利研究人员开发的DenseNet10分割算法。

DenseNet10的语义管道。来源:https://www.researchgate.net/publication/346903035_Towards_an_Efficient_Segmentation_Algorithm_for_Near-Infrared_Eyes_Images#pf6

来自近红外眼部图像的分割. 来源:https://www.researchgate.net/publication/346903035_Towards_an_Efficient_Segmentation_Algorithm_for_Near-Infrared_Eyes_Images#pf6

两个算法分别仅使用122,514和210,732个参数——与其他类似模型的更大特征集相比,这是一个节俭的布局,并且违背了机器学习框架中数据量更大的趋势。

醉酒数据库

为了告知机器学习框架,研究人员开发了一个原始数据库,包含266个醉酒受试者和765个清醒受试者。

从获得的醉酒和非醉酒受试者数据库中获得的样本。

从获得的醉酒和非醉酒受试者数据库中获得的样本。

受试者被要求站在两台Iritech相机(Gemini/Venus系列)前,面对设备,并在清醒状态下被记录。之后,他们饮用200ml的酒精,并在15分钟间隔内被重新捕获,因为他们的血液酒精含量上升,直到60分钟后最后一次会话。

这产生了21,309张图像,然后使用Python库imgaug进行注释。

为现实世界准备数据

这并不是一个高度自动化的工作流程,尽管使用了先进的工具——研究人员将眼部图像的手动标记描述为“非常耗时和费力的过程”,并且需要超过一年。

数据使用一系列方法进行了激进的增强,旨在降低和挑战系统,模拟可能的现实世界条件,包括雪花、泊松噪声(模拟低光传感器降级)、模糊、飞溅和雨效应。另外,使用红外捕获消除了对理想照明条件的需求,这些条件在经济和实用的部署中无法保证。

这种艰苦的工作最终带来了98.60%的眼部捕获和分割的准确率。

使用最小二乘法的虹膜分割。

使用最小二乘法的虹膜分割。

测试

分割框架使用五个平台进行了测试:Osiris、DeepVOG、DenseNet10(见上文)、CCNet(见上文)和Grand-Mean。在所有情况下,分析都表明,与醉酒程度相关的瞳孔扩张都取得了成功的结果,尽管使用DenseNet和CCNet的混合方法被证明是最有效的。

研究人员预计,他们的工作最终可以被纳入标准的近红外虹膜传感器中,并指出,生产贡献的醉酒眼部数据库的赫拉克勒斯式努力可能是生物识别研究这一领域的益处。

通过眼部评估进行消费者和工业醉酒检测

这项新研究建立在一些值得注意的先前文献的基础上,包括2015年来自巴西和美国的研究人员的一篇开创性的论文,该论文提出了一个系统化和理性化的方法来评估醉酒程度。该论文的研究人员观察到,酒精会降低大脑效率,损害夜视能力(降低25%),并延长反应时间(降低30%),其严重程度因个体耐受性而异。

来源:https://pixellab.group/publication/2015/pinheiro2015/pinheiro2015.pdf

来源:https://pixellab.group/publication/2015/pinheiro2015/pinheiro2015.pdf

此类技术的主要问题是便携性。早在2003年,英国研究公司Hampton Knight就提供了一种通过眼部分析进行醉酒程度评估的系统——当时的价格为10,000英镑。

2012年的一项初步研究来自新德里和美国,也探索了使用系统的AI技术从眼部图像中推导出醉酒程度的可能性,尽管成功率不如当前的研究。该研究还为这一领域的工作贡献了一个有价值的数据集(IITD Iris Under Alcohol Influence)。

然而,近年来边缘计算和优化的移动机器学习硬件资源的创新为预活动检查中的醉酒程度检测开启了更广泛的移动应用领域,包括可能将虹膜检查添加到当前方法中的汽车传感器,这些方法与美国正在开发的驾驶员酒精检测系统安全框架(DADSS)有关——到目前为止,该框架依赖于皮肤酒精传感器和车内空气中的酒精蒸气评估。

2020年的一份报告估计,这类技术的采用可能每年在美国alone就能挽救11,000条生命。

机器学习作家,人类图像合成领域专家。曾任 Metaphysic.ai 研究内容负责人。
个人网站: martinanderson.ai
联系: [email protected]
Twitter:@manders_ai