关注我们.

人工智能

研究人员开发新的手势识别算法

mm

中山大学于志毅领导的研究团队开发了一种复杂、准确、适用的新型手势识别算法。 

手势越来越多地被用于人机交互,而摄像头系统、图像分析和机器学习的最新进展极大地改善了基于光学的手势识别。尽管如此,由于计算复杂度高、速度低、精度差和可识别手势数量少等限制,当前的方法面临许多挑战。 

该团队开发的新算法试图克服这些限制,并在《自然》杂志上发表的一篇论文中有详细介绍。 电子影像杂志. 该团队的主要目标之一是创建一种算法,不仅能够克服这些挑战,而且还可以轻松应用于消费级设备。

对不同手型的适应性

该算法最令人印象深刻的方面之一是它对不同手型的适应性。 它首先尝试将用户的手型分类为细手、普通手或宽手。 它基于解释手掌宽度、手掌长度和手指长度之间关系的三个测量值来实现这一点。 

成功分类后,手势识别过程会将输入手势与存储的相同手型样本进行比较。 

“传统的简单算法往往会遇到识别率较低的问题,因为它们无法应对不同的手型。 通过首先按手型对输入手势进行分类,然后使用与该类型匹配的示例库,我们可以在几乎可以忽略不计的资源消耗下提高整体识别率,”Yu 说。

预识别步骤

该团队的方法还依赖于使用“快捷功能”来执行预识别步骤。 识别算法能够识别九种可能手势的输入手势,但是将输入手势的所有特征与所有可能手势的存储样本的特征进行比较是极其耗时的。 

为了克服这个问题,算法的预识别步骤计算手部面积的比率,以从可能的九个手势中选择三个最可能的手势。 这使得候选手势的数量达到了三个,最终的手势是通过基于“Hu不变矩”的更复杂、更高精度的特征提取来决定的。

“手势预识别步骤不仅减少了计算量和所需的硬件资源,而且在不影响准确性的情况下提高了识别速度,”Yu 说。 

该算法在商用 PC 处理器和 FPGA 平台上使用 USB 摄像头进行了测试。 该团队召集了 40 名志愿者多次做出这 40 个手势,另外 XNUMX 名志愿者被用来确定系统的准确性。

该系统证明可以实时识别手势,准确率超过93%。 即使输入手势图像被旋转、平移或缩放,情况也是如此。 

研究人员表示,他们现在将重点关注提高算法在不同光照条件下的性能,以及增加可能的手势数量。 

Alex McFarland 是一位人工智能记者和作家,致力于探索人工智能的最新发展。他与全球众多人工智能初创公司和出版物合作。