研究人员开发新的手势识别算法

发布于 2021年12月28日

更新于 2026年5月24日

作者

Alex McFarland

由中山大学的于志毅领导的研究团队开发了一种新的手势识别算法，该算法复杂、准确且适用。

手势识别越来越被用于人机交互，最近的摄像头系统、图像分析和机器学习的进步也大大提高了基于光学的gesture识别。然而，当前的方法面临着许多挑战，包括高计算复杂度、低速度、低精度和有限的识别手势数量。

由该团队开发的新算法尝试克服这些限制，并在电子成像杂志上发表。该团队的主要目标之一是创建一种不仅能克服这些挑战，还能在消费级设备中轻松应用的算法。

该算法最令人印象深刻的方面之一是其适应不同手型的能力。它首先尝试将用户的手型分类为细长、正常或宽阔。它根据三种测量值来完成这一点，这些测量值反映了手掌宽度、手掌长度和手指长度之间的关系。

在成功分类之后，手势识别过程将输入的手势与相同手型的存储样本进行比较。

“传统的简单算法往往由于无法处理不同的手型而遭受低识别率。通过首先根据手型对输入的手势进行分类，然后使用与该类型匹配的样本库，我们可以提高整体识别率，同时几乎不消耗任何资源，”于志毅说。

该团队的方法还依赖于“捷径特征”来执行预识别步骤。识别算法能够识别九种可能的手势，但比较输入的手势的所有特征与所有可能的手势的存储样本是非常耗时的。

为了克服这一点，算法的预识别步骤计算手的面积与选择三个最可能的手势的比例。这将候选手势的数量减少到三个，最后的手势由基于“Hu 不变矩”的更复杂和高精度的特征提取决定。

“手势预识别步骤不仅减少了计算和硬件资源的需求，还提高了识别速度而不损害准确性，”于志毅说。

该算法在商用PC处理器和FPGA平台上使用USB摄像头进行了测试。该团队召集了40名志愿者多次制作九种手势，另外40名志愿者用于确定系统的准确性。

该系统表明它可以在实时识别手势，准确率超过93%。即使输入的手势图像被旋转、平移或缩放，也是如此。

研究人员表示，他们现在将专注于提高算法在不同照明条件下的性能，以及增加可能的手势数量。

Alex McFarland

Alex McFarland 是一名人工智能记者和作家，探索最新的人工智能发展。他曾与世界各地的众多人工智能初创公司和出版物合作。

Unite.AI