スタブ 研究者が新しい手のジェスチャー認識アルゴリズムを開発 - Unite.AI
私達と接続

Artificial Intelligence

研究者が新しい手のジェスチャー認識アルゴリズムを開発

更新中 on

中山大学の Zhiyi Yu 氏が率いる研究チームは、複雑で正確かつ適用可能な新しいハンドジェスチャー認識アルゴリズムを開発しました。 

ハンド ジェスチャは人間とコンピュータの対話にますます採用されており、カメラ システム、画像分析、機械学習の最近の進歩により、光学ベースのジェスチャ認識が大幅に改善されました。そうは言っても、現在の方法は、計算の複雑さの高さ、速度の遅さ、精度の低さ、認識可能なジェスチャの数の少なさなどの制限により、多くの課題に直面しています。 

チームが開発した新しいアルゴリズムは、これらの制限を克服することを試みており、その詳細は、 電子画像ジャーナル. チームの主な目標の XNUMX つは、これらの課題を克服するだけでなく、消費者レベルのデバイスにも簡単に適用できるアルゴリズムを作成することでした。

さまざまな手のタイプへの適応性

このアルゴリズムの最も印象的な側面の XNUMX つは、さまざまな手のタイプへの適応性です。 まず、ユーザーの手のタイプを細い、普通、広いのいずれかに分類しようとします。 これは、手のひらの幅、手のひらの長さ、指の長さの関係を考慮した XNUMX つの測定値に基づいて行われます。 

分類が成功した後、ハンド ジェスチャ認識プロセスは、入力されたジェスチャを同じ手の種類の保存されたサンプルと比較します。 

「従来の単純なアルゴリズムは、さまざまな手のタイプに対応できないため、認識率が低い傾向があります。 まず入力ジェスチャを手のタイプごとに分類し、次にこのタイプに一致するサンプル ライブラリを使用することで、ほぼ無視できるリソース消費で全体の認識率を向上させることができます」と Yu 氏は言います。

事前認識ステップ

チームの方法は、事前認識ステップを実行するために「ショートカット機能」の使用にも依存しています。 認識アルゴリズムは、XNUMX つ​​の可能なジェスチャのうちの入力ジェスチャを識別できますが、入力ジェスチャのすべての特徴を、すべての可能なジェスチャについて保存されているサンプルの特徴と比較するには、非常に時間がかかります。 

これを克服するために、アルゴリズムの事前認識ステップで手の面積の比率を計算し、可能な XNUMX つのジェスチャのうち最も可能性の高い XNUMX つを選択します。 これによりジェスチャ候補はXNUMXつとなり、「Hu不変モーメント」に基づくより複雑かつ高精度な特徴抽出により最終的なジェスチャが決定される。

「ジェスチャの事前認識ステップにより、必要な計算数とハードウェア リソースが削減されるだけでなく、精度を損なうことなく認識速度も向上します」と Yu 氏は言います。 

このアルゴリズムは、USB カメラを使用して市販の PC プロセッサと FPGA プラットフォームでテストされました。 チームは40人のボランティアに40つの手のジェスチャーを複数回行うよう呼びかけ、さらにXNUMX人を使ってシステムの精度を判定した。

このシステムは、93% 以上の精度で手のジェスチャーをリアルタイムに認識できることを実証しました。 これは、入力ジェスチャ画像が回転、移動、または拡大縮小された場合でも同様でした。 

研究者らは今後、可能なジェスチャーの数を増やすだけでなく、さまざまな照明条件下でのアルゴリズムのパフォーマンスを向上させることに重点を置くつもりだと述べた。 

Alex McFarland は、AI ジャーナリスト兼ライターであり、人工知能の最新の発展を調査しています。彼は世界中の数多くの AI スタートアップ企業や出版物と協力してきました。