スタブ AI システムは手のジェスチャーを正確に認識できる - Unite.AI
私達と接続

ロボット工学

AI システムは手のジェスチャーを正確に認識できます

更新中 on
クレジット: 南洋理工大学 (NTU)

手のジェスチャーを認識できる新しい人工知能 (AI) システムが、シンガポールの南洋理工大学 (NTU シンガポール) の科学者によって開発されました。この技術は、皮膚のようなエレクトロニクスとコンピュータービジョンを組み合わせることによって機能します。

人間の手のジェスチャーを認識する AI システムの開発は約 10 年前から行われており、現在、手術ロボット、健康監視装置、ゲーム システムなどで使用されています。 

初期の AI ジェスチャ認識システムは視覚のみでしたが、ウェアラブル センサーからの入力が統合されて改良されました。 これを「データ融合」といいます。 センシング能力のXNUMXつは「体性感覚」と呼ばれるもので、ウェアラブルセンサーはそれを再現することができます。 

ウェアラブル センサーから得られるデータの品質が低いため、ジェスチャ認識の精度を達成するのは依然として困難です。 これは、かさばり、ユーザーとの接触が不十分であること、さらに視覚的に遮られる物体や照明が不十分であることが原因で発生します。 

不一致のデータセットは個別に処理し、最終的には統合する必要があるため、視覚データと感覚データの統合にはさらなる課題が生じます。 このプロセスは非効率的であり、応答時間が遅くなります。 

NTU チームは、単層カーボン ナノチューブで作られた皮膚のような伸縮性のあるひずみセンサーを利用した「生物インスピレーション」データ融合システムの作成など、これらの課題を克服するいくつかの方法を考え出しました。 研究チームはまた、皮膚感覚と視覚が脳内でどのように処理されるかを表現する方法として AI を利用しました。

AI システムを開発するために、3 つのニューラル ネットワーク アプローチが 1 つのシステムに結合されました。ニューラル ネットワークには、畳み込みニューラル ネットワーク、スパース ニューラル ネットワーク、多層ニューラル ネットワークの 3 種類があります。

これら XNUMX つを組み合わせることで、チームは他の方法と比較して人間のジェスチャーをより正確に認識できるシステムを開発できました。

チェン・シャオドン教授はこの研究の筆頭著者である。 彼は NTU の材料科学工学部の出身です。 

「当社のデータ融合アーキテクチャには、脳内の体性感覚と視覚の融合階層に似た人工システムを含む、生物からインスピレーションを得た独自の機能があります。 このような機能により、当社のアーキテクチャが既存のアプローチにはないユニークなものになると信じています。」

Chen は、NTU のフレキシブル デバイス革新センター (iFLEX) のディレクターでもあります。 

「正確なデータ収集のためにユーザーと十分に密接に接触しない硬いウェアラブル センサーと比較して、当社のイノベーションでは人間の皮膚に快適に装着できる伸縮性のあるひずみセンサーを使用しています。 これにより、高精度の認識タスクに不可欠な高品質の信号取得が可能になります」とチェン氏は述べています。

NTUシンガポールとシドニー工科大学(UTS)の科学者で構成されたチームの研究結果は、XNUMX月に科学誌に掲載された。 ネイチャーエレクトロニクス.

システムのテスト

チームは、手のジェスチャーで制御されるロボットを使用して、生物からインスピレーションを得た AI システムをテストしました。 ロボットは迷路内を誘導され、その結果、AI ハンド ジェスチャ認識システムがエラーなく迷路内をロボットを誘導できることが実証されました。 これは、同じ迷路で XNUMX 回の間違いを犯した視覚ベースの認識システムと比較したものです。

騒音や照明条件が悪いなどの悪条件下でのテストでも、AI システムは高い精度を維持しました。 認識精度は96.7%以上に達しました。

NTUシンガポールの材料科学工学部のWang Ming博士がこの研究の筆頭著者です。 

「私たちのアーキテクチャの高精度の秘密は、複雑な解釈を実行する前の早い段階で、視覚情報と体性感覚情報が相互に作用し、補完し合うことができるという事実にあります」とミン氏は語った。 「その結果、システムは冗長なデータと知覚的な曖昧さが少なく、一貫した情報を合理的に収集できるようになり、結果として精度が向上します。」

ドイツのマックス・プランク・コロイド・界面研究所所長であるマルクス・アントニエッティ教授の独立した見解によれば、「この論文の発見は、よりスマートでより機械にサポートされた世界への新たな一歩をもたらしてくれます。」 社会に革命をもたらしたスマートフォンの発明と同じように、この作品は、いつかジェスチャーを通じて周囲の世界すべてを高い信頼性と正確さで物理的に制御できるようになるという希望を私たちに与えてくれます。」

「市場には、この未来をサポートするこのようなテクノロジーのアプリケーションが無限に存在します。 たとえば、スマートワークプレイスの遠隔ロボット制御から高齢者向けの外骨格まで。」

研究チームは今後、生物からインスピレーションを得た AI システムに基づいた VR および AR システムの開発に取り組む予定です。

 

Alex McFarland は、AI ジャーナリスト兼ライターであり、人工知能の最新の発展を調査しています。彼は世界中の数多くの AI スタートアップ企業や出版物と協力してきました。