Connect with us

新しいAIによる顔認識技術が一歩先に進む

人工知能

新しいAIによる顔認識技術が一歩先に進む

mm

人工知能を顔認識技術に応用することが、最も進歩している分野のひとつであるように思われる。 ZDNet によると、 Microsoftのような企業は、既に感情ツールを使用した顔認識技術を開発しており、顔認識(FR)で感情表現を認識できる。 ただし、限界があるのは、これらのツールが8つの、という呼ばれるコア状態 – 怒り、軽蔑、恐怖、嫌悪、幸福、悲しみ、驚き、または中立的に限定されていたことである。

今、日本のテクノロジー開発企業 Fujitsuが、顔認識を一歩先に進める、感情を追跡するためのAIベースの技術を発表した。

既存のFR技術は、ZDNetによると、「さまざまなアクションユニット(AUs) – つまり、特定の感情に結びつくことができる顔の筋肉の動き – を識別する」ものである。 例えば、「両方のAU ‘頬を上げる’とAU ‘口角を引く’が一緒に識別されると、AIは分析している人が幸せであると結論付けることができる」。

Fujitsuの担当者によると、「現在の技術の問題は、AIが各AUごとに大量のデータセットでトレーニングされる必要があることである。 AIは、すべての可能な角度と位置からAUを識別する方法を知る必要がある。 しかし、そのような画像が十分にない – したがって、通常、精度が高くない」。

感情を検出するために、AIを効果的にトレーニングするには大量のデータが必要であるが、現在利用可能なFR技術では、実際に検査対象者が感じていることを認識することは非常に困難である。 また、対象者がカメラの前で直視していない場合、タスクはさらに困難になる。 多くの専門家は、最近の研究でこれらの問題を確認している。

Fujitsuは、感情を検出する顔認識結果の品質を向上させる解決策を見つけたと主張している。 大量の画像でAIをトレーニングするのではなく、新しく開発されたツールは「1枚の写真からより多くのデータを抽出する」タスクを持っている。 この会社は、このプロセスを「ノーマライゼーション」と呼んでおり、特定の角度から撮影された写真を「正面からの写真に似た画像」に変換することを含む。

担当者によると、「同じ制限付きのデータセットで、より多くのAUを検出できるようになり、さらに複雑な感情を識別できるようになる」。

会社は、現在「神経質な笑いなどの複雑な感情の変化を、81%の精度で検出できる」と主張している。 この精度は、「標準的な評価方法」によって決定された。 比較として、独立した研究によると、Microsoftツールの精度は60%で、さらに、より斜め角度から撮影された写真で感情を検出する際に問題が発生した。

潜在的な応用として、Fujitsuは、新しいツールが、運転手の集中力のわずかな変化を検出することで「道路安全に役立つ」可能性があることを挙げている。

元外交官およびUNの翻訳者、現在フリーランスのジャーナリスト/ライター/リサーチャーとして、モダンテクノロジー、人工知能、およびモダンカルチャーに焦点を当てている。