Suivez nous sur

Des chercheurs développent un nouvel algorithme de reconnaissance des gestes de la main

Intelligence Artificielle

Des chercheurs développent un nouvel algorithme de reconnaissance des gestes de la main

mm

Une Ă©quipe de chercheurs dirigĂ©e par Zhiyi Yu de l'UniversitĂ© Sun Yat-sen a dĂ©veloppĂ© un nouvel algorithme de reconnaissance des gestes de la main qui est complexe, prĂ©cis et applicable. 

Les gestes de la main sont de plus en plus adoptĂ©s pour les interactions homme-machine, et les progrès rĂ©cents dans les systèmes de camĂ©ras, l'analyse d'images et l'apprentissage automatique ont considĂ©rablement amĂ©liorĂ© la reconnaissance optique des gestes. Cela dit, les mĂ©thodes actuelles sont confrontĂ©es Ă  de nombreux dĂ©fis en raison de limitations liĂ©es Ă  une complexitĂ© informatique Ă©levĂ©e, Ă  une faible vitesse, Ă  une prĂ©cision mĂ©diocre et au faible nombre de gestes reconnaissables. 

Le nouvel algorithme développé par l'équipe tente de surmonter ces limitations, et il a été détaillé dans un article publié dans le Journal de l'imagerie électronique. L'un des principaux objectifs de l'équipe était de créer un algorithme qui non seulement surmonte ces défis, mais peut également être facilement appliqué dans les appareils grand public.

Adaptabilité à différents types de mains

L'un des aspects les plus impressionnants de l'algorithme est son adaptabilitĂ© Ă  diffĂ©rents types de mains. Il tente d'abord de classer le type de main de l'utilisateur comme mince, normal ou large. Pour ce faire, il se base sur trois mesures tenant compte des relations entre la largeur de la paume, la longueur de la paume et la longueur des doigts. 

Suite Ă  une classification rĂ©ussie, le processus de reconnaissance des gestes de la main compare le geste d'entrĂ©e avec des Ă©chantillons stockĂ©s du mĂŞme type de main. 

"Les algorithmes simples traditionnels ont tendance à souffrir de faibles taux de reconnaissance car ils ne peuvent pas gérer différents types de mains. En classant d'abord le geste d'entrée par type de main, puis en utilisant des bibliothèques d'échantillons correspondant à ce type, nous pouvons améliorer le taux de reconnaissance global avec une consommation de ressources presque négligeable », explique Yu.

L'étape de préreconnaissance

La mĂ©thode de l'Ă©quipe repose Ă©galement sur l'utilisation d'une « fonction de raccourci » pour effectuer une Ă©tape de prĂ©reconnaissance. L'algorithme de reconnaissance est capable d'identifier un geste d'entrĂ©e parmi neuf gestes possibles, mais il est extrĂŞmement long de comparer toutes les caractĂ©ristiques du geste d'entrĂ©e avec celles des Ă©chantillons stockĂ©s pour tous les gestes possibles. 

Pour surmonter cela, l'étape de préreconnaissance de l'algorithme calcule un rapport de la surface de la main pour sélectionner les trois gestes les plus probables parmi les neuf possibles. Cela porte le nombre de gestes candidats à trois, et le geste final est décidé par une extraction de caractéristiques plus complexe et de haute précision basée sur les «moments invariants Hu».

"L'Ă©tape de prĂ©reconnaissance des gestes rĂ©duit non seulement le nombre de calculs et de ressources matĂ©rielles nĂ©cessaires, mais amĂ©liore Ă©galement la vitesse de reconnaissance sans compromettre la prĂ©cision", dĂ©clare Yu. 

L'algorithme a été testé dans un processeur PC commercial et une plate-forme FPGA à l'aide d'une caméra USB. L'équipe a fait appel à 40 volontaires pour effectuer les neuf gestes de la main plusieurs fois, et 40 autres ont été utilisés pour déterminer la précision du système.

Le système a dĂ©montrĂ© qu'il pouvait reconnaĂ®tre les gestes de la main en temps rĂ©el avec un taux de prĂ©cision de plus de 93 %. C'Ă©tait le cas mĂŞme lorsque les images gestuelles d'entrĂ©e Ă©taient pivotĂ©es, traduites ou mises Ă  l'Ă©chelle. 

Les chercheurs disent qu'ils vont maintenant chercher Ă  se concentrer sur l'amĂ©lioration des performances de l'algorithme dans diffĂ©rentes conditions d'Ă©clairage, ainsi qu'Ă  augmenter le nombre de gestes possibles. 

Alex McFarland est un journaliste et écrivain en IA qui explore les derniers développements en matière d'intelligence artificielle. Il a collaboré avec de nombreuses startups et publications d'IA dans le monde entier.