Seguici sui social

I ricercatori sviluppano un nuovo algoritmo di riconoscimento dei gesti delle mani

Intelligenza Artificiale

I ricercatori sviluppano un nuovo algoritmo di riconoscimento dei gesti delle mani

mm

Un team di ricercatori guidato da Zhiyi Yu della Sun Yat-sen University ha sviluppato un nuovo algoritmo di riconoscimento dei gesti delle mani che è complesso, accurato e applicabile. 

I gesti delle mani vengono sempre più adottati per le interazioni uomo-computer e i recenti progressi nei sistemi di telecamere, nell’analisi delle immagini e nell’apprendimento automatico hanno notevolmente migliorato il riconoscimento dei gesti basato sull’ottica. Detto questo, i metodi attuali devono affrontare molte sfide dovute a limitazioni legate all’elevata complessità computazionale, alla bassa velocità, alla scarsa precisione e al basso numero di gesti riconoscibili. 

Il nuovo algoritmo sviluppato dal team tenta di superare queste limitazioni, ed è stato dettagliato in un documento pubblicato nel Giornale di imaging elettronico. Uno degli obiettivi principali del team era creare un algoritmo che non solo superi queste sfide, ma possa anche essere facilmente applicato a dispositivi di livello consumer.

Adattabilità a diversi tipi di mano

Uno degli aspetti più impressionanti dell'algoritmo è la sua adattabilità a diversi tipi di mano. Innanzitutto tenta di classificare il tipo di mano dell'utente come sottile, normale o larga. Lo fa sulla base di tre misurazioni che tengono conto delle relazioni tra larghezza del palmo, lunghezza del palmo e lunghezza delle dita. 

Dopo una corretta classificazione, il processo di riconoscimento del gesto della mano confronta il gesto di input con i campioni memorizzati dello stesso tipo di mano. 

“Gli algoritmi semplici tradizionali tendono a soffrire di bassi tassi di riconoscimento perché non possono far fronte a diversi tipi di mani. Classificando prima il gesto di input in base al tipo di mano e quindi utilizzando librerie di esempio che corrispondono a questo tipo, possiamo migliorare il tasso di riconoscimento complessivo con un consumo di risorse quasi trascurabile", afferma Yu.

La fase del prericonoscimento

Il metodo del team si basa anche sull'uso di una "funzione di scelta rapida" per eseguire una fase di prericonoscimento. L'algoritmo di riconoscimento è in grado di identificare un gesto di input di nove gesti possibili, ma è estremamente dispendioso in termini di tempo confrontare tutte le caratteristiche del gesto di input con quelle dei campioni memorizzati per tutti i gesti possibili. 

Per ovviare a questo, la fase di prericonoscimento dell'algoritmo calcola un rapporto dell'area della mano per selezionare i tre gesti più probabili dei nove possibili. Ciò porta a tre il numero di gesti candidati e il gesto finale viene deciso da un'estrazione di caratteristiche più complessa e di alta precisione basata su "momenti invarianti Hu".

"La fase di prericonoscimento dei gesti non solo riduce il numero di calcoli e le risorse hardware necessarie, ma migliora anche la velocità di riconoscimento senza compromettere la precisione", afferma Yu. 

L'algoritmo è stato testato in un processore per PC commerciale e una piattaforma FPGA utilizzando una fotocamera USB. Il team ha chiamato 40 volontari per eseguire più volte i nove gesti delle mani e altri 40 sono stati utilizzati per determinare l'accuratezza del sistema.

Il sistema ha dimostrato di poter riconoscere i gesti delle mani in tempo reale con un tasso di precisione superiore al 93%. Questo era il caso anche quando le immagini dei gesti di input venivano ruotate, traslate o ridimensionate. 

I ricercatori affermano che ora cercheranno di concentrarsi sul miglioramento delle prestazioni dell'algoritmo in diverse condizioni di illuminazione, oltre ad aumentare il numero di gesti possibili. 

Alex McFarland è un giornalista e scrittore specializzato in intelligenza artificiale che esplora gli ultimi sviluppi nel campo dell'intelligenza artificiale. Ha collaborato con numerose startup e pubblicazioni di intelligenza artificiale in tutto il mondo.