Seguici sui social

Il team di ricerca sviluppa una tecnica di intelligenza artificiale per il rilevamento delle espressioni facciali 3D

Intelligenza Artificiale

Il team di ricerca sviluppa una tecnica di intelligenza artificiale per il rilevamento delle espressioni facciali 3D

mm

Un gruppo di ricerca congiunto guidato dai professori Ki-Hun Jeong e Doheon Lee del Korea Advanced Institute of Science and Technology (KAIST) ha sviluppato una nuova tecnica per il rilevamento delle espressioni facciali combinando tecniche di telecamere a campo luminoso nel vicino infrarosso con intelligenza artificiale (AI ).

La ricerca è stata pubblicata in Sistemi intelligenti avanzati.

Telecamere a campo luminoso

Le fotocamere a campo luminoso contengono array di micro-lenti davanti al sensore di immagine e questo consente loro di adattarsi a uno smartphone. Allo stesso tempo, possono ancora acquisire le informazioni spaziali e direzionali della luce con un singolo scatto. 

Questa tecnica di imaging viene utilizzata per ricostruire le immagini in molti modi diversi, come multiview, rifocalizzazione e acquisizione di immagini 3D. 

Detto questo, la tecnica ha alcune limitazioni. Le telecamere a campo luminoso esistenti hanno faticato a fornire un contrasto dell'immagine accurato e una ricostruzione 3D a volte a causa delle ombre causate da fonti di luce esterne nell'ambiente. 

Il team di ricerca è stato in grado di stabilizzare l'accuratezza della ricostruzione dell'immagine 3D che dipendeva dalla luce ambientale e la tecnica ha permesso loro di superare i limiti delle telecamere a campo luminoso esistenti. Hanno sviluppato una nuova fotocamera ottimizzata per la ricostruzione di immagini 3D delle espressioni facciali e l'hanno utilizzata per acquisire immagini di ricostruzione 3D di alta qualità delle espressioni facciali di varie emozioni. Potrebbero raggiungere questo obiettivo indipendentemente dalle condizioni di illuminazione dell'ambiente.

Apprendimento automatico per distinguere le espressioni

Il team ha quindi utilizzato l'apprendimento automatico per distinguere le espressioni facciali nelle immagini 3D acquisite, ottenendo un tasso di precisione dell'85%. Hanno anche calcolato l'interdipendenza delle informazioni sulla distanza, che varia con l'espressione facciale nelle immagini 3D, per identificare le informazioni utilizzate da una telecamera a campo luminoso per distinguere le espressioni umane. 

"La fotocamera a campo luminoso sub-miniaturizzata sviluppata dal team di ricerca ha il potenziale per diventare la nuova piattaforma per analizzare quantitativamente le espressioni facciali e le emozioni degli umani", ha affermato il professor Ki-Hun Jeong. 

Questa ricerca potrebbe avere un grande impatto su una vasta gamma di industrie. 

 "Potrebbe essere applicato in vari campi, tra cui l'assistenza sanitaria mobile, la diagnosi sul campo, la cognizione sociale e le interazioni uomo-macchina", ha affermato.

Alex McFarland è un giornalista e scrittore specializzato in intelligenza artificiale che esplora gli ultimi sviluppi nel campo dell'intelligenza artificiale. Ha collaborato con numerose startup e pubblicazioni di intelligenza artificiale in tutto il mondo.