Connect with us

Intelligence artificielle

Améliorer la vision par ordinateur alimentée par l’IA grâce à la conscience de la physique

mm

L’intelligence artificielle a indéniablement laissé une marque indélébile sur nos vies. Dans un effort pionnier pour améliorer encore les capacités de l’IA, des chercheurs de l’UCLA et du Laboratoire de recherche de l’armée des États-Unis ont dévoilé une approche unique qui marie la conscience de la physique avec des techniques basées sur les données dans les technologies de vision par ordinateur alimentées par l’IA.

L’étude, publiée dans Nature Machine Intelligence, propose une méthodologie hybride innovante visant à affiner la façon dont les machines basées sur l’IA perçoivent, interagissent et réagissent à leur environnement en temps réel – essentiel pour les véhicules autonomes et les robots d’action de précision.

Approche hybride pour l’IA consciente de la physique

Traditionnellement, la vision par ordinateur, le domaine qui permet à l’IA de comprendre et de déduire les propriétés du monde physique à partir d’images, s’est largement concentrée sur l’apprentissage automatique basé sur les données. Parallèlement, la recherche basée sur la physique a cherché à élucider les principes physiques sous-jacents à de nombreux défis de vision par ordinateur. Cependant, l’intégration de la compréhension de la physique dans le domaine des réseaux de neurones s’est avérée difficile.

Dans une avancée significative, l’étude de l’UCLA vise à combiner la compréhension approfondie des données et la connaissance du monde réel de la physique, créant ainsi un IA hybride avec des capacités accrues. Achuta Kadambi, auteur principal de l’étude et professeur adjoint de génie électrique et informatique à l’école d’ingénierie Samueli de l’UCLA, explique : “Les formes de déduction conscientes de la physique peuvent permettre aux voitures de conduire plus en sécurité ou aux robots chirurgicaux d’être plus précis.”

Intégration de la physique dans la vision par ordinateur de l’IA

L’équipe de recherche décrit trois moyens innovants d’intégrer la physique dans la vision par ordinateur de l’IA :

  1. Infusion de la physique dans les ensembles de données de l’IA : cela consiste à étiqueter les objets avec des informations supplémentaires, telles que leur vitesse ou leur poids potentiels, similaires aux personnages de jeux vidéo.
  2. Intégration de la physique dans les architectures de réseau : cette stratégie consiste à faire passer les données à travers un filtre de réseau qui code les propriétés physiques dans ce que les caméras capturent.
  3. Intégration de la physique dans la fonction de perte de réseau : ici, les connaissances basées sur la physique sont utilisées pour aider l’IA à interpréter les données de formation sur ses observations.

Ces lignes de recherche expérimentale ont déjà produit des résultats prometteurs pour améliorer la vision par ordinateur. Par exemple, l’approche hybride permet à l’IA de suivre et de prédire le mouvement d’un objet avec plus de précision et peut produire des images précises et à haute résolution à partir de scènes obscurcies par des conditions météorologiques défavorables.

Le futur de l’IA consciente de la physique

Les chercheurs sont optimistes que les progrès continus dans cette approche à double modalité pourraient amener les IA basées sur l’apprentissage profond à apprendre de manière autonome les lois de la physique. Cela pourrait marquer une nouvelle frontière dans les technologies de vision par ordinateur alimentées par l’IA, ouvrant la voie à une application de l’IA plus sûre et plus précise dans divers secteurs, notamment les véhicules autonomes et la robotique chirurgicale.

L’étude, soutenue en partie par une subvention du Laboratoire de recherche de l’armée, a été co-écrite par le scientifique informatique du Laboratoire de recherche de l’armée, Celso de Melo, et les membres de la faculté de l’UCLA, Stefano Soatto, Cho-Jui Hsieh et Mani Srivastava. Un financement supplémentaire provenait de subventions de la National Science Foundation, du programme de jeune chercheur de l’armée, de l’Agence de recherche avancée de la défense, d’Intrinsic, une société Alphabet, et d’Amazon.

Alex McFarland est un journaliste et écrivain en intelligence artificielle qui explore les derniers développements en intelligence artificielle. Il a collaboré avec de nombreuses startups et publications en intelligence artificielle dans le monde entier.