Intelligence artificielle
L’armée américaine se rapproche des véhicules de combat tout-terrain autonomes

Les chercheurs du Commandement du développement des capacités de combat de l’armée américaine, du Laboratoire de recherche de l’armée et de l’Université du Texas à Austin, ont développé un algorithme qui pourrait avoir de grandes implications pour les véhicules autonomes. Avec cet algorithme, les véhicules autonomes au sol peuvent améliorer leurs propres systèmes de navigation en regardant un humain conduire.
L’approche développée par les chercheurs s’appelle apprentissage de paramètres de planification adaptatif à partir de démonstrations, ou APPLD. Elle a été testée sur un véhicule expérimental autonome au sol de l’armée.
La recherche a été publiée dans IEEE Robotics and Automation Letters. Le travail est intitulé “APPLD : Apprentissage adaptatif de paramètres de planification à partir de démonstrations.”
APPLD
Le Dr Garrett Warnell est un chercheur de l’armée.
“En utilisant des approches comme APPLD, les soldats actuels dans les installations d’entraînement existantes pourront contribuer à l’amélioration des systèmes autonomes simplement en exploitant leurs véhicules comme d’habitude”, a déclaré Warnell. “Des techniques comme celles-ci seront une contribution importante aux plans de l’armée pour concevoir et mettre en service des véhicules de combat de nouvelle génération équipés pour naviguer de manière autonome dans des environnements de déploiement tout-terrain.”
Pour développer le nouveau système, les chercheurs ont combiné des algorithmes d’apprentissage automatique à partir de démonstrations et des systèmes de navigation autonomes classiques. L’une des meilleures fonctionnalités de cette approche est qu’elle permet à APPLD d’améliorer un système existant pour se comporter davantage comme un humain, plutôt que de remplacer l’ensemble du système classique.
En raison de cela, le système déployé est capable de conserver des fonctionnalités comme l’optimalité, l’explicabilité et la sécurité, qui sont présentes dans les systèmes de navigation classiques, tout en créant un système plus flexible qui peut s’adapter à de nouveaux environnements.
“Une seule démonstration de conduite humaine, fournie à l’aide d’un contrôleur sans fil Xbox ordinaire, a permis à APPLD d’apprendre à régler le système de navigation autonome existant du véhicule différemment en fonction de l’environnement local particulier”, a déclaré Warnell. “Par exemple, lorsqu’il se trouvait dans un couloir étroit, le conducteur humain a ralenti et conduit prudemment. Après avoir observé ce comportement, le système autonome a appris à réduire également sa vitesse maximale et à augmenter son budget de calcul dans des environnements similaires. Cela lui a finalement permis de naviguer avec succès de manière autonome dans d’autres couloirs étroits où il avait précédemment échoué.”
https://www.youtube.com/watch?v=u2xxPTZA0DY
Les résultats ont démontré que le système APPLD formé pouvait naviguer dans les environnements de test de manière plus efficace et avec moins d’erreurs par rapport au système classique. De plus, il pouvait également naviguer dans l’environnement plus rapidement que l’humain responsable de la formation.
Le Dr Peter Stone est professeur et président du Consortium de robotique de l’UT Austin.
“D’un point de vue d’apprentissage automatique, APPLD se distingue des systèmes d’apprentissage de bout en bout qui tentent d’apprendre l’ensemble du système de navigation à partir de zéro”, a déclaré Stone. “Ces approches tendent à nécessiter beaucoup de données et peuvent conduire à des comportements qui ne sont ni sûrs ni robustes. APPLD utilise les parties du système de contrôle qui ont été soigneusement conçues, tout en se concentrant sur le processus d’ajustage des paramètres, qui est souvent effectué sur la base de l’intuition d’une seule personne.”
Le nouveau système permet aux non-experts dans le domaine de la robotique de former et d’améliorer la navigation des véhicules autonomes. Par exemple, un nombre illimité d’utilisateurs pourraient fournir les données nécessaires pour que le système s’améliore lui-même, plutôt que de compter sur un groupe d’ingénieurs experts pour modifier manuellement le système.
Le Dr Jonathan Fink est un chercheur de l’armée.
“Les systèmes de navigation autonomes actuels doivent généralement être réajustés manuellement pour chaque nouvel environnement de déploiement”, a déclaré Fink. “Ce processus est extrêmement difficile – il doit être effectué par quelqu’un ayant une formation extensive en robotique, et il nécessite beaucoup d’essais et d’erreurs jusqu’à ce que les bonnes réglages du système soient trouvés. En revanche, APPLD ajuste le système automatiquement en regardant un humain conduire le système – quelque chose que n’importe qui peut faire s’il a de l’expérience avec un contrôleur de jeu vidéo. Lors du déploiement, APPLD permet également au système de se réajuster en temps réel à mesure que l’environnement change.”
Utilisation militaire
Ce système serait utile pour l’armée, qui travaille actuellement à développer des véhicules de combat modernisés à équipage optionnel et des véhicules de combat robotiques. Actuellement, de nombreux environnements sont trop complexes même pour les meilleurs systèmes de navigation autonome.
Le Dr Xuesu Xiao est un chercheur postdoctoral à l’UT Austin et auteur principal de l’article.
“En plus de la pertinence immédiate pour l’armée, APPLD crée également l’opportunité de combler le fossé entre les approches d’ingénierie traditionnelles et les techniques d’apprentissage automatique émergentes, pour créer des robots mobiles robustes, adaptables et polyvalents dans le monde réel”, a déclaré Xiao
Le système APPLD sera maintenant testé dans divers environnements extérieurs différents. L’équipe de chercheurs verra également si des informations de capteur supplémentaires peuvent aider les systèmes à apprendre des comportements plus complexes.












