Inteligencia artificial
Ejército de EE. UU. se acerca a vehículos de combate autónomos para terrenos difíciles

Los investigadores del Laboratorio de Investigación del Ejército del Comando de Desarrollo de Capacidades de Combate del Ejército de EE. UU. y la Universidad de Texas en Austin han desarrollado un algoritmo que podría tener grandes implicaciones para los vehículos autónomos. Con el algoritmo, los vehículos terrestres autónomos pueden mejorar sus propios sistemas de navegación observando a un humano conducir.
El enfoque desarrollado por los investigadores se llama aprendizaje de parámetros de planificación adaptativa a partir de demostraciones, o APPLD. Se probó en un vehículo terrestre autónomo experimental del Ejército.
La investigación se publicó en IEEE Robotics and Automation Letters. El trabajo se titula “APPLD: Aprendizaje de parámetros de planificación adaptativa a partir de demostraciones.”
APPLD
El Dr. Garrett Warnell es un investigador del Ejército.
“Utilizando enfoques como APPLD, los soldados actuales en instalaciones de entrenamiento existentes podrán contribuir a mejoras en los sistemas autónomos simplemente operando sus vehículos de manera normal”, dijo Warnell. “Técnicas como estas serán una contribución importante a los planes del Ejército para diseñar y desplegar vehículos de combate de próxima generación que estén equipados para navegar de manera autónoma en entornos de despliegue en terrenos difíciles”.
Para desarrollar el nuevo sistema, los investigadores combinaron algoritmos de aprendizaje automático a partir de demostraciones y sistemas de navegación autónomos clásicos. Una de las mejores características de este enfoque es que permite que APPLD mejore un sistema existente para que se comporte más como un humano, en lugar de reemplazar todo el sistema clásico.
Debido a esto, el sistema desplegado puede conservar características como la optimidad, la explicabilidad y la seguridad, que están presentes en los sistemas de navegación clásicos, mientras crea un sistema más flexible que puede adaptarse a nuevos entornos.
“Una sola demostración de conducción humana, proporcionada utilizando un controlador inalámbrico Xbox de uso común, permitió que APPLD aprendiera a ajustar el sistema de navegación autónoma existente del vehículo de manera diferente dependiendo del entorno local particular”, dijo Warnell. “Por ejemplo, cuando se encontraba en un corredor estrecho, el conductor humano redujo la velocidad y condujo con cuidado. Después de observar este comportamiento, el sistema autónomo aprendió a reducir también su velocidad máxima y aumentar su presupuesto de cálculo en entornos similares. Esto permitió finalmente que el vehículo navegara de manera autónoma en otros corredores estrechos donde había fallado anteriormente”.
https://www.youtube.com/watch?v=u2xxPTZA0DY
Los resultados demostraron que el sistema APPLD entrenado podía navegar los entornos de prueba de manera más eficiente y con menos errores en comparación con el sistema clásico. Además, podía navegar el entorno más rápido que el humano responsable de entrenarlo.
El Dr. Peter Stone es profesor y presidente del Consorcio de Robótica en UT Austin.
“Desde una perspectiva de aprendizaje automático, APPLD se diferencia de los sistemas de aprendizaje de extremo a extremo que intentan aprender todo el sistema de navegación desde cero”, dijo Stone. “Estos enfoques tienden a requerir mucha datos y pueden llevar a comportamientos que no son seguros ni robustos. APPLD aprovecha las partes del sistema de control que han sido cuidadosamente diseñadas, mientras se centra en el proceso de ajuste de parámetros, que a menudo se realiza en función de la intuición de una sola persona”.
El nuevo sistema permite que no expertos en el campo de la robótica entrenen y mejoren la navegación de vehículos autónomos. Por ejemplo, un número ilimitado de usuarios podría proporcionar los datos necesarios para que el sistema se mejore, en lugar de depender de un grupo de ingenieros expertos para alterar manualmente el sistema.
El Dr. Jonathan Fink es un investigador del Ejército.
“Los sistemas de navegación autónomos actuales generalmente deben ser ajustados a mano para cada nuevo entorno de despliegue”, dijo Fink. “Este proceso es extremadamente difícil: debe ser realizado por alguien con una formación extensa en robótica y requiere mucho ensayo y error hasta que se encuentren los ajustes de sistema correctos. En contraste, APPLD ajusta el sistema automáticamente observando a un humano conducir el sistema, algo que cualquier persona puede hacer si tiene experiencia con un controlador de videojuegos. Durante el despliegue, APPLD también permite que el sistema se ajuste a sí mismo en tiempo real a medida que cambia el entorno”.
Uso militar
Este sistema sería de utilidad para el Ejército, que actualmente está trabajando en el desarrollo de vehículos de combate modernizados y vehículos de combate robóticos. Actualmente, muchos de los entornos son demasiado complejos incluso para los mejores sistemas de navegación autónoma.
El Dr. Xuesu Xiao es un investigador postdoctoral en UT Austin y autor principal del artículo.
“Además de la relevancia inmediata para el Ejército, APPLD también crea la oportunidad de cerrar la brecha entre los enfoques tradicionales de ingeniería y las técnicas de aprendizaje automático emergentes, para crear robots móviles robustos, adaptables y versátiles en el mundo real”, dijo Xiao
El sistema APPLD ahora se probará en varios entornos al aire libre diferentes. El equipo de investigadores también verá si la información adicional de sensores puede ayudar a los sistemas a aprender comportamientos más complejos.












