Robótica
La IA ayuda a entrenar equipos de robots y drones colaborativos

Un equipo de investigadores de la Universidad de Illinois Grainger College of Engineering ha desarrollado un nuevo método para entrenar a múltiples agentes como robots y drones para que trabajen juntos con el uso de inteligencia artificial (IA). Los agentes confían en el aprendizaje por refuerzo, que es uno de los principales tipos de técnicas de aprendizaje automático.
Técnica descentralizada
Huy Tran es un ingeniero aeroespacial en la universidad.
“Es más fácil cuando los agentes pueden hablar entre sí”, dijo Huy Tran. “Pero queríamos hacer esto de una manera descentralizada, lo que significa que no se hablan entre sí. También nos centramos en citas donde no es obvio qué roles o trabajos deben tener los agentes”.
Según Tran, este escenario es más complejo porque no está claro qué debe hacer un agente contra otro agente.
“La pregunta interesante es cómo aprendemos a realizar una tarea juntos con el tiempo”, dijo.
Técnica de aprendizaje por refuerzo
El equipo confió en la técnica de aprendizaje automático llamada aprendizaje por refuerzo para solucionar este problema. Les permitió crear una función de utilidad que le indica al agente cuándo está haciendo algo útil para el equipo.
“Con objetivos de equipo, es difícil saber quién contribuyó a la victoria”, continuó Tran. “Desarrollamos una técnica de aprendizaje automático que nos permite identificar cuándo un agente individual contribuyó al objetivo global del equipo. Si se mira en términos de deportes, un jugador de fútbol puede marcar, pero también queremos saber sobre las acciones de otros compañeros de equipo que llevaron al gol, como asistencias. Es difícil entender estos efectos retrasados”.
Los algoritmos de los investigadores también identifican cuándo un agente o robot está haciendo algo que va en contra, o no contribuye al objetivo.
“No es que el robot eligiera hacer algo malo, solo algo que no es útil para el objetivo final”, dijo.
Los algoritmos se probaron utilizando juegos simulados, como StarCraft.
“StarCraft puede ser un poco más impredecible: estábamos emocionados de ver que nuestro método funcionara bien en este entorno también”.
Este tipo de algoritmo es aplicable a diversas situaciones del mundo real, dice el equipo. Algunas de las posibles aplicaciones incluyen vigilancia militar, robots en un almacén, control de señales de tráfico, vehículos autónomos que coordinan entregas y control de una red de energía eléctrica.
El equipo que llevó a cabo esta investigación de vanguardia incluyó a Seung Hyun Kim, Neale Van Stralen y Girish Chowdhary. Se presentó en la conferencia de revisión por pares de Sistemas de Agentes Autónomos y Multiagentes.












