Robotik
KI hilft beim Training von Teams von kollaborativen Robotern und Drohnen

Ein Team von Forschern an der University of Illinois Grainger College of Engineering hat eine neue Methode entwickelt, um mehrere Agenten wie Roboter und Drohnen mithilfe von künstlicher Intelligenz (KI) zusammenarbeiten zu lassen. Die Agenten verlassen sich auf Reinforcement Learning, eine der Haupttypen von Machine-Learning-Techniken.
Dezentralisierte Technik
Huy Tran ist ein Luft- und Raumfahrttechniker an der Universität.
“Es ist einfacher, wenn Agenten miteinander sprechen können”, sagte Huy Tran. “Aber wir wollten es auf eine dezentralisierte Weise tun, was bedeutet, dass sie nicht miteinander sprechen. Wir konzentrierten uns auch auf Zitate, bei denen es nicht offensichtlich ist, was die verschiedenen Rollen oder Aufgaben für die Agenten sein sollten.”
Laut Tran ist dieses Szenario komplexer, weil es nicht klar ist, was ein Agent gegenüber einem anderen Agenten tun sollte.
“Die interessante Frage ist, wie wir lernen, eine Aufgabe gemeinsam über die Zeit hinweg zu erfüllen”, sagte er.
Reinforcement-Learning-Technik
Das Team verließ sich auf die Machine-Learning-Technik namens Reinforcement Learning, um dieses Problem zu umgehen. Es ermöglichte ihnen, eine Utility-Funktion zu erstellen, die dem Agenten sagt, wenn er etwas Nützliches für das Team tut.
“Bei Teamzielen ist es schwierig zu wissen, wer zum Sieg beigetragen hat”, fuhr Tran fort. “Wir entwickelten eine Machine-Learning-Technik, die es uns ermöglicht, zu identifizieren, wenn ein einzelner Agent zum globalen Teamziel beigetragen hat. Wenn man es im Kontext von Sport betrachtet, kann ein Fußballspieler ein Tor schießen, aber wir wollen auch wissen, welche Aktionen von anderen Teammitgliedern zum Tor geführt haben, wie Assists. Es ist schwierig, diese verzögerten Effekte zu verstehen.”
Die Algorithmen der Forscher identifizieren auch, wenn ein Agent oder Roboter etwas tut, das gegen das Ziel oder nicht dazu beiträgt.
“Es ist nicht so, dass der Roboter sich entschieden hat, etwas Falsches zu tun, sondern etwas, das nicht nützlich für das Endziel ist”, sagte er.
Die Algorithmen wurden mit simulierten Spielen getestet, wie StarCraft.
“StarCraft kann ein bisschen unvorhersehbarer sein – wir waren begeistert, unsere Methode in dieser Umgebung gut funktionieren zu sehen.”
Diese Art von Algorithmus ist auf verschiedene reale Situationen anwendbar, sagen die Forscher. Einige der potenziellen Anwendungen umfassen militärische Überwachung, Roboter in einem Lager, Verkehrssteuerung, autonome Fahrzeuge, die Lieferungen koordinieren, und die Steuerung eines elektrischen Stromnetzes.
Das Team, das diese bahnbrechende Forschung durchgeführt hat, umfasste Seung Hyun Kim, Neale Van Stralen und Girish Chowdhary. Es wurde auf der peer-reviewed-Konferenz für autonome Agenten und Multi-Agenten-Systeme präsentiert.












