Künstliche Intelligenz

Das LLM-Auto: Ein Durchbruch in der Kommunikation zwischen Mensch und AV

mm

Da autonome Fahrzeuge (AVs) einer weitverbreiteten Akzeptanz näher kommen, bleibt eine signifikante Herausforderung bestehen: die Überbrückung der Kommunikationslücke zwischen menschlichen Passagieren und ihren robotischen Chauffeuren. Während AVs bemerkenswerte Fortschritte bei der Navigation in komplexen Straßenumgebungen gemacht haben, kämpfen sie oft darum, die nuancierten, natürlichen Sprachbefehle zu interpretieren, die für menschliche Fahrer so selbstverständlich sind.

Ein innovatives Studie der Purdue University, Lyles School of Civil and Construction Engineering, unter der Leitung von Assistant Professor Ziran Wang, hat einen innovativen Ansatz entwickelt, um die AV-Mensch-Interaktion mithilfe künstlicher Intelligenz zu verbessern. Ihre Lösung besteht darin, Large Language Models (LLMs) wie ChatGPT in autonome Fahrzeuge zu integrieren.

Die Macht der natürlichen Sprache in AVs

LLMs stellen einen großen Schritt nach vorne in der Fähigkeit von künstlicher Intelligenz dar, menschliche Texte zu verstehen und zu generieren. Diese komplexen künstlichen Intelligenz-Systeme werden auf großen Mengen an Textdaten trainiert, was es ihnen ermöglicht, Kontext, Nuancen und implizite Bedeutungen auf eine Weise zu erfassen, die herkömmliche programmierte Antworten nicht können.

Im Kontext autonomer Fahrzeuge bieten LLMs eine transformative Fähigkeit. Im Gegensatz zu herkömmlichen AV-Schnittstellen, die auf spezifische Sprachbefehle oder Button-Eingaben angewiesen sind, können LLMs eine breite Palette von natürlichen Sprachanweisungen interpretieren. Dies bedeutet, dass Passagiere mit ihren Fahrzeugen auf eine Weise kommunizieren können, die der mit einem menschlichen Fahrer sehr ähnlich ist.

Die Verbesserung der AV-Kommunikationsfähigkeiten ist erheblich. Stellen Sie sich vor, Sie sagen zu Ihrem Auto: “Ich bin spät dran”, und es berechnet automatisch die effizienteste Route und passt seine Fahrweise an, um die Reisezeit sicher zu minimieren. Oder denken Sie an die Fähigkeit, zu sagen: “Ich fühle mich ein bisschen autokrank”, was das Fahrzeug dazu veranlasst, sein Bewegungsprofil für eine ruhigere Fahrt anzupassen. Diese nuancierten Interaktionen, die menschliche Fahrer intuitiv verstehen, werden für AVs durch die Integration von LLMs möglich.

Purdue-Universitäts-Assistenzprofessor Ziran Wang steht neben einem Test-Autonomen Fahrzeug, das er und seine Studenten mit ChatGPT oder anderen Large Language Models ausgestattet haben, um Befehle von Passagieren zu interpretieren. (Purdue-Universitäts-Foto/John Underwood)

Die Purdue-Studie: Methodik und Ergebnisse

Um das Potenzial von LLMs in autonomen Fahrzeugen zu testen, führte das Purdue-Team eine Reihe von Experimenten mit einem Level-4-Autonomen Fahrzeug durch – nur einen Schritt von der vollen Autonomie entfernt, wie sie von SAE International definiert wird.

Die Forscher begannen damit, ChatGPT zu trainieren, um auf eine Reihe von Befehlen zu reagieren, von direkten Anweisungen wie “Bitte fahre schneller” bis hin zu indirekteren Anfragen wie “Ich fühle mich gerade ein bisschen bewegungskrank”. Sie integrierten dann dieses trainierte Modell in die bestehenden Systeme des Fahrzeugs, um es in die Lage zu versetzen, Faktoren wie Verkehrsregeln, Straßenbedingungen, Wetter und Sensordaten bei der Interpretation von Befehlen zu berücksichtigen.

Die experimentelle Aufstellung war rigoros. Die meisten Tests wurden auf einem Testgelände in Columbus, Indiana, durchgeführt – einem ehemaligen Flugplatz, der es ermöglichte, sicher Hochgeschwindigkeitstests durchzuführen. Zusätzliche Parktests wurden auf dem Parkplatz des Ross-Ade-Stadions der Purdue-Universität durchgeführt. Während der Experimente reagierte das LLM-unterstützte AV auf vorher gelernte und neue Befehle von Passagieren.

Die Ergebnisse waren vielversprechend. Die Teilnehmer berichteten über signifikant niedrigere Unbehaglichkeitsraten im Vergleich zu typischen Erfahrungen in Level-4-AVs ohne LLM-Unterstützung. Das Fahrzeug übertraf konsistent die Baseline-Sicherheits- und Komfortmetriken, sogar wenn es auf Befehle reagierte, auf die es nicht explizit trainiert worden war.

Vielleicht am beeindruckendsten war die Fähigkeit des Systems, individuelle Passagierpräferenzen über den gesamten Fahrtverlauf zu lernen und anzupassen, was das Potenzial für eine truly personalisierte autonome Mobilität zeigt.

Purdue-PhD-Student Can Cui sitzt in dem Test-Autonomen Fahrzeug. Ein Mikrofon in der Konsole nimmt seine Befehle auf, die von Large Language Models in der Cloud interpretiert werden. Das Fahrzeug fährt gemäß den Anweisungen, die von den Large Language Models generiert werden. (Purdue-Universitäts-Foto/John Underwood)

Aussichten für die Zukunft der Mobilität

Für die Nutzer sind die Vorteile vielfältig. Die Fähigkeit, auf natürliche Weise mit einem AV zu kommunizieren, verringert die Lernkurve, die mit neuen Technologien verbunden ist, und macht autonome Fahrzeuge für eine breitere Palette von Menschen zugänglich, einschließlich derjenigen, die von komplexen Schnittstellen eingeschüchtert werden könnten. Darüber hinaus deuten die Personalisierungsfähigkeiten, die in der Purdue-Studie demonstriert wurden, auf eine Zukunft hin, in der AVs auf individuelle Präferenzen angepasst werden können und so ein maßgeschneidertes Erlebnis für jeden Passagier bieten.

Diese verbesserte Interaktion könnte auch die Sicherheit erhöhen. Durch ein besseres Verständnis der Absichten und des Zustands der Passagiere – wie z.B. die Erkennung, wenn jemand es eilig hat oder sich unwohl fühlt – können AVs ihr Fahrverhalten entsprechend anpassen und so möglicherweise Unfälle vermeiden, die durch Missverständnisse oder Unbehagen der Passagiere verursacht werden.

Aus der Branche heraus gesehen könnte diese Technologie ein wichtiger Differenzierungsmerkmal im wettbewerbsintensiven AV-Markt sein. Hersteller, die ein intuitiveres und responsiveres Benutzererlebnis anbieten können, könnten einen signifikanten Vorteil erlangen.

Herausforderungen und zukünftige Richtungen

Trotz der vielversprechenden Ergebnisse bleiben einige Herausforderungen bestehen, bevor LLM-integrierte AVs auf öffentlichen Straßen Realität werden. Ein wichtiger Punkt ist die Verarbeitungszeit. Das aktuelle System benötigt im Durchschnitt 1,6 Sekunden, um einen Befehl zu interpretieren und zu reagieren – akzeptabel für nicht-kritische Szenarien, aber potenziell problematisch in Situationen, die schnelle Reaktionen erfordern.

Ein weiteres signifikantes Anliegen ist das Potenzial von LLMs, “zu halluzinieren” oder Befehle falsch zu interpretieren. Obwohl die Studie Sicherheitsmechanismen zur Minderung dieses Risikos umfasste, ist es von entscheidender Bedeutung, dieses Problem umfassend anzugehen, um eine reale Implementierung zu ermöglichen.

In Zukunft plant Wangs Team, mehrere Forschungsansätze zu verfolgen. Sie bewerten andere LLMs, einschließlich Google’s Gemini und Meta’s Llama AI-Assistenten, um die Leistung zu vergleichen. Vorläufige Ergebnisse deuten darauf hin, dass ChatGPT derzeit andere in Sicherheits- und Effizienzmetriken übertrifft, obwohl veröffentlichte Ergebnisse noch ausstehen.

Eine interessante zukünftige Richtung ist das Potenzial für die Kommunikation zwischen Fahrzeugen mithilfe von LLMs. Dies könnte eine komplexere Verkehrssteuerung ermöglichen, wie z.B. die Verhandlung von Vorfahrtsrechten an Kreuzungen.

Darüber hinaus startet das Team ein Projekt, um große Bildmodelle zu untersuchen – künstliche Intelligenz-Systeme, die auf Bildern anstelle von Text trainiert werden – um AVs dabei zu helfen, extreme Winterwetterbedingungen im Mittleren Westen zu navigieren. Diese Forschung, unterstützt vom Center for Connected and Automated Transportation, könnte die Anpassungsfähigkeit und Sicherheit von autonomen Fahrzeugen weiter verbessern.

Die Bottom Line

Die bahnbrechende Forschung der Purdue-Universität zur Integration von Large Language Models in autonome Fahrzeuge markiert einen entscheidenden Moment in der Verkehrstechnologie. Durch die Ermöglichung einer intuitiveren und responsiveren Mensch-AV-Interaktion geht diese Innovation eine kritische Herausforderung in der Akzeptanz von AVs an. Während Hindernisse wie die Verarbeitungszeit und mögliche Fehlinterpretationen bestehen bleiben, ebnet die Studie den Weg für eine Zukunft, in der die Kommunikation mit unseren Fahrzeugen so natürlich sein könnte wie das Gespräch mit einem menschlichen Fahrer. Wenn diese Technologie sich weiterentwickelt, hat sie das Potenzial, nicht nur die Art und Weise, wie wir reisen, sondern auch, wie wir künstliche Intelligenz in unserem täglichen Leben wahrnehmen und interagieren, zu revolutionieren.

Alex McFarland ist ein KI-Journalist und Schriftsteller, der die neuesten Entwicklungen im Bereich der künstlichen Intelligenz erforscht. Er hat mit zahlreichen KI-Startups und Veröffentlichungen weltweit zusammengearbeitet.