Künstliche Intelligenz

DeepMinds Evolution des Geistes: Ermächtigung großer Sprachmodelle zur Lösung realer Probleme

Published February 6, 2025

Updated April 26, 2026

Dr. Tehseen Zia

In den letzten Jahren ist künstliche Intelligenz (KI) als praktisches Werkzeug für die Förderung von Innovationen in verschiedenen Branchen aufgetaucht. An der Spitze dieses Fortschritts stehen große Sprachmodelle (LLMs), die für ihre Fähigkeit bekannt sind, menschliche Sprache zu verstehen und zu generieren. Während LLMs bei Aufgaben wie konversationeller KI und Content-Erstellung gut abschneiden, haben sie oft Schwierigkeiten mit komplexen realen Herausforderungen, die strukturiertes Denken und Planen erfordern.

Zum Beispiel, wenn Sie LLMs bitten, eine Geschäftsreise mit mehreren Städten zu planen, die die Koordination von Flugplänen, Besprechungszeiten, Budgetbeschränkungen und ausreichend Ruhe erfordert, können sie Vorschläge für einzelne Aspekte liefern. Allerdings haben sie oft Schwierigkeiten, diese Aspekte zu integrieren, um effektiv konkurrierende Prioritäten auszugleichen. Diese Einschränkung wird noch deutlicher, wenn LLMs zunehmend verwendet werden, um KI-Agenten zu bauen, die in der Lage sind, reale Probleme autonom zu lösen.

Google DeepMind hat kürzlich eine Lösung für dieses Problem entwickelt. Inspiriert von der natürlichen Selektion, ist dieser Ansatz, bekannt als Mind Evolution, eine Verfeinerung von Problemlösungsstrategien durch iterative Anpassung. Durch die Echtzeit-Anleitung von LLMs ermöglicht es ihnen, komplexe reale Aufgaben effektiv zu bewältigen und sich an dynamische Szenarien anzupassen. In diesem Artikel werden wir untersuchen, wie diese innovative Methode funktioniert, ihre potenziellen Anwendungen und was sie für die Zukunft der KI-gesteuerten Problemlösung bedeutet.

Warum LLMs mit komplexem Denken und Planen Schwierigkeiten haben

LLMs werden trainiert, um das nächste Wort in einem Satz vorherzusagen, indem sie Muster in großen Textdatensätzen wie Büchern, Artikeln und Online-Inhalten analysieren. Dies ermöglicht es ihnen, Antworten zu generieren, die logisch und kontextuell angemessen erscheinen. Allerdings basiert diese Ausbildung auf dem Erkennen von Mustern und nicht auf dem Verständnis von Bedeutung. Als Ergebnis können LLMs Text produzieren, der logisch erscheint, aber bei Aufgaben, die tieferes Denken oder strukturierte Planung erfordern, Schwierigkeiten haben.

Die Kernbeschränkung liegt in der Art und Weise, wie LLMs Informationen verarbeiten. Sie konzentrieren sich auf Wahrscheinlichkeiten oder Muster und nicht auf Logik, was bedeutet, dass sie isolierte Aufgaben wie Flugoptionen oder Hotel-Empfehlungen bewältigen können, aber versagen, wenn diese Aufgaben in einen kohärenten Plan integriert werden müssen. Dies macht es auch schwierig für sie, den Kontext über die Zeit hinweg beizubehalten. Komplexe Aufgaben erfordern oft, dass vorherige Entscheidungen nachverfolgt und neue Informationen berücksichtigt werden. LLMs jedoch neigen dazu, den Fokus in längeren Interaktionen zu verlieren, was zu fragmentierten oder inkonsistenten Ausgaben führt.

Wie Mind Evolution funktioniert

DeepMinds Mind Evolution adressiert diese Mängel, indem es Prinzipien der natürlichen Evolution anwendet. Anstatt eine einzelne Antwort auf eine komplexe Anfrage zu produzieren, generiert dieser Ansatz mehrere potenzielle Lösungen, verfeinert sie iterativ und wählt die beste Lösung durch einen strukturierten Bewertungsprozess aus. Zum Beispiel können wir uns ein Team vorstellen, das Ideen für ein Projekt brainstormt. Einige Ideen sind großartig, andere weniger. Das Team bewertet alle Ideen, behält die besten und verwirft den Rest. Sie verbessern die besten Ideen, führen neue Variationen ein und wiederholen den Prozess, bis sie die beste Lösung erreichen. Mind Evolution wendet dieses Prinzip auf LLMs an.

Hier ist eine Aufschlüsselung, wie es funktioniert:

Generierung: Der Prozess beginnt mit der Erstellung von mehreren Antworten auf eine gegebene Aufgabe durch das LLM. Zum Beispiel kann das Modell bei einer Reiseplanungsaufgabe verschiedene Reiserouten basierend auf Budget, Zeit und Benutzervorlieben entwerfen.
Bewertung: Jede Lösung wird anhand einer Fitness-Funktion bewertet, einem Maß, das angibt, wie gut sie die Anforderungen der Aufgabe erfüllt. Antworten mit schlechter Qualität werden verworfen, während die vielversprechendsten Kandidaten in die nächste Phase übergehen.
Verfeinerung: Eine einzigartige Innovation von Mind Evolution ist der Dialog zwischen zwei Persönlichkeiten innerhalb des LLM: dem Autor und dem Kritiker. Der Autor schlägt Lösungen vor, während der Kritiker Schwächen identifiziert und Feedback gibt. Dieser strukturierte Dialog spiegelt wider, wie Menschen Ideen durch Kritik und Revision verfeinern. Zum Beispiel, wenn der Autor einen Reiseplan vorschlägt, der einen Restaurantbesuch über dem Budget einschließt, weist der Kritiker darauf hin. Der Autor überarbeitet dann den Plan, um die Bedenken des Kritikers zu berücksichtigen. Dieser Prozess ermöglicht es LLMs, tiefe Analysen durchzuführen, die sie zuvor mit anderen Prompting-Techniken nicht durchführen konnten.
Iterative Optimierung: Die verfeinerten Lösungen werden weiterhin bewertet und rekombiniert, um verfeinerte Lösungen zu produzieren.

Durch die Wiederholung dieses Zyklus verbessert Mind Evolution die Qualität der Lösungen iterativ, wodurch LLMs komplexe Herausforderungen effektiver bewältigen können.

Mind Evolution in Aktion

DeepMind testete diesen Ansatz auf Benchmarks wie TravelPlanner und Natural Plan. Mit diesem Ansatz erreichte Google’s Gemini eine Erfolgsrate von 95,2 % bei TravelPlanner, was eine außergewöhnliche Verbesserung gegenüber einem Baseline-Wert von 5,6 % darstellt. Mit dem weiterentwickelten Gemini Pro stiegen die Erfolgsraten auf fast 99,9 %. Diese transformative Leistung zeigt die Effektivität von Mind Evolution bei der Bewältigung praktischer Herausforderungen.

Interessanterweise wächst die Effektivität des Modells mit der Komplexität der Aufgabe. Zum Beispiel, während Single-Pass-Methoden mit mehrtägigen Reiserouten mit mehreren Städten Schwierigkeiten hatten, übertraf Mind Evolution konsequent, wobei es hohe Erfolgsraten auch bei zunehmender Anzahl von Beschränkungen beibehielt.

Herausforderungen und zukünftige Richtungen

Trotz seines Erfolgs ist Mind Evolution nicht ohne Einschränkungen. Der Ansatz erfordert erhebliche Rechenressourcen aufgrund der iterativen Bewertung und Verfeinerung. Zum Beispiel verbrauchte die Lösung einer TravelPlanner-Aufgabe mit Mind Evolution drei Millionen Token und 167 API-Anrufe – wesentlich mehr als herkömmliche Methoden. Allerdings bleibt der Ansatz effizienter als Brute-Force-Strategien wie die exhaustive Suche.

Darüber hinaus kann die Entwicklung effektiver Fitness-Funktionen für bestimmte Aufgaben eine herausfordernde Aufgabe sein. Zukünftige Forschung kann sich auf die Optimierung der Recheneffizienz und die Erweiterung der Technik auf eine breitere Palette von Problemen konzentrieren, wie kreatives Schreiben oder komplexe Entscheidungsfindung.

Ein weiteres interessantes Forschungsgebiet ist die Integration von domänen-spezifischen Evaluatoren. Zum Beispiel kann die Einbindung von Expertenwissen in die Fitness-Funktion in der medizinischen Diagnose die Genauigkeit und Zuverlässigkeit des Modells weiter verbessern.

Anwendungen jenseits der Planung

Obwohl Mind Evolution hauptsächlich auf Planungsaufgaben ausgewertet wird, kann es auf verschiedene Domänen angewendet werden, wie kreatives Schreiben, wissenschaftliche Entdeckung und sogar Code-Generierung. Zum Beispiel haben Forscher einen Benchmark namens StegPoet vorgestellt, der das Modell dazu herausfordert, versteckte Nachrichten in Gedichten zu kodieren. Obwohl diese Aufgabe immer noch schwierig ist, übertrifft Mind Evolution herkömmliche Methoden mit Erfolgsraten von bis zu 79,2 %.

Die Fähigkeit, Lösungen in natürlicher Sprache anzupassen und zu entwickeln, eröffnet neue Möglichkeiten für die Bewältigung von Problemen, die schwierig zu formalisieren sind, wie die Verbesserung von Workflows oder die Generierung innovativer Produkt-Designs. Durch die Nutzung der Kraft evolutionärer Algorithmen bietet Mind Evolution einen flexiblen und skalierbaren Rahmen für die Verbesserung der Problemlösungsfähigkeiten von LLMs.

Zusammenfassung

DeepMinds Mind Evolution stellt eine praktische und effektive Möglichkeit dar, um wichtige Einschränkungen in LLMs zu überwinden. Durch die Verwendung von iterativer Verfeinerung, inspiriert von der natürlichen Selektion, verbessert es die Fähigkeit dieser Modelle, komplexe, mehrschrittige Aufgaben zu bewältigen, die strukturiertes Denken und Planen erfordern. Der Ansatz hat bereits einen signifikanten Erfolg in herausfordernden Szenarien wie Reiseplanung gezeigt und verspricht vielversprechende Ergebnisse in verschiedenen Domänen, einschließlich kreativem Schreiben, wissenschaftlicher Forschung und Code-Generierung. Während Herausforderungen wie hohe Rechenkosten und die Notwendigkeit gut gestalteter Fitness-Funktionen bestehen bleiben, bietet der Ansatz einen skalierbaren Rahmen für die Verbesserung von KI-Fähigkeiten. Mind Evolution ebnet den Weg für leistungsfähigere KI-Systeme, die in der Lage sind, zu denken und zu planen, um reale Herausforderungen zu bewältigen.

Dr. Tehseen Zia

Dr. Tehseen Zia ist ein fest angestellter Associate Professor an der COMSATS University Islamabad, der einen PhD in KI von der Vienna University of Technology, Österreich, besitzt. Er spezialisiert sich auf künstliche Intelligenz, Machine Learning, Data Science und Computer Vision und hat mit Veröffentlichungen in renommierten wissenschaftlichen Zeitschriften wesentliche Beiträge geleistet. Dr. Tehseen hat auch verschiedene industrielle Projekte als Principal Investigator geleitet und als KI-Berater fungiert.