Connect with us

2026 Prognosen: Von der Kommodifizierung von LLMs bis zum Zeitalter des agentischen Gedächtnisses

Vordenker

2026 Prognosen: Von der Kommodifizierung von LLMs bis zum Zeitalter des agentischen Gedächtnisses

mm

Am Anfang von 2025 habe ich die Kommodifizierung von Large Language Models vorhergesagt.

Als die Token-Preise zusammenbrachen und Unternehmen von Experimenten zur Produktion übergingen, wurde diese Vorhersage schnell zur Realität und veränderte, wie AI-Systeme aufgebaut und verwaltet werden, auf dem Weg ins Jahr 2026.

Was 2025 richtig gemacht hat

Mehrere Trends, die im letzten Jahr noch ungewiss schienen, haben sich nun materialisiert.

Erstens wurden LLMs zu grundlegender AI-Infrastruktur. Kostenreduzierungen und verbesserte Inferenz-Pipelines haben viele Workloads in die Produktion getrieben, insbesondere für einfache Aufgaben wie Entitätsextraktion, Klassifizierung und Zusammenfassung. Die Frage für Unternehmen ist nicht mehr “welches Modell sollten wir verwenden?”, sondern “wie können wir Systeme entwerfen, die Modell-Wechsel überstehen können?”

Zweitens haben sich Agenten als in der Lage erwiesen, massive Mengen an Unternehmens-Text zu verarbeiten. Führungskräfte wurden weiterhin von dem Chaos herausgefordert, das Compliance-Dokumentation mit sich bringt, wenn man Daten extrahieren möchte, um Entscheidungen zu treffen. Kommunikationsdaten, die zuvor in E-Mails, Tickets und Chat-Protokollen ignoriert wurden, werden jetzt aktiv von Agenten verwendet, um Erkenntnisse und Empfehlungen zu liefern. Dies ähnelt der ersten großen Datenwelle der frühen 2010er Jahre, als günstiger Speicher und neue Tools schlafende Datensätze freischalteten.

Drittens ist symbolisches Wissen stillschweigend zurückgekehrt. Wissensgraphen, die einst als teuer und zerbrechlich galten, haben durch GraphRAG und agentengetriebene Extraktion ein neues Leben gefunden. Unvollkommene Graphen haben sich als nützlich erwiesen. Iteration ist jetzt wichtiger als vorherige Perfektion. Dies ist nicht nur eine Umbenennung, sondern eine echte Verschiebung in der Art und Weise, wie symbolische und statistische Systeme zusammenarbeiten.

Schließlich hat Feinabstimmung wieder an Bedeutung gewonnen. Da in-context-Lernen bei latenzsensitiven und vernunftsbasierten Aufgaben Grenzen aufwies, sind kleinere spezialisierte Modelle wieder attraktiv geworden. Die Branche hat eine alte Wahrheit wiederentdeckt: nicht jedes Problem benötigt ein gigantisches allgemeines Modell.

Während diese Trends essentiell geworden sind, wird der eigentliche Wendepunkt im Jahr 2026 eintreten.

Agentisches Gedächtnis wird grundlegend

Im Jahr 2026 werden Agenten aufhören, stateless-Tools zu sein, und beginnen, wie Systeme mit Gedächtnis zu handeln.

Hier entsteht die Idee des agentischen Gedächtnisses. Es ist verlockend, dies als Umbenennung von Wissensgraphen zu beschreiben, aber diese Beschreibung verfehlt den Punkt. Agentisches Gedächtnis ist eine Evolution. Es kombiniert strukturierte symbolische Darstellungen mit der Fähigkeit von Agenten, zu vernünftigen, zu aktualisieren und über die Zeit zu handeln.

Gedächtnis ist das, was Agenten von reaktiven Respondern in Entscheidungssysteme verwandelt. Ohne es wiederholen Agenten Arbeit, halluzinieren Kontext und lernen nicht aus vergangenen Aktionen. Mit ihm können Unternehmen AI-Systeme aufbauen, die institutionelles Wissen ansammeln, anstatt es bei jedem Prompt zu verwerfen.

Modell-Merging ersetzt Modell-Verehrung

Eine der am wenigsten diskutierten Entwicklungen ist der Aufstieg von Modell-Merging und verteilter Ausbildung. Anstatt monolithische Modelle von Anfang an auszubilden, zerlegen Forscher das Problem zunehmend. Kleinere spezialisierte Modelle werden unabhängig ausgebildet und dann kombiniert.

Dieser Ansatz erschien zunächst in Forschungswettbewerben und experimentellen Herausforderungen. Im Jahr 2025 hat er sich zu vollständigen Tutorials und produktionsreifen Pipelines entwickelt. Öffentliche Beispiele, einschließlich verteilter Trainings-Experimente von Cohere, signalisieren eine breitere Verschiebung.

Im Jahr 2026 werden wir einen echten Markt für kleinere Sprachmodelle sehen, die Unternehmen besitzen, komponieren und anpassen können. Der Schwerpunkt verlagert sich von “wer hat das größte Modell” zu “wer kann das effektivste System aufbauen”.

AI für Wissenschaft verlässt das Labor

AI für Wissenschaft ist nicht länger nur ein Forschungscuriosum. Im Jahr 2025 zogen Physik-, Biologie- und Materialwissenschaft-Workshops auf großen Konferenzen unerwartete Menschenmengen an. Reiche Stiftungen und private Spender begannen, große wissenschaftliche AI-Bemühungen zu finanzieren. Startups entstanden mit einem klaren Fokus auf Arzneimittelentdeckung, Materialdesign und Simulation.

Im Jahr 2026 wird der Werteschaffungsprozess beginnen. Wenn AI die Entdeckung eines neuen Antibiotikums, einer Krebsbehandlung oder eines neuen Materials beschleunigt, überwiegt die Rendite die Rechenkosten. Dies macht wissenschaftliche AI zu einer der wirtschaftlich am besten vertretbaren Anwendungen im Feld.

Allerdings wird AI keine neuen physikalischen Gesetze zauberhaft hervorbringen. AlphaFold gelang, weil das Problem gut definiert war. Physik fehlt immer noch ihr Hilbert-Moment, eine klare, gemeinsame Definition der Kernprobleme, die gelöst werden müssen. Die Definition der richtigen Probleme bleibt eine menschliche Aufgabe.

Beweis für Content-Erstellung wächst an Bedeutung

Eine der überraschendsten Erkenntnisse des letzten Jahres kam nicht von Technologen, sondern von Soziologen.

Das größte Risiko von generativer AI ist nicht der Verlust von Arbeitsplätzen. Es ist die Erosion des Beweises. Beweis der Urheberschaft. Beweis der Arbeit. Beweis der Echtheit. Beweis der Menschlichkeit.

Wenn AI-generierter Content jedes Medium flutet, werden Gesellschaften neue Mechanismen fordern, um zu überprüfen, wer was erstellt hat. Hier kommen Ideen aus Kryptographie und Blockchains wieder in die Diskussion, nicht als spekulative Vermögenswerte, sondern als Infrastruktur für Zuschreibung und Verifizierung.

AI kann zum Katalysator werden, der diesen Systemen endlich einen echten Zweck gibt.

Agenten lernen durch Tools, nicht durch Text

LLMs, die mit Tools ausgestattet sind, sind grundlegend anders als Chatbots. Das wichtigste Tool für Agenten heute ist der Terminal.

Benchmarks wie Terminal Bench formalisieren diese Verschiebung. Agenten, die mit Kommandozeilen, APIs und Umgebungen interagieren, lernen durch Tun. Frontier-Labore geben jetzt Hunderte von Millionen Dollar aus, um hochqualifizierte Aufgaben-Daten zu erwerben, um diese Agenten zu trainieren.

Die Datensätze sind privat und fragmentiert, was eine wichtige Nebenwirkung hat. Modelle werden aufhören, gleich zu denken. Wenn Trainingsdaten divergieren, werden Frontier-Modelle unterschiedliche Fähigkeiten und Denkstile entwickeln. Homogenität war ein vorübergehendes Artefakt geteilter Daten. Vielfalt kehrt zurück.

Wenn Codier-Assistenten wie Claude Code und OpenAI Codex Tag für Tag verbessert werden, destillieren wir Menschen Wissen aus ihnen in Form von Software. In der Tat beginnt dies, dem zu ähneln, was einige als Software-Destillen bezeichnen, wo große Modelle helfen, Systeme zu entwerfen, die dann in günstigere, aufgabenorientierte Software destilliert werden, die rechnerisch günstiger auf CPUs läuft als direkt von Frontier-Modellen ausgeführt. Wenn Token-Generierung wesentlich günstiger wird und Codier-Assistenten viel sophistizierter sind, könnte Software selbst zu einer Sache der Vergangenheit werden, da Menschen möglicherweise im Loop sein müssen. Diese Idee klingt heute unglaubwürdig, aber so würde auch die Idee klingen, dass Milliarden von Transistoren eines Tages in ein Mobiltelefon passen könnten, in den 1960er Jahren.

Blick nach vorn

Wenn 2025 das Jahr war, in dem LLMs billig wurden, wird 2026 das Jahr sein, in dem Intelligenz strukturiert wird.

Die Gewinner werden nicht diejenigen sein, die die größten Modelle haben, sondern diejenigen, die Systeme aufbauen, die sich erinnern, vernünftigen, zuschreiben und evolvieren. AI ist nicht länger nur um rohe Fähigkeiten, sondern um Architektur.

Und dort werden die nächsten echten Fortschritte stattfinden.

2026 wird das Jahr sein, in dem Intelligenz strukturiert wird. Die Gewinner werden nicht diejenigen sein, die die größten Modelle haben, sondern diejenigen, die Systeme aufbauen, die sich erinnern, vernünftigen, zuschreiben und evolvieren. AI ist nicht länger nur um rohe Fähigkeiten, sondern um Architektur. Und dort werden die nächsten echten Fortschritte stattfinden.

Nikolaos Vasiloglou ist der VP of Research ML bei RelationalAI. Er hat seine Karriere damit verbracht, ML-Software zu entwickeln und Datenwissenschaftsprojekte im Einzelhandel, Online-Werbung und Sicherheit zu leiten. Er ist Mitglied der ICLR/ICML/NeurIPS/UAI/MLconf/KGC/IEEE S&P-Gemeinschaft und hat als Autor, Rezensent und Organisator von Workshops und der Hauptkonferenz fungiert. Nikolaos leitet die Forschung und strategischen Initiativen im Bereich von Large Language Models und Knowledge Graphs für RelationalAI.