Vordenker

Milla Jovovichs MemPalace willkommene Lösung fĂŒr das GedĂ€chtnisproblem von KI

mm
A woman standing in a luminous, neoclassical hallway, interacting with glowing holographic data structures representing a

Millionen von Menschen öffnen täglich ein Chat-Fenster und beginnen, sich einer künstlichen Intelligenz (KI) zu erklären. Sie hört aufmerksam zu, generiert sofort eine clever klingende Antwort und vergisst dann, wenn die Sitzung endet, jedes einzelne Detail über die Interaktion.

Das Ausmaß dieser Zeremonie ist atemberaubend. ChatGPT allein bearbeitet über eine Milliarde Anfragen pro Tag, mit mehr als 800 Millionen wöchentlich aktiven Nutzern im späten Jahr 2025. Die Verbreitung von generativer KI hat über 16% der Weltbevölkerung erreicht, eine Zahl, die vor drei Jahren nicht existierte.

Eine enorme Infrastruktur mit steigenden Umweltkosten unterstützt dieses Modell: US-amerikanische Rechenzentren verbrauchten 2024 183 Terawattstunden Strom, mehr als 4% des gesamten Stromverbrauchs des Landes, oder etwa gleich viel wie der jährliche Strombedarf Pakistans.

Aufgrund des Mangels an Gedächtnis von KI-Systemen wird ein großer Teil dieser Energie für die erneute Herstellung von Kontext verschwendet. Wiederholte Erklärungen, Projektneuvorstellungen und Kontextabläufe am Anfang jeder Sitzung sind verschwendete Rechenleistung.

Gedächtnis ist das, was ein Werkzeug zu einem Mitarbeiter macht

KI-Assistenten haben standardmäßig kein persistentes Gedächtnis. Das wäre nicht wichtig, wenn wir KI wie einen Taschenrechner verwenden: eine Zahl eingeben, ein Ergebnis erhalten, weitermachen.

Aber die meisten Menschen verwenden es nicht mehr auf diese Weise. Sie führen lange, iterative, tief kontextuelle Gespräche mit der KI – bauen Dinge über Wochen oder Monate auf, entwickeln eine gemeinsame Sprache, Entscheidungen und Geschichte. Die Menge an Kontext, den die KI zu jedem Zeitpunkt im Kopf behalten kann, kann je nach Abonnement-Tarif variieren.

Bisher hat sich KI als wunderbares Werkzeug erwiesen, aber seit den frühen Entwicklungsstadien hat sie darauf abgezielt, als Begleiter angesehen zu werden. Diese Ambition erfordert Gedächtnis. Ohne es wird der Fortschritt weiterhin zurückgesetzt.

Ein persistentes Gedächtnis ändert, was KI in der Praxis tun kann. Ein Entwickler erhält eine KI, die architektonische Entscheidungen und die dahinter stehende Argumentation behält. Ein Team erhält eine KI, die die Projektgeschichte kennt, ohne dass sie erneut instruiert werden muss. Ein Schriftsteller erhält eine KI, die über die Zeit hinweg Wissen über seine Arbeit angesammelt hat. Die Fähigkeit des Modells ist weniger wichtig als die Frage, ob es tatsächlich Wissen über die Person angesammelt hat, die es verwendet.

Warum dies schwer zu lösen war

Die Herausforderung besteht nicht nur im Speicher, sondern in der Wiederabrufbarkeit. Theoretisch kann man jede vergangene Konversation in eine neue Sitzung einfügen. Aber das wird schnell rechenintensiv. Kontextfenster, obwohl sie sich erweitern, sind nicht unendlich. Den Abfall von Monaten unstrukturierter Chats in einen Prompt zu dumpen, ist nicht nur ineffektiv, sondern auch zeitaufwändig und energieintensiv.

Paras Pandey, ein Dateningenieur, bringt die Kernschwierigkeit einfach zum Ausdruck: “KI-Gedächtnis ist eigentlich ein Wiederabruf-Fidelity-Problem, das als Speicherproblem verkleidet ist. Man kann alles persistent speichern, das Schwierige ist, den richtigen Teil davon zur Inferenzzeit abzurufen, ohne die Lücken zu halluzinieren. Das ist ein schwierigeres Problem, das wir in Datenbanken seit Jahren lösen, und das Feld ist immer noch in den Anfängen.”

Die aktuellen Ansätze für KI-Gedächtnis beinhalten, dass Systeme entscheiden, was es wert ist, sich zu merken. Aber es zuzulassen, dass KI entscheidet, was wichtig ist, wirft oft genau den nuancierten Kontext weg, der den ursprünglichen Austausch wertvoll gemacht hat. Man behält die allgemeine Idee, aber verliert das gesamte Gespräch, in dem man spezifische Bedenken erläutert hat, und die Alternativen, die man in Betracht gezogen und abgelehnt hat.

Das ideale Szenario wäre, die richtigen Informationen zum richtigen Zeitpunkt auffindbar zu machen.

MemPalace kommt ins Spiel

Genau dieses Problem zielt MemPalace an, ein kürzlich veröffentlichtes Open-Source-Projekt. Anstatt zu zusammenfassen oder wegzuschmeißen, speichert es Gespräche vollständig und baut eine navigierbare Struktur um sie herum, indem es auf die antike griechische Technik des Gedächtnispalastes zurückgreift, bei der Redner Ideen in bestimmten Räumen eines imaginierten Gebäudes mental platzierten, um sie später abrufen zu können.

Was MemPalace bemerkenswert macht, ist nicht nur die Eleganz des Ansatzes. Es sind die Ergebnisse. In Standard-Akademikern für KI-Gedächtnisabruf hat MemPalace die höchsten Punktzahlen, die jemals für ein kostenloses System veröffentlicht wurden, und es tut dies, während es vollständig auf Ihrem eigenen Rechner läuft, ohne Abonnement, ohne Cloud-Abhängigkeit und ohne externe API.

Konkurrierende kommerzielle Dienste verlangen zwischen 20 und 250 Dollar pro Monat für vergleichbare und oft schlechter performende Funktionalität.

Diese Kombination aus Spitzenleistung, vollständig lokaler Ausführung und völlig kostenlos ist ungewöhnlich genug, um ihr Beachtung zu schenken. Und da sie auf Ihrem Hardware läuft und nicht auf Remote-Servern, ist jede Anfrage, die Sie über MemPalace leiten, eine, die nicht zum ansteigenden Energieverbrauch der Rechenzentrumsindustrie beiträgt.

Das größere Bild

MemPalace ist ein Projekt, aber es weist auf etwas Größeres hin: die Erkenntnis, dass persistentes Gedächtnis kein Premium-Add-on für KI-Systeme ist, sondern eine grundlegende Leistung für die neuen Anwendungsfälle von KI.

Das Projekt wurde von einem kleinen Team, Milla Jovovich (Ja, die Schauspielerin aus Resident Evil), Ben Sigman und Claude, erstellt und hat nur sieben Commits.

Dass ein System, das kommerzielle Produkte mit dedizierten Ingenieursteams übertrifft, aus einem so schlanken Aufwand stammt, sagt etwas über die wahre Schwierigkeit aus.

Das Problem lag nicht bei Computern oder Ressourcen. Es lag bei einem klareren Modell davon, was Gedächtnis eigentlich tun muss.

Juan Pablo Aguirre Osorio ist ein freiberuflicher Reporter fĂŒr Espacio Media Incubator. Mit einer Ausbildung in Full-Stack-Engineering bringt Juan Pablo eine technische Kompetenz in seine Berichterstattung ĂŒber innovative Technologien, einschließlich KI, mit. Seine Arbeiten wurden in HackerNoon, The Sociable und anderen veröffentlicht, und er war zuvor Student Ambassador bei Microsoft.