Vernetzen Sie sich mit uns

Künstliche Intelligenz

Zitate: Kann die neue Funktion von Anthropic das Vertrauensproblem der KI lösen?

mm

Die KI-Verifizierung ist schon seit einiger Zeit ein ernstes Problem. Große Sprachmodelle (LLMs) haben sich in unglaublichem Tempo weiterentwickelt, die Herausforderung, ihre Genauigkeit zu beweisen, ist jedoch weiterhin ungelöst.

Anthropisch versucht, dieses Problem zu lösen und meiner Meinung nach hat es von allen großen KI-Unternehmen die besten Chancen.

Das Unternehmen hat freigegeben Zitate, eine neue API-Funktion für seine Claude-Modelle Das ändert die Art und Weise, wie KI-Systeme ihre Antworten verifizieren. Diese Technologie zerlegt Quelldokumente automatisch in verdauliche Häppchen und verknüpft jede KI-generierte Aussage mit ihrer ursprünglichen Quelle – ähnlich wie bei wissenschaftlichen Arbeiten die Quellenangaben.

Citations versucht, eine der hartnäckigsten Herausforderungen der KI zu lösen: den Nachweis der Genauigkeit und Vertrauenswürdigkeit generierter Inhalte. Anstatt aufwändige, zeitnahe technische Schritte oder manuelle Überprüfungen zu erfordern, verarbeitet das System Dokumente automatisch und bietet für jede Behauptung eine Quellenüberprüfung auf Satzebene.

Die Daten zeigen vielversprechende Ergebnisse: eine 15 %ige Verbesserung der Zitatgenauigkeit im Vergleich zu herkömmlichen Methoden.

Warum das gerade jetzt wichtig ist

Vertrauen in KI ist zum entscheidenden Hindernis für die Einführung in Unternehmen (und Einzelpersonen) geworden. Da Unternehmen den experimentellen Einsatz von KI in den Kernbetrieb überführen, ist die Unfähigkeit, KI-Ergebnisse effizient zu überprüfen, zu einem erheblichen Engpass geworden.

Die aktuellen Verifizierungssysteme weisen ein klares Problem auf: Unternehmen müssen sich zwischen Geschwindigkeit und Genauigkeit entscheiden. Manuelle Verifizierungsprozesse sind nicht skalierbar, während nicht verifizierte KI-Ergebnisse zu viele Risiken bergen. Diese Herausforderung ist besonders akut in regulierten Branchen, in denen Genauigkeit nicht nur erwünscht, sondern erforderlich ist.

Citations kommt zu einem entscheidenden Zeitpunkt in der KI-Entwicklung. Da Sprachmodelle immer ausgefeilter werden, ist der Bedarf an integrierter Verifizierung proportional gestiegen. Wir müssen Systeme entwickeln, die in professionellen Umgebungen, in denen Genauigkeit nicht verhandelbar ist, zuverlässig eingesetzt werden können.

Aufschlüsselung der technischen Architektur

Die Magie von Citations liegt in seinem Ansatz zur Dokumentenverarbeitung. Citations ist nicht wie andere traditionelle KI-Systeme. Diese behandeln Dokumente oft als einfache Textblöcke. Mit Citations zerlegt das Tool Quellenmaterial in das, was Anthropic „Chunks“ nennt. Dies können einzelne Sätze oder benutzerdefinierte Abschnitte sein, die eine detaillierte Grundlage für die Überprüfung bilden.

Hier ist die technische Aufschlüsselung:

Dokumentenverarbeitung und -handhabung

Citations verarbeitet Dokumente je nach Format unterschiedlich. Für Textdateien gibt es im Wesentlichen keine Begrenzung über die Standardobergrenze von 200,000 Token für Gesamtanfragen hinaus. Dies umfasst Ihren Kontext, Eingabeaufforderungen und die Dokumente selbst.

Die Verarbeitung von PDF-Dateien ist komplexer. Das System verarbeitet PDF-Dateien visuell und nicht nur als Text, was zu einigen wichtigen Einschränkungen führt:

  • Dateigrößenbeschränkung: 32 MB
  • Maximal 100 Seiten pro Dokument
  • Jede Seite verbraucht 1,500-3,000 Token

Token-Verwaltung

Kommen wir nun zur praktischen Seite dieser Grenzen. Wenn Sie mit Citations arbeiten, müssen Sie Ihr Token-Budget sorgfältig abwägen. So sieht es aus:

Für Standardtext:

  • Volles Anforderungslimit: 200,000 Token
  • Enthält: Kontext + Eingabeaufforderungen + Dokumente
  • Keine gesonderte Gebühr für Zitierungsausgaben

Für PDFs:

  • Höherer Token-Verbrauch pro Seite
  • Visueller Verarbeitungsaufwand
  • Komplexere Token-Berechnung erforderlich

Zitate vs. RAG: Wichtige Unterschiede

Zitate sind kein Retrieval Augmented Generation (RAG) System – und dieser Unterschied ist wichtig. Während sich RAG-Systeme darauf konzentrieren, relevante Informationen aus einer Wissensdatenbank zu finden, arbeitet Citations mit Informationen, die Sie bereits ausgewählt haben.

Denk es dir so: RAG entscheidet, welche Informationen verwendet werden, während Citations dafür sorgt, dass die Informationen korrekt verwendet werden. Das bedeutet:

  • LAPPEN: Verwaltet den Informationsabruf
  • Zitate: Verwaltet die Informationsüberprüfung
  • Kombiniertes Potenzial: Beide Systeme können zusammenarbeiten

Durch diese Wahl der Architektur zeichnet sich Citations durch herausragende Genauigkeit innerhalb der bereitgestellten Kontexte aus, während Abrufstrategien ergänzenden Systemen überlassen werden.

Integrationspfade und Leistung

Die Einrichtung ist unkompliziert: Zitate durchläuft Anthropics Standard-API, das heißt, wenn Sie Claude bereits verwenden, haben Sie es schon zur Hälfte geschafft. Das System lässt sich direkt in die Messages API integrieren, sodass kein separater Dateispeicher oder komplexe Infrastrukturänderungen erforderlich sind.

Die Preisstruktur folgt dem tokenbasierten Modell von Anthropic mit einem entscheidenden Vorteil: Sie zahlen zwar für Eingabetoken aus Quelldokumenten, für die Zitierungsausgaben selbst fallen jedoch keine zusätzlichen Kosten an. Dadurch entsteht eine vorhersehbare Kostenstruktur, die sich mit der Nutzung skaliert.

Leistungskennzahlen erzählen eine überzeugende Geschichte:

  • 15 % Verbesserung der allgemeinen Zitatgenauigkeit
  • Vollständige Beseitigung der Quellhalluzinationen (von 10 % Vorkommen auf null)
  • Überprüfung auf Satzebene für jeden Anspruch

Organisationen (und Einzelpersonen), die nicht verifizierte KI-Systeme verwenden, sind im Nachteil, insbesondere in regulierten Branchen oder Umgebungen mit hohem Einsatz, in denen Genauigkeit von entscheidender Bedeutung ist.

Mit Blick auf die Zukunft werden wir wahrscheinlich Folgendes erleben:

  • Integration von Zitat-ähnlichen Funktionen wird zum Standard
  • Entwicklung von Verifizierungssystemen über Text hinaus auf andere Medien
  • Entwicklung branchenspezifischer Verifikationsstandards

Die gesamte Branche muss die Vertrauenswürdigkeit und Verifizierung von KI wirklich überdenken. Benutzer müssen an einen Punkt gelangen, an dem sie jede Behauptung problemlos überprüfen können.

Alex McFarland ist ein KI-Journalist und Autor, der sich mit den neuesten Entwicklungen in der künstlichen Intelligenz beschäftigt. Er hat mit zahlreichen KI-Startups und Publikationen weltweit zusammengearbeitet.