Künstliche Intelligenz

MARKLLM: Ein Open-Source-Toolkit für LLM-Wasserzeichen

Published July 9, 2024

Updated April 4, 2026

Kunal Kejriwal

MARKLLM: An Open-Source Toolkit for LLM Watermarking

LLM-Wasserzeichen, das unauffällige, aber erkennbare Signale in Modellausgaben integriert, um Texte zu identifizieren, die von LLMs generiert wurden, ist entscheidend, um den Missbrauch von großen Sprachmodellen zu verhindern. Diese Wasserzeichen-Techniken werden hauptsächlich in zwei Kategorien unterteilt: die KGW-Familie und die Christ-Familie. Die KGW-Familie modifiziert die Logits, die von der LLM produziert werden, um wassermarkierte Ausgaben zu erstellen, indem sie das Vokabular in eine grüne Liste und eine rote Liste basierend auf dem vorherigen Token unterteilt. Eine Voreinstellung wird den Logits der grünen Liste-Token während der Textgenerierung hinzugefügt, wodurch diese Token im produzierten Text bevorzugt werden. Ein statistischer Metrik wird dann aus dem Verhältnis der grünen Wörter berechnet und eine Schwelle wird festgelegt, um zwischen wassermarkierten und nicht-wassermarkierten Texten zu unterscheiden. Verbesserungen der KGW-Methode umfassen eine verbesserte Listenteilung, bessere Logit-Manipulation, erhöhte Wasserzeichen-Informationsspeicherkapazität, Widerstandsfähigkeit gegen Wasserzeichen-Entfernungsangriffe und die Fähigkeit, Wasserzeichen öffentlich zu erkennen.

Im Gegensatz dazu ändert die Christ-Familie den Stichproben-Prozess während der LLM-Textgenerierung, indem sie ein Wasserzeichen einbettet, indem sie ändert, wie Token ausgewählt werden. Beide Wasserzeichen-Familien zielen darauf ab, die Erkennbarkeit des Wasserzeichens mit der Textqualität in Einklang zu bringen, wobei Herausforderungen wie Robustheit in verschiedenen Entropie-Einstellungen, Erhöhung der Wasserzeichen-Informationsspeicherkapazität und Schutz vor Entfernungsversuchen berücksichtigt werden. Jüngste Forschungen haben sich auf die Verfeinerung der Listenteilung und Logit-Manipulation konzentriert, die Erhöhung der Wasserzeichen-Informationsspeicherkapazität, die Entwicklung von Methoden zur Abwehr von Wasserzeichen-Entfernungsangriffen und die Ermöglichung der öffentlichen Erkennung. Letztendlich ist LLM-Wasserzeichen entscheidend für die ethische und verantwortungsvolle Verwendung von großen Sprachmodellen, da es eine Methode bietet, um LLM-generierte Texte zu verfolgen und zu verifizieren. Die KGW- und Christ-Familien bieten zwei unterschiedliche Ansätze, die jeweils ihre eigenen Stärken und Anwendungen haben und kontinuierlich durch laufende Forschung und Innovation weiterentwickelt werden.

… (rest of the content remains the same, following the exact same structure and translation rules)

Kunal Kejriwal

Ein Ingenieur von Beruf, ein Schriftsteller von Herzen. Kunal ist ein technischer Schriftsteller mit einer tiefen Liebe und einem tiefen Verständnis für KI und ML, der sich der Aufgabe widmet, komplexe Konzepte in diesen Bereichen durch seine ansprechenden und informativen Dokumentationen zu vereinfachen.

Unite.AI

MARKLLM: Ein Open-Source-Toolkit für LLM-Wasserzeichen

You may like