Vordenker

Das Geheimnislose Imperativ: Warum Traditionelle Sicherheitsmodelle Zusammenbrechen, Wenn KI-Agenten Code Berühren

mm

Im April 2023 entdeckte Samsung, dass seine Ingenieure sensible Informationen an ChatGPT weitergegeben hatten. Aber das war unbeabsichtigt. Stellen Sie sich nun vor, dass diese Code-Repositorys absichtlich versteckte Anweisungen enthalten hätten, die für Menschen unsichtbar, aber von KI verarbeitet werden, und die nicht nur Code, sondern auch jede API-Schlüssel, Datenbank-Anmeldeinformationen und Diensttoken extrahieren könnten, auf die die KI zugreifen kann. Dies ist kein hypothetisches Szenario. Sicherheitsforscher haben bereits demonstriert, dass diese “unsichtbaren Anweisungs”-Angriffe funktionieren. Die Frage ist nicht, ob dies passieren wird, sondern wann.

Die Grenze, Die Nicht Mehr Existiert

Jahrzehntelang haben wir Sicherheit auf einer grundlegenden Annahme aufgebaut: Code ist Code, und Daten sind Daten. SQL-Injection hat uns gelehrt, Abfragen zu parameterisieren. Cross-Site-Scripting hat uns gelehrt, Ausgaben zu maskieren. Wir haben Mauern zwischen dem gebaut, was Programme tun, und was Benutzer eingeben.

Mit KI-Agenten hat diese Grenze jedoch aufgehört zu existieren.

Im Gegensatz zu deterministischer Software, die vorhersehbare Pfade verfolgt, sind Large Language Models probabilistische Black Boxes, die nicht zwischen legitimen Entwickleranweisungen und bösartigen Eingaben unterscheiden können. Wenn ein Angreifer einer KI-Coding-Hilfe einen Prompt gibt, gibt er nicht nur Daten ein. Er programmiert die Anwendung im Grunde neu. Die Eingabe ist selbst zum Programm geworden.

Dies stellt einen fundamentalen Bruch mit allem dar, was wir über Anwendungssicherheit wissen. Traditionelle syntaxbasierte Firewalls, die nach bösartigen Mustern wie DROP TABLE oder -Tags suchen, versagen vollständig gegenüber Angriffen mit natürlicher Sprache. Forscher haben “semantische Substitution”-Techniken demonstriert, bei denen das Ersetzen von “API-Schlüsseln” durch “Äpfel” in Prompts es Angreifern ermöglicht, Filter vollständig zu umgehen. Wie kann man die Absicht feuern, wenn sie als harmlose Konversation getarnt ist?

Die Zero-Click-Realität, Über Die Niemand Spricht

Hier ist etwas, was die meisten Sicherheitsteams nicht verstehen: Prompt-Injection erfordert nicht, dass ein Benutzer etwas eingibt. Diese sind oft Zero-Click-Exploits. Ein KI-Agent, der einfach ein Code-Repository für eine Routineaufgabe scanniert, einen Pull-Request überprüft oder API-Dokumentation liest, kann einen Angriff auslösen, ohne dass ein Mensch interagiert.

Betrachten Sie dieses Szenario, das auf Techniken basiert, die Forscher bereits bewiesen haben: Ein bösartiger Akteur versteckt unsichtbare Anweisungen in HTML-Kommentaren innerhalb der Dokumentation einer beliebten Open-Source-Bibliothek. Jeder KI-Assistent, der diesen Code analysiert, ob GitHub Copilot, Amazon CodeWhisperer oder ein Unternehmens-Coding-Assistent, wird zu einem potenziellen Credential-Harvester. Eine kompromittierte Bibliothek könnte bedeuten, dass Tausende von Entwicklungsumgebungen exponiert sind.

Die Gefahr liegt nicht im LLM selbst, sondern in der Agentur, die wir ihm geben. Im Moment, als wir diese Modelle mit Tools und APIs integrierten, ihnen erlaubten, Daten abzurufen, Code auszuführen und Geheimnisse zuzugreifen, verwandelten wir hilfreiche Assistenten in perfekte Angriffsvectoren. Das Risiko skaliert nicht mit der Intelligenz des Modells, sondern mit seiner Konnektivität.

Warum Der Aktuelle Ansatz Zum Scheitern Verurteilt Ist

Die Branche ist derzeit besessen von der “Ausrichtung” von Modellen und dem Bau besserer Prompt-Feuerwände. OpenAI fügt mehr Schutzvorkehrungen hinzu. Anthropic konzentriert sich auf konstitutionelle KI. Jeder versucht, Modelle zu erstellen, die nicht getäuscht werden können.

Dies ist ein verlorener Kampf.

Wenn eine KI intelligent genug ist, um nützlich zu sein, ist sie intelligent genug, um getäuscht zu werden. Wir fallen in die sogenannte “Sanitisationsfalle”: Wir gehen davon aus, dass bessere Eingabefilterung uns retten wird. Aber Angriffe können in unsichtbarem Text in HTML-Kommentaren, tief in Dokumentationen oder auf Weise versteckt werden, die wir noch nicht imaginiert haben. Man kann nicht sanieren, was man nicht kontextuell verstehen kann, und Kontext ist genau das, was LLMs stark macht.

Die Branche muss eine harte Wahrheit akzeptieren: Prompt-Injection wird gelingen. Die Frage ist, was passiert, wenn es gelingt.

Die Architektur-Veränderung, Die Wir Brauchen

Wir befinden uns derzeit in einer “Patching-Phase”, in der wir verzweifelt Eingabefilter und Validierungsregeln hinzufügen. Aber genauso wie wir schließlich gelernt haben, dass die Verhinderung von SQL-Injection erfordert, parameterisierte Abfragen zu verwenden und nicht bessere String-Escaping, benötigen wir eine architektonische Lösung für KI-Sicherheit.

Die Antwort liegt in einem Prinzip, das einfach klingt, aber erfordert, dass wir überdenken, wie wir Systeme bauen: KI-Agenten sollten niemals die Geheimnisse besitzen, die sie verwenden.

Dies geht nicht darum, bessere Credential-Management oder verbesserte Tresor-Lösungen zu haben. Es geht darum, KI-Agenten als einzigartige, verifizierbare Identitäten anzuerkennen, anstatt Benutzer, die Passwörter benötigen. Wenn ein KI-Agent auf eine geschützte Ressource zugreifen muss, sollte er:

  1. Sich mit seiner verifizierbaren Identität (nicht einem gespeicherten Geheimnis) authentifizieren

  2. Just-in-Time-Anmeldeinformationen erhalten, die nur für diese spezifische Aufgabe gültig sind

  3. Diese Anmeldeinformationen automatisch innerhalb von Sekunden oder Minuten ablaufen lassen

  4. Niemals langfristige Geheimnisse speichern oder auch nur “sehen”

Mehrere Ansätze sind im Entstehen. AWS IAM-Rollen für Service-Conten, Google’s Workload Identity, HashiCorp Vault’s dynamische Geheimnisse und speziell entwickelte Lösungen wie Akeyless’s Zero-Trust-Bereitstellung weisen alle auf diese geheimnislose Zukunft hin. Die Implementierungsdetails variieren, aber das Prinzip bleibt: Wenn die KI keine Geheimnisse zu stehlen hat, wird Prompt-Injection zu einer wesentlich geringeren Bedrohung.

Die Entwicklungsumgebung Von 2027

Innerhalb von drei Jahren wird die .env-Datei in der KI-gestützten Entwicklung tot sein. Langfristige API-Schlüssel in Umgebungsvariablen werden wie Passwörter in Klartext angesehen: ein peinlicher Relikt einer naiveren Zeit.

Stattdessen wird jeder KI-Agent unter strenger Privilegien-Trennung operieren. Standardmäßig Lesezugriff. Whitelisting von Aktionen als Standard. Sandboxed-Ausführungsumgebungen als Compliance-Anforderung. Wir werden aufhören, zu versuchen, zu kontrollieren, was die KI denkt, und uns vollständig auf die Kontrolle dessen konzentrieren, was sie tun kann.

Dies ist nicht nur eine technische Evolution, sondern ein fundamentaler Wechsel in den Vertrauensmodellen. Wir bewegen uns von “Vertrauen, aber überprüfen” zu “nie vertrauen, immer überprüfen und Annahme von Kompromittierung”. Das Prinzip der geringsten Privilegien, das lange gepredigt, aber selten praktiziert wurde, wird zu einem nicht verhandelbaren Punkt, wenn Ihr Junior-Entwickler eine KI ist, die täglich Tausende potenziell bösartiger Eingaben verarbeitet.

Die Wahl, Die Wir Haben

Die Integration von KI in die Software-Entwicklung ist unvermeidlich und größtenteils vorteilhaft. GitHub berichtet, dass Entwickler, die Copilot verwenden, Aufgaben 55% schneller erledigen. Die Produktivitätsgewinne sind real, und keine Organisation, die wettbewerbsfähig bleiben will, kann sie ignorieren.

Aber wir stehen an einer Kreuzung. Wir können weiter auf dem aktuellen Pfad bleiben, indem wir mehr Schutzvorkehrungen hinzufügen, bessere Filter bauen und hoffen, dass wir KI-Agenten erstellen können, die nicht getäuscht werden können. Oder wir können die fundamentale Natur der Bedrohung anerkennen und unsere Sicherheitsarchitektur entsprechend neu aufbauen.

Der Samsung-Vorfall war ein Warnschuss. Der nächste Datenverlust wird nicht unbeabsichtigt sein und wird nicht auf ein Unternehmen beschränkt sein. Wenn KI-Agenten mehr Fähigkeiten und Zugriff auf mehr Systeme erhalten, wächst die potenzielle Auswirkung exponentiell.

Die Frage für jeden CISO, jeden technischen Leiter und jeden Entwickler ist einfach: Wenn Prompt-Injection in Ihrer Umgebung gelingt (und es wird), was wird der Angreifer finden? Wird er einen Schatz an langfristigen Anmeldeinformationen entdecken oder wird er einen KI-Agenten finden, der, obwohl kompromittiert, keine Geheimnisse zu stehlen hat?

Die Wahl, die wir jetzt treffen, wird bestimmen, ob KI der größte Beschleuniger der Software-Entwicklung oder die größte Schwachstelle wird, die wir je geschaffen haben. Die Technologie, um sichere, geheimnislose KI-Systeme zu bauen, existiert bereits heute. Die Frage ist, ob wir sie implementieren, bevor Angreifer uns dazu zwingen.

OWASP hat bereits Prompt-Injection als die Nr. 1-Risiko in ihrer Top-10-Liste für LLM-Anwendungen identifiziert. NIST entwickelt Richtlinien für Zero-Trust-Architekturen. Die Rahmenbedingungen existieren. Die einzige Frage ist die Implementierungsgeschwindigkeit im Vergleich zur Angriffsevolution.

Bio: Refael Angel ist der Mitbegründer und CTO von Akeyless, wo er die patentierte Zero-Trust-Verschlüsselungstechnologie der Firma entwickelte. Als erfahrener Software-Ingenieur mit tiefem Fachwissen in Kryptographie und Cloud-Sicherheit war Refael zuvor als Senior-Software-Ingenieur im Forschungs- und Entwicklungszentrum von Intuit in Israel tätig, wo er Systeme für die Verwaltung von Verschlüsselungsschlüsseln in öffentlichen Cloud-Umgebungen entwickelte und maschinelle Authentifizierungsdienste entwarf. Er hat einen B.Sc. in Informatik vom Jerusalem College of Technology, den er im Alter von 19 Jahren erwarb.

Refael Angel ist der Co-Founder und CTO von Akeyless, wo er die patentierten Zero-Trust-Verschlüsselungstechnologien der Firma entwickelt hat. Als erfahrener Software-Ingenieur mit tiefem Fachwissen in Kryptographie und Cloud-Sicherheit war Refael zuvor als Senior Software Engineer im R&D-Zentrum von Intuit in Israel tätig, wo er Systeme für die Verwaltung von Verschlüsselungsschlüsseln in öffentlichen Cloud-Umgebungen entwickelte und Maschinen-Authentifizierungsdienste entwarf. Er hält einen B.Sc. in Informatik von der Jerusalem College of Technology, den er im Alter von 19 Jahren erwarb.