Vordenker
Wenn die “Kenntnisse” von KI 50 Jahre alt sind: Das Compliance-Risiko, das Sie nicht ignorieren können

Das Problem der falschen KI-Erkenntnisse ist eine dringende Herausforderung, da Unternehmen ihre Nutzung generativer Tools erhöhen. Trotz der weit verbreiteten Begeisterung über die Adoption von KI gibt es auch eine starke Strömung der Kritik. Kritische Kommentatoren weisen oft auf offensichtlich zufällige, unvorhersehbare Ungenauigkeiten in der Ausgabe von KI hin, die ihren Wert untergraben – und können sogar realen Schaden für Menschen verursachen, insbesondere in Branchen wie Gesundheitswesen und Verkehr, wo falsche Ausgaben theoretisch zu allem führen könnten, von der falschen Verschreibung bis hin zu Zügen, die auf Kollisionskurs sind.
Oftmals werden diese Ungenauigkeiten auf KI-“Halluzinationen” zurückgeführt – Instanzen, in denen die KI eine “beste Schätzung”-Antwort generiert, die mit dem gleichen Vertrauen wie eine “echte” Antwort übermittelt wird, anstatt den Benutzer über eine Lücke in ihrem Wissen oder ihrer Fähigkeit zu informieren. Halluzinationen können anfangs schwer zu erkennen sein – aber es gibt ein ruhigeres, ebenso ernstes Problem, das noch schwerer zu erkennen ist.
Schulden bei der Datenqualität: Der Achillesferse von KI
Wenn KI-Systeme aus veralteten, unvollständigen oder ungenauen Daten schöpfen, treten falsche Ausgaben auf, aber sie sind weniger sofort erkennbar. Zum Beispiel könnten Sie eine KI bitten, die Symptome einer medizinischen Erkrankung zu identifizieren und eine Antwort basierend auf einer 50 Jahre alten Studie erhalten, anstatt auf aktuellen Forschungsergebnissen. Das Ergebnis ist unwahrscheinlich, offensichtlich, lächerlich falsch – aber diese anfängliche Fassade der Plausibilität birgt ein reales Risiko für den betreffenden Patienten und den Gesundheitsdienstleister.
Das gleiche gilt für alle Branchen – wenn die Daten, die an die KI-Modelle gespeist werden, alte, veraltete oder unvollständige Informationen enthalten, besteht ein hohes Risiko für falsche Ausgaben. Und da mehr Unternehmen KI in geschäftskritische Prozesse integrieren, wächst das Risiko, falsche Schlussfolgerungen aus schlecht verwalteten Daten zu ziehen.
Genauigkeit für den Regulator
Dies ist nicht nur ein Problem für den täglichen Betrieb – es ist auch eine erhebliche Compliance-Herausforderung. Die regulatorischen Anforderungen entwickeln sich schnell, um Bedenken hinsichtlich ungenauer KI zu adressieren. Zum Beispiel haben sich einige frühe regulatorische Maßnahmen im Bereich KI ereignet; insbesondere als Italien ChatGPT vorübergehend verbot, und die EU-Datenschutzbehörde eine spezielle Taskforce ins Leben rief, um mögliche Durchsetzungsmaßnahmen gegen ChatGPT zu koordinieren.
Eine der aussagekräftigsten regulatorischen Änderungen war die Verabschiedung des EU-KI-Gesetzes, des ersten umfassenden Rechtsrahmens für KI. Das Gesetz legt Verpflichtungen basierend auf dem Risikograd der KI-Systeme fest, von “inakzeptablen Risiken”, die verboten sind, bis hin zu “hochriskanten” Systemen, die strenge Anforderungen an Transparenz, Datenqualität, Governance und menschliche Aufsicht unterliegen.
Die Bedeutung des EU-KI-Gesetzes liegt nicht in seinem ambitionierten Umfang, sondern wichtig ist, dass es einen Präzedenzfall schafft. Regulierungsbehörden machen deutlich, dass KI an bindende, durchsetzbare Regeln unterliegen wird und dass Organisationen Compliance und Transparenz im Hinblick auf die Verwendung von KI als integralen Bestandteil der KI-Adoption und nicht als Nachgedanke behandeln müssen.
Das Gesetz hat einen weiten Anwendungsbereich und kann einen großen Teil der KI-Entwicklungen beeinflussen. Im Kern geht es darum, KI sicher zu machen, während fundamentale Rechte und Werte respektiert werden. Im Rahmen dieses neuen, prinzipiellen Ökosystems wird die Diagnose potenzieller Quellen für KI-Genauigkeiten vorgenommen, einschließlich der Daten und Datensätze, die die Modelle speisen, der Modell-Opazität und des Zugriffs sowie des System-Designs und der Nutzung. KI-Lösungen sind ein Konstrukt aus allen drei – Probleme mit einem dieser Aspekte können zu negativen Ergebnissen führen. Darüber hinaus besteht die Datenmenge, die in die Entwicklung, Bereitstellung und den Betrieb von KI eingeht, wahrscheinlich hauptsächlich aus Geschäftsunterlagen, die selbst verschiedenen Compliance-Anforderungen unterliegen.
Mit anderen Worten, die regulatorische Umgebung im Bereich KI wird zunehmend strenger – und das gilt ebenso für die Daten, die in KI-Modelle eingespeist werden, wie für die Daten, die ausgegeben werden, obwohl letztere mehr Aufmerksamkeit erhalten.
Fünf Schritte, um KI konform, aktuelle und relevante Daten zu speisen
Um diese doppelte Herausforderung zu meistern – sowohl die konforme Datenverwaltung als auch die hohe Qualität der Eingabedaten, die eine hohe Qualität der Ausgabedaten ermöglicht – benötigen Unternehmen Kontrolle über die Trainings- und Inferenzdaten. Leider fehlt es vielen Unternehmen noch an dieser Kontrolle.
Organisationen sollten mindestens ihre umfassenderen Compliance- und Governance-Programme auf KI-Initiativen anwenden. Sie müssen beginnen, geeignete Aufzeichnungen über die Daten zu erstellen, die sie KI-Modellen speisen, wie Modelle und Systeme entworfen werden sowie die Entscheidungen und Inhalte, die über KI generiert werden.
Es ist jedoch auch von entscheidender Bedeutung, dass Organisationen einen Schritt weiter gehen und sicherstellen, dass sie die volle Kontrolle über alle Daten haben, die möglicherweise in KI-Einsätzen verwendet werden könnten, sei es für die anfängliche Schulung oder die “Live”-Arbeit. Dazu ist eine hochwertige Datenverwaltungs- und Speicherstrategie erforderlich, die sicherstellt, dass alle relevanten Daten intelligent gesammelt, bereinigt, gespeichert, klassifiziert und autorisiert werden. Um dies zu erreichen, müssen Organisationen vier wichtige Schritte berücksichtigen:
1. Datenherkunft und -ursprung
Dies umfasst die Aufzeichnung der Quelle der Daten, ihres Ursprungs, der Eigentümerschaft und aller Änderungen in den Metadaten (falls zulässig) während ihres gesamten Lebenszyklus. Es bedeutet auch, reiche Metadaten und alle zugrunde liegenden Dokumente oder Artefakte, aus denen sie abgeleitet werden, aufrechtzuerhalten.
2. Datenauthentizität
Dies erfordert die Aufrechterhaltung einer klaren Beweiskette für alle Daten, die Speicherung von Objekten in ihren natürlichen Formen und das Hashen von Objekten, die empfangen werden, um zu demonstrieren, dass die Daten unverändert bleiben. Darüber hinaus müssen Organisationen eine vollständige Audit-Historie für jedes Objekt und alle Aktionen und Ereignisse in Bezug auf Änderungen aufrechterhalten.
3. Datenklassifizierung
Die Festlegung der Art einer Menge oder eines Typs von Daten ist wichtig. Organisationen müssen in der Lage sein, strukturierte Daten, halbstrukturierte Daten und strukturierte Datensätze zu regeln. Durch die Zuweisung eines eindeutigen Schemas zu jeder Klasse können Organisationen diverse Datensätze ohne ein starres, einheitliches Ontologie-Modell verwalten – und vermeiden, dass die Daten unnötigerweise manipuliert werden, um sie in eine unflexible Datenstruktur zu zwängen.
4. Datennormierung
Die Festlegung gemeinsamer Definitionen und Formate von Metadaten ist wichtig für die Verwendung in Analytics- und KI-Lösungen. Klar definierte Schemata sind ein wichtiger Bestandteil, zusammen mit Tools, die Daten transformieren oder kartieren können, um konsistente, normierte Ansichten verwandter Daten aufrechtzuerhalten.
5. Datengenehmigungen
Unternehmen benötigen granulare Genehmigungskontrollen, einschließlich auf Objekt- oder Feldebene, basierend auf Benutzer- oder Systemprofilen. Dies bedeutet, dass die richtigen Daten für Benutzer und Systeme verfügbar sind, die dazu berechtigt sind, während der Zugriff für diejenigen, die nicht berechtigt sind, eingeschränkt oder verweigert wird.
Mit diesen entscheidenden Elementen an Ort und Stelle werden Unternehmen am besten in der Lage sein, sicherzustellen, dass die Daten, die an KI-Modelle gespeist werden, sowohl von hoher Qualität als auch konform sind. KI wird Verbesserungen und Effizienzsteigerungen in verschiedenen Branchen vorantreiben – aber damit dies geschehen kann, ist eine solide Datenbasis unerlässlich.












