Ethik

5 Grundpfeiler für verantwortungsvolle KI

mm

Wir erleben ein überwältigendes Wachstum von KI/ML-Systemen, um die Ozeane von Daten zu verarbeiten, die in der neuen digitalen Wirtschaft generiert werden. Allerdings muss mit diesem Wachstum auch ernsthaft über die ethischen und rechtlichen Auswirkungen von KI nachgedacht werden.

Wenn wir immer komplexeren und wichtigeren Aufgaben KI-Systemen anvertrauen, wie zum Beispiel die automatische Kreditgenehmigung, müssen wir absolut sicherstellen, dass diese Systeme verantwortungsvoll und vertrauenswürdig sind. Die Reduzierung von Vorurteilen in KI ist ein riesiges Forschungsgebiet für viele Forscher und hat enorme ethische Auswirkungen, ebenso wie die Menge an Autonomie, die wir diesen Systemen geben.

Das Konzept von verantwortungsvoller KI ist ein wichtiger Rahmen, der dazu beitragen kann, Vertrauen in Ihre KI-Implementierungen aufzubauen. Es gibt fünf Kern-Grundpfeiler für verantwortungsvolle KI. Dieser Artikel wird diese erkunden, um Ihnen zu helfen, bessere Systeme zu entwickeln.

1. Reproduzierbarkeit

Es gibt ein altes Sprichwort in der Software-Entwicklungs-Welt, das lautet: “Hey, es funktioniert auf meinem Rechner” Im Bereich von ML und KI könnte das Sprichwort lauten: “Hey, es funktioniert mit meinem Datensatz.” Das bedeutet, dass maschinelle Lernmodelle oft wie eine Blackbox wirken. Viele Trainingsdatensätze können inhärente Vorurteile wie Stichproben-Vorurteile oder Bestätigungs-Vorurteile haben, die die Genauigkeit des Endprodukts verringern.

Um KI/ML-Systeme reproduzierbarer und damit genauer und vertrauenswürdiger zu machen, ist der erste Schritt, die MLOps-Pipeline zu standardisieren. Selbst die intelligentesten Datenwissenschaftler haben ihre bevorzugten Technologien und Bibliotheken, was bedeutet, dass die Feature-Engineering und die resultierenden Modelle nicht einheitlich von Person zu Person sind. Durch den Einsatz von Tools wie MLflow kann die MLOps-Pipeline standardisiert und diese Unterschiede reduziert werden.

Ein weiterer Weg, um KI/ML-Systeme reproduzierbarer zu machen, ist durch den Einsatz von sogenannten “Gold-Datensätzen”. Diese sind repräsentative Datensätze, die im Wesentlichen als Tests und Validierung neuer Modelle dienen, bevor sie für die Produktion freigegeben werden.

2. Transparenz

Wie bereits erwähnt, sind viele ML-Modelle, insbesondere neuronale Netze, Blackboxes. Um sie rechenschaftspflichtiger zu machen, müssen sie interpretierbarer werden. Für einfache Systeme wie Entscheidungsbäume ist es relativ einfach, zu verstehen, wie und warum das System eine bestimmte Entscheidung getroffen hat, aber mit zunehmender Genauigkeit und Komplexität eines KI-Systems sinkt oft seine Interpretierbarkeit.

Es gibt ein neues Forschungsgebiet namens “Erklärbarkeit”, das versucht, auch komplexe KI-Systeme wie neuronale Netze und Deep Learning transparenter zu machen. Diese verwenden Proxy-Modelle, um die Leistung eines neuronalen Netzes zu kopieren, aber sie versuchen auch, gültige Erklärungen für wichtige Merkmale zu liefern.

All dies führt zu Fairness; Sie möchten wissen, warum eine bestimmte Entscheidung getroffen wurde und sicherstellen, dass diese Entscheidung fair ist. Sie möchten auch sicherstellen, dass unangemessene Merkmale nicht berücksichtigt werden, um Vorurteile in Ihr Modell zu vermeiden.

3. Rechenschaftspflicht

Vielleicht der wichtigste Aspekt von verantwortungsvoller KI ist die Rechenschaftspflicht. Es gibt viele Diskussionen über dieses Thema, sogar im Regierungssektor, da es sich mit den Richtlinien befasst, die KI-Ergebnisse bestimmen. Dieser richtlinienbasierte Ansatz bestimmt, in welchem Stadium Menschen in die Schleife einbezogen werden sollten.

Rechenschaftspflicht erfordert robuste Überwachung und Metriken, um Richtlinien-Entscheidern und KI/ML-Systemen zu helfen. Rechenschaftspflicht verbindet im Wesentlichen Reproduzierbarkeit und Transparenz, aber sie benötigt effektive Aufsicht in Form von KI-Ethik-Komitees. Diese Komitees können Richtlinien-Entscheidungen treffen, entscheiden, was wichtig zu messen ist, und Fairness-Überprüfungen durchführen.

4. Sicherheit

KI-Sicherheit konzentriert sich auf die Vertraulichkeit und Integrität von Daten. Wenn Systeme Daten verarbeiten, möchten Sie, dass sie in einer sicheren Umgebung sind. Sie möchten, dass die Daten sowohl verschlüsselt sind, wenn sie in Ihrer Datenbank ruhen, als auch, wenn sie über die Pipeline aufgerufen werden, aber es gibt immer noch Schwachstellen, wenn sie als Klartext in ein maschinelles Lernmodell eingespeist werden. Technologien wie homomorphe Verschlüsselung lösen dieses Problem, indem sie es ermöglichen, maschinelles Lernen in einer verschlüsselten Umgebung durchzuführen.

Ein weiterer Aspekt ist die Sicherheit des Modells selbst. Zum Beispiel ermöglichen Modell-Inversions-Angriffe es Hackern, die Trainingsdaten zu erlernen, die zum Aufbau des Modells verwendet wurden. Es gibt auch Modell-Vergiftungs-Angriffe, die schlechte Daten in das Modell während des Trainings einfügen und seine Leistung vollständig zerstören. Das Testen Ihres Modells auf Angriffe wie diese kann es sicher und sicher halten.

5. Datenschutz

Google und OpenMined sind zwei Organisationen, die kürzlich den Datenschutz von KI priorisiert haben, und OpenMined hat kürzlich eine Konferenz zu diesem Thema ausgerichtet. Mit neuen Vorschriften wie der DSGVO und dem CCPA und möglicherweise weiteren Vorschriften, die folgen, wird der Datenschutz eine zentrale Rolle bei der Ausbildung von maschinellen Lernmodellen spielen.

Ein Weg, um sicherzustellen, dass Sie die Daten Ihrer Kunden auf datenschutzfreundliche Weise verarbeiten, ist der Einsatz von verteiltem Lernen. Diese dezentralisierte Methode des maschinellen Lernens trainiert verschiedene Modelle lokal und aggregiert jedes Modell in einem zentralen Hub, während die Daten sicher, sicher und privat bleiben. Eine weitere Methode ist die Einführung von statistischem Rauschen, damit die individuellen Werte der Kunden nicht durchsickern. Dies ermöglicht es Ihnen, mit dem Gesamtwert zu arbeiten, sodass die Daten eines Einzelnen intakt und dem Algorithmus nicht zugänglich sind.

Verantwortungsvolle KI

 Letztendlich ist es die Verantwortung jeder Organisation, die KI/ML-Systeme entwickelt, diese verantwortungsvoll zu halten. Durch die gezielte Verfolgung von Technologien innerhalb dieser fünf Aspekte von verantwortungsvoller KI können Sie nicht nur von der Macht der künstlichen Intelligenz profitieren, sondern dies auch auf eine vertrauenswürdige und einfache Weise tun, die Ihre Organisation, Kunden und Aufsichtsbehörden beruhigen wird.

Dattaraj Rao, Chief Data Scientist bei Persistent Systems, ist der Autor des Buches “Keras to Kubernetes: The Journey of a Machine Learning Model to Production.” Bei Persistent Systems leitet Dattaraj das AI Research Lab, das state-of-the-art-Algorithmen in Computer Vision, Natural Language Understanding, Probabilistic Programming, Reinforcement Learning, Explainable AI usw. erforscht und deren Anwendbarkeit in den Bereichen Gesundheitswesen, Banking und Industrie demonstriert. Dattaraj hält 11 Patente im Bereich Machine Learning und Computer Vision.