Künstliche Intelligenz
Wir stimmen AIs nicht mehr ab. Wir stimmen Zivilisationen ab

Für viele Jahre war die wichtigste Frage in der künstlichen Intelligenz (KI), wie man KI-Modelle mit menschlichen Werten abstimmen kann. Forscher versuchten, Sicherheitsregeln, ethische Prinzipien und Kontrollmechanismen zu definieren, die KI-Entscheidungen leiten. Diese Arbeit hat erhebliche Fortschritte erzielt. Aber jetzt, da diese KI-Systeme leistungsfähiger und verbreiteter werden, beginnt sich der Fokus der Abstimmung zu verschieben. Was als Herausforderung begann, ein einzelnes Modell an eine einzige Anweisung abzustimmen, ist jetzt die viel größere Herausforderung, ganze Zivilisationen abzustimmen, die diese Systeme auf globaler Ebene nutzen. KI ist nicht mehr nur ein Werkzeug. Es entwickelt sich zu einer Umgebung, in der Gesellschaften arbeiten, kommunizieren, verhandeln und konkurrieren. Als Ergebnis bleibt die Abstimmung nicht mehr ein technisches Problem. Es ist ein zivilisatorisches Problem. In diesem Artikel erkläre ich, warum die Abstimmung nicht mehr nur um Modelle geht und warum wir beginnen müssen, in Begriffen von Zivilisationen und nicht mehr in Begriffen von Maschinen zu denken. Ich diskutiere auch, wie diese Verschiebung unsere Verantwortlichkeiten beeinflusst und was sie für die globale Zusammenarbeit bedeutet.
Wessen Werte repräsentiert KI wirklich?
Wenn Sie eine KI nach einem sensiblen historischen Ereignis fragen, hängt ihre Antwort von den Daten ab, die sie studiert hat. Wenn diese Daten hauptsächlich aus dem westlichen Internet stammen, wird die Antwort eine westliche Voreingenommenheit haben. Sie wird Individualismus, freie Rede und demokratische Ideale priorisieren. Diese Werte sind für viele Menschen gut. Aber sie sind nicht die einzigen Werte in der Welt.
Ein Benutzer in Singapur, ein Benutzer in Riad und ein Benutzer in San Francisco haben unterschiedliche Definitionen davon, was “hilfreich” und was “schädlich” ist. In einigen Kulturen ist soziale Harmonie wichtiger als absolute Rede- und Meinungsfreiheit. In anderen ist Respekt vor Hierarchien wichtiger als Störung.
Wenn ein Unternehmen aus dem Silicon Valley “Reinforcement Learning from Human Feedback” (RLHF) verwendet, heuern sie Menschen an, um die Antworten der KI zu bewerten. Aber wer sind diese Menschen? Was sind ihre Überzeugungen? Wenn sie das Modell mit amerikanischen Standards abstimmen, bauen sie unbeabsichtigt ein amerikanisches Kultur-Exportprodukt. Sie bauen einen digitalen Diplomaten, der die Regeln einer bestimmten Zivilisation auf den Rest der Welt aufzwingt.
Der Aufstieg von Feedback-Schleifen
Die Herausforderung besteht nicht nur darin, dass KI die Überzeugungen einer Kultur widerspiegelt. Es geht darum, wie diese Überzeugungen uns verändern können. Moderne KI-Systeme haben das Potenzial, das Verhalten von Individuen, Organisationen und sogar Nationen zu beeinflussen. Sie können beeinflussen, wie wir denken, arbeiten, vertrauen und konkurrieren. Dies schafft Feedback-Schleifen zwischen KI-Systemen und menschlichen Gesellschaften; wir trainieren KI und KI formt, wie wir denken und handeln. Diese Schleifen werden stärker, da KI immer verbreiteter wird. Um zu sehen, wie diese Feedback-Schleife funktioniert, hier zwei Beispiele:
- Die großflächige KI-Implementierung verändert das soziale Verhalten, und das soziale Verhalten verändert die Daten, die neue Systeme trainieren. Zum Beispiel kann ein Empfehlungsalgorithmus beeinflussen, was Menschen sehen, lesen und glauben. Produktivitätstools verändern, wie Teams zusammenarbeiten und wie Studenten lernen. Diese Veränderungen im Verhalten verändern die Datenmuster in Form von unterschiedlichen Sehgewohnheiten, Kommunikationsmustern am Arbeitsplatz oder Schreibstilen. Wenn diese Daten in zukünftige Trainingsdatensätze fließen, passen die Modelle ihre Annahmen und Ausgaben entsprechend an. Das menschliche Verhalten formt die Modelle, und die Modelle formen wiederum das menschliche Verhalten.
- Automatisierte Entscheidungstools beeinflussen die öffentliche Politik, und die öffentliche Politik beeinflusst die zukünftige Modell-Trainierung. Zum Beispiel verwenden viele Regierungen jetzt KI, um vorzuschlagen, wo Ressourcen wie Gesundheitsunterstützung oder Kriminalitätsrisiken alloziert werden sollten. Wenn Politiker auf diese Empfehlungen reagieren, werden die Ergebnisse dieser Entscheidungen später Teil neuer Datensätze. Im Laufe der Zeit werden politische Entscheidungen, die von KI geprägt sind, die nächste Generation von KI-Modellen formen.
Sobald man diese Feedback-Schleife erkennt, wird klar, dass KI allmählich Zivilisationen formt und abstimmt. Als Ergebnis beginnen Nationen zu fragen: Wie können sie ihre Werte schützen, während sie KI in ihre Gesellschaften und Institutionen integrieren?
Die Entstehung von souveräner KI
Diese Abstimmungsherausforderung hat eine erhebliche Reaktion von Regierungen auf der ganzen Welt ausgelöst. Nationen haben erkannt, dass die Abhängigkeit von importierter KI ein Risiko für ihre Souveränität darstellt. Sie können es sich nicht leisten, dass ihre Bürger von einer Black Box ausgebildet, informiert und beraten werden, die wie ein Fremder denkt.
Diese Erkenntnis hat zu dem Aufstieg von “souveräner KI” geführt.” Frankreich investiert heavily, um Modelle zu bauen, die Französisch sprechen und französisches Recht und Kultur verstehen. Indien baut indigene KI-Modelle, um sicherzustellen, dass ihre kulturellen Werte respektiert werden. Die Vereinigten Arabischen Emirate und China bauen KI-Modelle, die mit ihren eigenen nationalen Visionen abgestimmt sind.
Dies ist der neue Wettlauf. Es ist ein Wettlauf um die narrative Kontrolle. Eine Zivilisation, die keine eigene KI hat, wird schließlich ihre eigene Erinnerung verlieren. Wenn Ihre Kinder einer Maschine eine Frage stellen und die Maschine mit der Logik einer anderen Kultur antwortet, beginnt Ihre Kultur zu erodieren. Diese Erkenntnis kann jedoch zur Bildung von unterschiedlichen digitalen Blöcken führen. Wir könnten schließlich mit einer westlichen KI, einer chinesischen KI, einer indischen KI und so weiter enden. Diese Systeme werden mit unterschiedlichen Fakten und unterschiedlichen moralischen Kompassen operieren. Diese Entwicklungen machen es klar, dass wir, wenn wir ein einziges, wirklich abgestimmtes KI-Modell schaffen wollen, erst einen Weg finden müssen, Zivilisationen abzustimmen.
Bedarf an diplomatischer KI
Die traditionelle Abstimmung geht davon aus, dass ein Modell durch sorgfältiges Training, Prompting und Sicherheitsvorkehrungen abgestimmt werden kann. Dieses Denken stammt aus der technischen Denkweise der frühen KI-Sicherheitsforschung. Aber sogar eine perfekte Modell-Abstimmung kann die Herausforderungen der Abstimmung von Zivilisationen nicht lösen. Die Abstimmung kann nicht stabil bleiben, wenn Gesellschaften in entgegengesetzte Richtungen ziehen. Wenn Länder, Unternehmen und Gemeinschaften widersprüchliche Ziele haben, werden sie KI-Systeme dazu bringen, diese Konflikte widerzuspiegeln. Diese Grenzen zeigen, dass die Abstimmung nicht nur ein technisches Problem ist. Es ist ein Regierungs-, kulturelles und Koordinationsproblem. Und diese Probleme erfordern nicht nur Experten oder Entwickler. Sie erfordern ganze Zivilisationen.
Wie gehen wir also vor? Wenn wir akzeptieren, dass eine universelle Abstimmung unmöglich ist, müssen wir unsere Strategie ändern. Wir müssen aufhören, nach einer technischen Lösung für ein philosophisches Problem zu suchen. Wir müssen anfangen, wie Diplomaten zu denken. Wir werden Protokolle für “Zivilisations-Abstimmung” entwickeln müssen. Wir müssen herausfinden, wie KI die Überzeugungen und Werte einer Gesellschaft respektieren kann, ohne die Überzeugungen anderer Kulturen aufzudrängen. Mit anderen Worten, wir benötigen eine digitale Vereinte Nationen für unsere Algorithmen.
Dies erfordert Transparenz. Derzeit wissen wir nicht wirklich, welche Werte in den tiefen Schichten eines neuronalen Netzes versteckt sind. Wir sehen nur die Ausgabe. Um Zivilisationen abzustimmen, müssen wir klar über die “Verfassung” jedes Modells sein. Ein Modell sollte in der Lage sein, seine Voreingenommenheit zu erklären. Es sollte in der Lage sein zu sagen: “Ich bin auf diesen Daten trainiert, mit diesen Sicherheitsregeln, mit Priorisierung dieser Werte.” Erst wenn die Voreingenommenheit sichtbar ist, können wir dem System vertrauen. Ein Benutzer sollte in der Lage sein, zwischen Perspektiven zu wechseln. Sie sollten in der Lage sein, eine Frage zu stellen und zu sehen, wie ein “westliches” Modell antwortet im Vergleich zu einem “östlichen” Modell. Dies würde KI in ein Werkzeug für das Verständnis verwandeln, anstatt in ein Werkzeug für die Indoktrination.
Das Fazit
Wir haben zu viel Zeit damit verbracht, uns über den Terminator Sorgen zu machen. Das wahre Risiko ist nicht, dass ein Roboter uns zerstört. Das wahre Risiko ist, dass ein Roboter uns vergessen lässt, wer wir sind. Die Abstimmung ist nicht ein Code, den wir einmal schreiben und vergessen können. Es ist eine ständige Verhandlung mit KI-Modellen, um sicherzustellen, dass sie mit unseren Überzeugungen und Werten abgestimmt bleiben. Es ist ein politischer Akt. Wenn wir in diese nächste Phase des Zeitalters der Intelligenz eintreten, müssen wir über den Bildschirm hinaussehen. Wir müssen berücksichtigen, wie KI unsere Geschichte, unsere Grenzen und unsere Überzeugungen interpretiert. Wir bauen die Köpfe, die uns helfen werden, die Welt zu regieren. Wir müssen sicherstellen, dass diese Köpfe die Unterschiede zwischen Zivilisationen respektieren.












