Vordenker
Wie man generative KI-Stimmen ethisch für Geschäfte im Jahr 2023 nutzt

Das Ende von 2022 kam auf den Höhepunkt der weiten Verbreitung von KI-Technologien aufgrund der atemberaubenden Popularität von OpenAI und ChatGPT. Erstmals erreichte KI eine Massenmarktattraktivität, indem sie ihre Nützlichkeit und ihren Wert bei der Erstellung erfolgreicher Geschäftsergebnisse bewies.
Viele KI-Technologien, die für den durchschnittlichen Menschen im Jahr 2023 wie eine Revolution erscheinen, werden tatsächlich bereits seit mehreren Jahren von großen Unternehmen und Medien aktiv genutzt. Begleiten Sie mich, während ich einen genaueren Blick auf die Technologie werfe, die diese Lösungen antreibt, insbesondere generative KI-Systeme für Voice-Cloning, ihre Geschäftsvorteile und ethische Ansätze für die Nutzung von KI.
Wie funktioniert Voice-Cloning?
Kurz gesagt, ermöglicht Voice-Cloning es einer Person, mit der Stimme einer anderen Person zu sprechen.
Es verwendet generative KI-Technologie, um Aufnahmen einer Person’s Stimme zu erstellen und diese zu verwenden, um neue Audioinhalte mit derselben Stimme zu generieren. Es ermöglicht im Wesentlichen, zu hören, was jemand gesagt hätte, auch wenn er es selbst nicht gesagt hat.
Auf der technischen Seite scheinen die Dinge nicht sehr kompliziert zu sein. Aber wenn man ein wenig tiefer eintaucht, gibt es einige Mindestanforderungen, um loszulegen:
- Sie benötigen mindestens 5 Minuten hochwertiger Aufnahmen der Quellstimme, um sie zu klonen. Diese Aufnahmen sollten klar und frei von Hintergrundgeräuschen oder anderen Verzerrungen sein, da jede Unvollkommenheit die Genauigkeit der Ausgabe des Modells beeinträchtigen kann.
- Anschließend füttern Sie diese Aufnahmen in ein generatives KI-Modell, um ein “Stimmen-Avatar” zu erstellen.
- Dann trainieren Sie das Modell, um die Sprechmuster in Tonhöhe und Timing genau zu reproduzieren.
- Sobald dies abgeschlossen ist, kann das trainierte Modell unbegrenzte Inhalte mit der Quellstimme einer anderen Person generieren und wird so zu einem effektiven Werkzeug für die Erstellung realistisch klingender Replik-Stimmen.
Dies ist der Punkt, an dem viele ethische Bedenken äußern. Was passiert, wenn wir jeden Text in den Mund einer anderen Person einfügen können und es unmöglich ist zu sagen, ob diese Worte echt oder falsch sind?
Ja, diese Möglichkeit ist bereits seit Langem Realität. Wie im Fall von OpenAI und ChatGPT stehen wir derzeit vor einer Reihe von ethischen Problemen, die nicht ignoriert werden können.
Ethische Standards in KI
Wie bei vielen anderen neuen Technologien in ihren Anfangsstadien der Einführung ist die Hauptbedrohung die Schaffung eines negativen Stigmas um die Technologie herum, anstatt die Bedrohungen als Quelle für Diskussion und wertvolles Wissen anzuerkennen. Wichtig ist, die Methoden aufzudecken, die böswillige Akteure verwenden, um die Technologie und ihre Produkte zu missbrauchen, und Mitigationswerkzeuge anzuwenden und weiter zu lernen.
Heute haben wir drei Schichten von Rahmenbedingungen für ethische Standards in Bezug auf die Nutzung von generativer KI. Die nationalen und supranationalen Regulierungsebenen sind in ihrer Anfangsphase der Entwicklung. Die Politikwelt kann nicht mit der Geschwindigkeit der Entwicklung von aufkommender Technologie Schritt halten, aber wir können bereits beobachten, wie die EU mit dem EU-Vorschlag für die KI-Regulierung und Der 2022 Code of Practice on Disinformation die Erwartungen für große Technologieunternehmen zur Bekämpfung der Verbreitung von bösartigem KI-manipuliertem Inhalt umreißt. Auf nationaler Ebene sehen wir regulatorische Erstschritte durch die USA und das Vereinigte Königreich bei der Behandlung des Problems mit dem US- National Deepfake and Digital Provenance Task Force und dem UK- Online Safety Bill.
Die Schicht der Technologiebranche bewegt sich schneller, da Unternehmen und Technologen diese neue Realität im Hinblick auf aufkommende Technologien und ihre Auswirkungen auf die gesellschaftliche Sicherheit und den Datenschutz annehmen. Das Gespräch über die Ethik von generativer KI ist lebendig und hat den Weg für die Entwicklung von Brancheninitiativen für Verhaltenskodizes bei der Nutzung von generativer KI (z. B. The Partnership on AI Synthetic Media Code of Conduct) und ethische Aussagen, die von verschiedenen Unternehmen veröffentlicht wurden, geebnet. Die Frage ist, wie man das Verhalten praktisch umsetzt? Und können sie Produkte, bestimmte Funktionen und Verfahren von Teams beeinflussen?
Nachdem ich an diesem Problem mit einer Reihe von verschiedenen Medien- und Unterhaltungs-, Cybersicherheits- und KI-Ethik-Communities gearbeitet habe, habe ich einige praktische Grundsätze für die Behandlung von KI-Inhalten und -Stimmen insbesondere entwickelt:
- Eigentümer von geistigen Eigentumsrechten und das Unternehmen, das die geklonte Stimme nutzt, können viele der potenziellen Komplikationen, die mit der Verwendung von Originalstimmen verbunden sind, vermeiden, indem sie rechtliche Vereinbarungen treffen.
- Projektbesitzer sollten die Verwendung einer geklonten Stimme öffentlich bekannt geben, damit die Hörer nicht getäuscht werden.
- Unternehmen, die an KI-Technologie für Stimmen arbeiten, sollten einen Prozentsatz ihrer Ressourcen für die Entwicklung von Technologie bereitstellen, die in der Lage ist, KI-generierte Inhalte zu erkennen und zu identifizieren.
- Das Kennzeichnen von KI-generierten Inhalten mit Wasserzeichen ermöglicht die Authentifizierung von Stimmen.
- Jeder KI-Dienstleister sollte jedes Projekt auf seine Auswirkungen (gesellschaftlich, geschäftlich und privat) überprüfen, bevor er sich bereit erklärt, daran zu arbeiten.
Natürlich werden die Grundsätze der Ethik in KI die Verbreitung von selbstgemachten Deep Fakes im Internet nicht beeinflussen. Sie werden jedoch alle Projekte im Graubereich aus der Reichweite des öffentlichen Marktes drängen.
Im Jahr 2021-22 wurden KI-Stimmen in verschiedenen Mainstream-Projekten verwendet, die erhebliche Auswirkungen auf Ethik und Gesellschaft hatten. Dazu gehörten das Klonen der jungen Luke Skywalkers Stimme für die Mandalorian-Serie, KI-Stimme für God of War 2 und Richard Nixons Stimme für die historische ‘In Event of Moon Disaster’-Rede.
Das Vertrauen in die Technologie wächst über Medien und Unterhaltung hinaus. Traditionelle Unternehmen in vielen Branchen nutzen geklonte Stimmen in ihren Projekten. Hier sind einige der bekanntesten Anwendungsfälle.
Branchen-Anwendungsfälle
Im Jahr 2023 wird das Voice-Cloning weiter ansteigen, während verschiedene Unternehmen von seinen zahlreichen Vorteilen profitieren werden. Von der Gesundheitsbranche und dem Marketing bis hin zum Kundenservice und der Werbeindustrie revolutioniert das Voice-Cloning, wie Organisationen Beziehungen zu ihren Kunden aufbauen und ihre Arbeitsabläufe optimieren.
Das Voice-Cloning bietet Gesundheitsfachleuten und Sozialarbeitern, die in einer Online-Umgebung arbeiten, Vorteile. Digitale Avatare mit der gleichen Stimme wie medizinische Fachleute fördern eine stärkere Bindung zwischen ihnen und ihren Patienten, was das Vertrauen und die Kundenbindung erhöht.
Die potenziellen Anwendungen von Voice-Cloning in der Film- und Unterhaltungsindustrie sind vielfältig. Das Synchronisieren von Inhalten in mehrere Sprachen, die Erstellung von Dialogen für Kinder und Erwachsene und eine fast unendliche Anzahl von Anpassungsoptionen sind alle durch diese Technologie möglich.
Ähnlich verhält es sich im Betriebsbereich, wo KI-gesteuertes Voice-Cloning hervorragende Ergebnisse für Marken liefern kann, die kosteneffiziente Lösungen für interaktive Sprachsysteme oder Unternehmensvideos benötigen. Mit der Sprachsynthesetechnologie können Schauspieler ihre Reichweite erweitern und ihre Fähigkeit, Residualzahlungen von Aufnahmen zu erhalten, erhöhen.
Schließlich hat das Aufkommen von Voice-Cloning in der Werbeindustrie dazu geführt, dass die Kosten und die Anzahl der Stunden, die für die Produktion von Werbespots benötigt werden, erheblich reduziert wurden. Solange eine hochwertige Aufnahme für das Klonen verfügbar ist (auch von nicht verfügbaren Schauspielern), können Werbespots schnell und kreativer produziert werden als je zuvor.
Interessanterweise können Unternehmen und kleine und mittelständische Unternehmen von Voice-Cloning profitieren, um etwas Einzigartiges für ihre Marken zu schaffen. Große Projekte können ihre ambitioniertesten Pläne realisieren, während kleine Unternehmen auf previously kostspielige Skalenniveaus zugreifen können. Das ist, was wahre Demokratisierung bedeutet.
Zusammenfassung
KI-Stimmenkloning bietet Unternehmen revolutionäre Vorteile, wie die Schaffung einzigartiger Kundenerlebnisse, die Integration von natürlicher Sprachverarbeitung in ihre Produkte und Dienstleistungen und die Erstellung hochgenauer Nachahmungen von Stimmen, die völlig real klingen.
Unternehmen, die ihren Wettbewerbsvorteil im Jahr 2023 aufrechterhalten möchten, sollten sich mit KI-Stimmenkloning auseinandersetzen. Unternehmen können diese Technologie nutzen, um eine Vielzahl von neuen Möglichkeiten zu erschließen, um Marktanteile zu gewinnen und Kunden zu binden, und dies auf eine ethisch verantwortungsvolle Weise tun.












