Liderzy opinii

Jak używać generatywnych głosów AI w sposób etyczny w biznesie w 2023 roku

mm

Koniec 2022 roku przyniósł powszechne przyjęcie technologii AI, dzięki ogromnej popularności OpenAI i ChatGPT. Po raz pierwszy AI osiągnęło masową atrakcyjność, udowadniając swoją przydatność i wartość w tworzeniu udanych wyników biznesowych.

Wiele technologii AI, które wydają się rewolucyjne dla zwykłych ludzi w 2023 roku, było już przez kilka lat aktywnie wykorzystywanych przez duże firmy i media. Dołącz do mnie, gdy przyjrzymy się bliżej technologii napędzającej te rozwiązania, w szczególności systemom generatywnym AI do klonowania głosów, ich korzyściom biznesowym i etycznym podejściom do korzystania z AI.

Jak działa klonowanie głosów?

Krótko mówiąc, klonowanie głosów pozwala jednej osobie mówić głosem innej osoby.

Wykorzystuje technologię generatywną AI do tworzenia nagrań głosu osoby i wykorzystania ich do generowania nowych treści audio z tym samym głosem. Pozwala to ludziom usłyszeć, co ktoś by powiedział, nawet jeśli nie powiedzieli tego sami.

Z technicznego punktu widzenia, wszystko wydaje się być dość proste. Ale jeśli sięgniemy nieco głębiej, są pewne minimalne wymagania, aby zacząć:

  1. Potrzebny jest co najmniej 5 minut nagrania wysokiej jakości głosu, który chcemy sklonować. Nagrania te powinny być czyste i pozbawione szumu tła lub innych zakłóceń, ponieważ jakiekolwiek niedoskonałości mogą wpłynąć na dokładność danych wyjściowych modelu.
  2. Następnie podaj te nagrania do modelu generatywnego AI, aby utworzyć “awatar głosowy”.
  3. Następnie przeszkol model, aby dokładnie odtworzyć wzorce mowy w zakresie wysokości i czasu.
  4. Gdy zostanie to ukończone, ten przeszkolony model może generować nieograniczoną ilość treści, wykorzystując głos źródłowy innej osoby, stając się skutecznym narzędziem do tworzenia realistycznie brzmiących głosów.

To jest punkt, w którym wiele osób podnosi obawy etyczne. Co się stanie, gdy będziemy mogli wstawić dowolny tekst do ust innej osoby i nie będziemy mogli rozpoznać, czy te słowa są prawdziwe czy fałszywe?

Tak, ta możliwość już dawno stała się rzeczywistością. Jak w przypadku OpenAI i ChatGPT, obecnie mamy do czynienia z licznymi problemami etycznymi, których nie można zignorować.

Standardy etyczne w AI

Jak w przypadku wielu innych nowych technologii w ich początkowych etapach przyjęcia, głównym zagrożeniem jest stworzenie negatywnej stigmy wokół technologii, zamiast uznania zagrożeń jako źródła dyskusji i cennych informacji. Co jest ważne, to ujawnienie metod, których używają złe aktorzy, aby nadużywać technologii i jej produktów, zastosowanie narzędzi łagodzących i kontynuowanie uczenia się. 

Dziś mamy trzy warstwy ram etycznych dotyczących korzystania z generatywnej AI. Warstwy regulacyjne na poziomie krajowym i ponadnarodowym są w początkowej fazie rozwoju. Świat polityki może nie nadążać za tempem rozwoju nowych technologii, ale już teraz możemy obserwować, jak UE prowadzi w proponowanym rozporządzeniu AI i Kodzie postępowania z 2022 roku dotyczącym dezinformacji, który określa oczekiwania wobec dużych firm technologicznych w zakresie walki z rozpowszechnianiem szkodliwych treści manipulowanych za pomocą AI. Na poziomie krajowym widzimy pierwsze kroki regulacyjne podejmowane przez USA i Wielką Brytanię w celu rozwiązania problemu z Narodową grupą zadaniową ds. Deepfake i pochodzenia cyfrowego i ustawą o bezpieczeństwie online

Warstwa branży technologicznej porusza się szybciej, ponieważ firmy i technolodzy akceptują tę nową rzeczywistość w odniesieniu do nowych technologii i ich wpływu na bezpieczeństwo społeczne i prywatność. Dyskusja na temat etyki generatywnej AI jest żywa i przyczyniła się do rozwoju inicjatyw branżowych dotyczących kodeksów postępowania związanych z korzystaniem z generatywnej AI (np. Kodeks postępowania Partnership on AI Synthetic Media) oraz oświadczeń etycznych wydanych przez różne firmy. Pytanie brzmi, jak uczynić ten kodeks praktycznym? I czy są one w stanie wpłynąć na produkty, konkretnych funkcji i procedury zespołów? 

Pracując nad tym problemem z licznymi różnymi mediami i rozrywką, cyberbezpieczeństwem i społecznościami AI Ethics, sformułowałem kilka praktycznych zasad dotyczących treści i głosów AI w szczególności: 

  1. Właściciele praw autorskich i firma, która wykorzystuje sklonowany głos, mogą uniknąć wielu potencjalnych komplikacji związanych z korzystaniem z oryginalnych głosów, podpisując umowy prawne.
  2. Właściciele projektów powinni publicznie ujawnić korzystanie z sklonowanego głosu, aby słuchacze nie zostali wprowadzeni w błąd.
  3. Firmy pracujące nad technologią AI do głosów powinny przeznaczyć pewien procent zasobów na rozwój technologii, która może wykrywać i identyfikować treści generowane przez AI.
  4. Oznaczanie treści generowanych przez AI znakami wodnymi umożliwia uwierzytelnianie głosu.
  5. Każdy dostawca usług AI powinien przeglądać każdy projekt pod kątem jego wpływu (społecznego, biznesowego i prywatności) przed zgodą na pracę nad nim.

Oczywiście, zasady etyki AI nie wpłyną na rozpowszechnianie domowych deepfake w sieci. Ale będą one zmuszać projekty z szarej strefy do wycofania się z rynku publicznego.

W latach 2021-22 głosy AI były wykorzystywane w różnych projektach głównego nurtu, które wprowadziły znaczne implikacje dla etyki i społeczeństwa. Obejmowały one klonowanie głosu młodego Luke’a Skywalkera do serii Mandalorianin, głos AI dla God of War 2 oraz głos Richarda Nixona dla historycznego przemówienia “W przypadku katastrofy na Księżycu”.

Zaufanie do technologii rośnie poza mediami i rozrywką. Tradycyjne firmy z różnych branż wykorzystują sklonowane głosy w swoich projektach. Oto kilka z najbardziej prominentnych przypadków użycia.

Przypadki użycia w branży

W 2023 roku klonowanie głosów będzie kontynuowało swój rozwój wraz z różnymi firmami, które będą czerpać z jego licznych korzyści. Od opieki zdrowotnej i marketingu po obsługę klienta i branżę reklamową, klonowanie głosów rewolucjonizuje sposób, w jaki organizacje budują relacje z klientami i optymalizują swoje procesy.

Klonowanie głosów korzystnie wpływa na pracowników służby zdrowia i pracowników socjalnych, którzy pracują w środowisku online. Cyfrowe awatary z tym samym głosem, co profesjonaliści medyczni, tworzą silniejsze więzi między nimi a ich pacjentami, zwiększając zaufanie i utrzymując klientów.

Mozliwości zastosowania klonowania głosów w branży filmowej i rozrywkowej są ogromne. Dubbing treści w różnych językach, dodatkowe dialogi dla dzieci i dorosłych oraz niemal nieskończone opcje personalizacji są wszystkie możliwe dzięki tej technologii.

Podobnie, w sektorze operacyjnym, napędzane AI klonowanie głosów może przynieść doskonałe rezultaty dla marek, które potrzebują efektywnych kosztowo rozwiązań dla interaktywnych systemów odpowiedzi głosowych lub filmów szkoleniowych dla firm. Dzięki syntezie głosu, aktorzy mogą zwiększyć swój zasięg, zwiększając jednocześnie swoją zdolność do zarobku z nagraniach.

Wreszcie, w studiach produkcyjnych, pojawienie się klonowania głosów znacznie zmniejszyło koszty i liczbę godzin związanych z produkcją reklam. O ile jest dostępne nagranie o wysokiej jakości do klonowania (nawet od niedostępnych aktorów), reklamy mogą być produkowane szybko i bardziej kreatywnie niż kiedykolwiek wcześniej.

Co ciekawe, przedsiębiorstwa i małe firmy mogą skorzystać z klonowania głosów, aby stworzyć coś unikalnego dla swoich marek. Duże projekty mogą zrealizować swoje najambitniejsze plany, a małe firmy mogą uzyskać dostęp do wcześniej niedostępnych modeli skali. To jest to, co naprawdę oznacza demokratyzacja.

Podsumowanie

Klonowanie głosów AI oferuje firmom korzyści, które zmieniają grę, takie jak tworzenie unikalnych doświadczeń klientów, integrowanie naturalnych możliwości przetwarzania języka z ich produktami i usługami oraz generowanie bardzo dokładnych naśladownictw głosów, które brzmią całkowicie naturalnie.

Firmy, które chcą utrzymać swoją przewagę konkurencyjną w 2023 roku, powinny rozważyć klonowanie głosów AI. Firmy mogą wykorzystać tę technologię, aby odblokować wiele nowych możliwości, aby zdobyć udział w rynku i utrzymać klientów, robiąc to w sposób etycznie odpowiedzialny.

Anna jest Dyrektorem ds. Etyki i Partnerstw w Respeecher, nagrodzonej Emmy technologii klonowania głosu z siedzibą na Ukrainie. Anna jest byłą doradcą politycznym w Reface, aplikacji medialnej zasilanej przez sztuczną inteligencję oraz współzałożycielem technologicznym narzędzia do zwalczania dezinformacji Cappture, dofinansowanego przez program przyspieszania startupów Startup Wise Guys. Anna ma 11-letnie doświadczenie w dziedzinie polityki bezpieczeństwa i obrony, technologii oraz budowania odporności. Była również starszym współpracownikiem naukowym w Międzynarodowym Centrum Obrony i Bezpieczeństwa w Tallinie oraz w Instytucie Studiów nad Bezpieczeństwem w Pradze. Doradzała również dużym ukraińskim firmom w zakresie budowania odporności w ramach Zespołu do walki z wojną hybrydową w Szkole Ekonomicznej w Kijowie.