toco Como usar vozes de IA generativas de forma ética para os negócios em 2023 - Unite.AI
Entre em contato

Líderes de pensamento

Como usar vozes de IA generativas de maneira ética para os negócios em 2023

mm
Atualização do on

O final de 2022 veio logo após as tecnologias de IA terem uma adoção generalizada devido à popularidade impressionante do OpenAI e do ChatGPT. Pela primeira vez, a IA alcançou o apelo do mercado de massa ao provar sua utilidade e valor na criação de resultados de negócios bem-sucedidos.

Muitas tecnologias de IA que parecem uma revolução para as pessoas comuns em 2023 estão, na verdade, em uso ativo por grandes empresas e mídia há vários anos. Junte-se a mim enquanto observo mais de perto a tecnologia que alimenta essas soluções, em particular, sistemas generativos de IA para clonagem de voz, seus benefícios comerciais e abordagens éticas para o uso de IA.

Como funciona a clonagem de voz?

Resumindo, a clonagem de voz permite que uma pessoa fale usando a voz de outra pessoa.

Ele usa tecnologia de IA generativa para criar gravações da voz de uma pessoa e usá-las para gerar novo conteúdo de áudio com a voz dessa mesma pessoa. Essencialmente, permite que as pessoas ouçam o que alguém teria dito, mesmo que elas mesmas não tenham dito.

Do lado técnico, as coisas não parecem muito complicadas. Mas se você mergulhar um pouco mais fundo, existem alguns requisitos mínimos para começar:

  1. Você precisa de pelo menos 5 minutos de áudio gravado de alta qualidade da voz de origem para cloná-lo. Essas gravações devem ser nítidas e sem ruído de fundo ou outras distorções, pois qualquer imperfeição pode afetar a precisão da saída do modelo.
  2. Depois disso, alimente essas gravações em um modelo generativo de IA para criar um “avatar de voz”.
  3. Em seguida, treine o modelo para reproduzir com precisão os padrões de fala em tom e tempo.
  4. Depois de concluído, esse modelo treinado pode gerar conteúdo ilimitado usando a voz de origem de qualquer outra pessoa, tornando-se uma ferramenta eficaz para criar réplicas de vozes com som realista.

Este é o ponto em que muitos levantam questões éticas. O que acontece quando podemos inserir qualquer texto na boca de outra pessoa e é impossível saber se essas palavras são verdadeiras ou falsas?

Sim, essa possibilidade há muito se tornou uma realidade. Como no caso da OpenAI e ChatGPT, enfrentamos atualmente uma série de questões éticas que não podem ser ignoradas.

Padrões éticos em IA

Como acontece com muitas outras novas tecnologias em seus estágios iniciais de adoção, a principal ameaça é criar um estigma negativo em torno da tecnologia, em vez de reconhecer as ameaças como fonte de discussão e conhecimento valioso. O importante é expor os métodos que os malfeitores usam para abusar da tecnologia e de seus produtos, aplicar ferramentas de mitigação e continuar aprendendo. 

Hoje temos três camadas de estruturas para padrões éticos relativos ao uso de IA generativa. As camadas regulatórias nacionais e supranacionais estão em estágio inicial de desenvolvimento. O mundo da política pode não acompanhar a velocidade do desenvolvimento da tecnologia emergente, mas já podemos observar a liderança da UE com o Proposta da UE sobre regulamentação de IA e O Código de Práticas de Desinformação de 2022 que descreve as expectativas de grandes empresas de tecnologia para lidar com a disseminação de conteúdo malicioso manipulado por IA. Em níveis nacionais, vemos os primeiros passos regulatórios dos EUA e do Reino Unido ao abordar a questão com os EUA Força-Tarefa Nacional de Deepfake e Proveniência Digital e do Reino Unido Lei de Segurança Online

A camada da indústria de tecnologia está se movendo mais rapidamente à medida que empresas e tecnólogos estão aceitando essa nova realidade no que se refere às tecnologias emergentes e seu impacto na segurança e privacidade da sociedade. O diálogo sobre a ética da IA ​​generativa é vibrante e abriu caminho para o desenvolvimento de iniciativas da indústria para Códigos de Conduta em torno do uso de IA generativa (ou seja, Código de Conduta da Parceria para Mídia Sintética de IA) e declarações éticas divulgadas por diferentes empresas. A questão é: como tornar a conduta prática? E eles são capazes de afetar produtos, características específicas e os procedimentos das equipes? 

Tendo trabalhado nesse problema com várias comunidades diferentes de mídia e entretenimento, segurança cibernética e ética em IA, formulei alguns princípios práticos para lidar com conteúdo e vozes de IA em particular: 

  1. Os proprietários de IP e a empresa que usa a voz clonada podem evitar muitas das possíveis complicações associadas ao uso de vozes originais assinando acordos legais.
  2. Os proprietários do projeto devem divulgar publicamente o uso de uma voz clonada para que os ouvintes não sejam enganados.
  3. As empresas que trabalham com tecnologia de IA para voz devem alocar uma porcentagem de recursos para desenvolver tecnologia capaz de detectar e identificar conteúdo gerado por IA.
  4. Rotular o conteúdo gerado por IA com marcas d'água permite a autenticação por voz.
  5. Cada provedor de serviços de IA deve revisar cada projeto quanto ao seu impacto (níveis social, comercial e de privacidade) antes de concordar em trabalhar nele.

É claro que os princípios de ética em IA não afetarão a disseminação de deep fakes caseiros online. No entanto, eles empurrarão quaisquer projetos no cinza para fora do alcance do mercado público.

Em 2021-22, as vozes da IA ​​foram usadas em diferentes projetos convencionais que introduziram pesadas implicações para a ética e a sociedade. Estes incluídos clonando a voz do jovem Luke Skywalker para a série Mandalorian, Voz AI para God of War 2 e A voz de Richard Nixon para o histórico 'In Event of Moon Disaster'.

A confiança na tecnologia está crescendo além da mídia e do entretenimento. Empresas tradicionais em muitos setores estão usando vozes clonadas em seus projetos. Aqui estão alguns dos casos de uso mais proeminentes.

Casos de uso do setor

Em 2023, a clonagem de voz continuará sua ascensão ao lado de vários negócios definidos para colher seus inúmeros benefícios. Do setor de saúde e marketing ao atendimento ao cliente e ao setor de publicidade, a clonagem de voz está revolucionando a forma como as organizações constroem relacionamentos com seus clientes e agilizam seus fluxos de trabalho.

A clonagem de voz beneficia profissionais de saúde e assistentes sociais que trabalham em ambiente online. Avatares digitais com a mesma voz dos profissionais médicos promovem laços mais fortes entre eles e seus pacientes, aumentando a confiança e retendo clientes.

As aplicações potenciais da clonagem de voz na indústria cinematográfica e de entretenimento são vastas. A dublagem de conteúdo em vários idiomas, substituição de diálogo adicional para crianças e adultos (ADR) e uma variedade quase infinita de opções de personalização são possíveis com essa tecnologia.

Da mesma forma, no setor de operações, a clonagem de voz orientada por IA pode gerar excelentes resultados para marcas que precisam de soluções econômicas para sistemas interativos de resposta de voz ou vídeos de treinamento corporativo. Com a tecnologia de síntese de voz, os atores podem expandir seu alcance enquanto aumentam sua capacidade de ganhar resíduos de gravações.

Finalmente, em estúdios de produção de publicidade, o surgimento da clonagem de voz ajudou a reduzir significativamente os custos e o número de horas associadas à produção comercial. Desde que haja uma gravação de alta qualidade disponível para clonagem (mesmo de atores indisponíveis), os anúncios podem ser produzidos rapidamente e com mais criatividade do que nunca.

Curiosamente, empresas e pequenas e médias empresas podem aproveitar a clonagem de voz para criar algo exclusivo para suas marcas. Grandes projetos podem realizar seus planos mais ambiciosos, enquanto pequenas empresas podem acessar modelos de escala anteriormente proibitivos. Isso é o que significa verdadeira democratização.

Resumindo

A clonagem de voz com IA oferece às empresas benefícios revolucionários, como a criação de experiências únicas para o cliente, a integração de recursos de processamento de linguagem natural em seus produtos e serviços e a geração de personificações de vozes altamente precisas que parecem completamente reais.

As empresas que desejam manter sua vantagem competitiva em 2023 devem considerar a clonagem de voz da IA. As empresas podem usar essa tecnologia para abrir uma variedade de novas possibilidades para ganhar participação de mercado e reter clientes, ao mesmo tempo em que o fazem de maneira eticamente responsável.

Anna é Diretora de Ética e Parcerias da Respeecher, uma tecnologia de clonagem de voz premiada pelo Emmy com sede na Ucrânia. Anna é ex-assessora de políticas da Reface, um aplicativo de mídia sintética alimentado por IA e cofundadora de tecnologia da ferramenta de combate à desinformação Cappture, financiada pelo programa acelerador Startup Wise Guys. Anna tem 11 anos de experiência em políticas de segurança e defesa, tecnologias e construção de resiliência. Ela é ex-bolsista de pesquisa do Centro Internacional de Defesa e Segurança em Tallinn e do Instituto de Estudos de Segurança de Praga. Ela também tem assessorado grandes empresas ucranianas na construção de resiliência como parte da Força-Tarefa de Guerra Híbrida da Escola de Economia de Kiev.