Líderes de pensamento

Como usar vozes geradas por IA de forma ética para empresas em 2023

mm

O final de 2022 chegou após a adoção generalizada de tecnologias de IA devido à popularidade impressionante da OpenAI e do ChatGPT. Pela primeira vez, a IA conquistou o apelo de massa, provando sua utilidade e valor na criação de resultados de negócios bem-sucedidos.

Muitas tecnologias de IA que parecem uma revolução para as pessoas comuns em 2023 já estão em uso ativo por grandes empresas e mídia há vários anos. Acompanhe-me enquanto dou uma olhada mais próxima na tecnologia por trás dessas soluções, em particular, sistemas de IA gerativos para clonagem de voz, seus benefícios comerciais e abordagens éticas para o uso de IA.

Como funciona a clonagem de voz?

Em resumo, a clonagem de voz permite que uma pessoa fale usando a voz de outra pessoa.

Elle utiliza tecnologia de IA gerativa para criar gravações da voz de uma pessoa e usá-las para gerar novo conteúdo de áudio com a mesma voz daquela pessoa. Ela essencialmente permite que as pessoas ouçam o que alguém diria, mesmo que não tenha dito isso elas mesmas.

Do lado técnico, as coisas não parecem ser muito complicadas. Mas se você mergulhar um pouco mais fundo, há alguns requisitos mínimos para começar:

  1. Você precisa de pelo menos 5 minutos de áudio de alta qualidade gravado da voz de origem para cloná-la. Essas gravações devem ser claras e livres de ruído de fundo ou outras distorções, pois qualquer imperfeição pode afetar a precisão da saída do modelo.
  2. Depois, alimente essas gravações em um modelo de IA gerativa para criar um “avatar de voz”.
  3. Em seguida, treine o modelo para reproduzir padrões de fala com precisão em tom e temporização.
  4. Uma vez concluído, esse modelo treinado pode gerar conteúdo ilimitado usando a voz de origem de qualquer outra pessoa, tornando-se uma ferramenta eficaz para criar vozes réplicas realistas.

Este é o ponto em que muitos levantam preocupações éticas. O que acontece quando podemos inserir qualquer texto na boca de outra pessoa e é impossível dizer se essas palavras são reais ou falsas?

Sim, essa possibilidade já se tornou uma realidade. Como no caso da OpenAI e do ChatGPT, estamos enfrentando atualmente uma série de questões éticas que não podem ser ignoradas.

Padrões éticos em IA

Como muitas outras tecnologias novas em seus estágios iniciais de adoção, a principal ameaça é criar um estigma negativo em torno da tecnologia em vez de reconhecer as ameaças como uma fonte de discussão e conhecimento valioso. O que é importante é expor os métodos que atores ruins usam para abusar da tecnologia e de seus produtos, aplicar ferramentas de mitigação e continuar aprendendo.

Hoje, temos três camadas de estruturas para padrões éticos relacionados ao uso de IA gerativa. As camadas regulatórias nacionais e supranacionais estão em seu estágio inicial de desenvolvimento. O mundo das políticas pode não acompanhar a velocidade do desenvolvimento da tecnologia emergente, mas já podemos observar a UE liderando com a Proposta da UE sobre Regulamentação de IA e Código de Prática de 2022 sobre Desinformação que estabelece as expectativas para que as grandes empresas de tecnologia lidem com a disseminação de conteúdo manipulado por IA. Em níveis nacionais, vemos os primeiros passos regulatórios dos EUA e do Reino Unido para abordar a questão com a Força-Tarefa Nacional de Deepfake e Proveniência Digital dos EUA e a Lei de Segurança Online do Reino Unido.

A camada da indústria de tecnologia está se movendo mais rapidamente, pois as empresas e os tecnólogos estão aceitando essa nova realidade em relação às tecnologias emergentes e seu impacto na segurança e privacidade sociais. O diálogo sobre a ética da IA gerativa é vibrante e liderou o caminho para o desenvolvimento de iniciativas setoriais para Códigos de Conduta sobre o uso de IA gerativa (por exemplo, Código de Conduta da Parceria sobre IA para Mídia Sintética) e declarações éticas lançadas por diferentes empresas. A pergunta é, como tornar a conduta prática? E, elas são capazes de afetar produtos, recursos específicos e procedimentos de equipes?

Depois de trabalhar nesse problema com várias comunidades de mídia e entretenimento, cibersegurança e ética de IA, formulei alguns princípios práticos para lidar com conteúdo e vozes de IA em particular:

  1. Os proprietários de direitos autorais e a empresa que usa a voz clonada podem evitar muitas das complicações potenciais associadas ao uso de vozes originais assinando acordos legais.
  2. Os proprietários de projetos devem divulgar publicamente o uso de uma voz clonada para que os ouvintes não sejam enganados.
  3. As empresas que trabalham com tecnologia de IA para voz devem alocar uma porcentagem de recursos para desenvolver tecnologia capaz de detectar e identificar conteúdo gerado por IA.
  4. Marcar conteúdo gerado por IA com marcas d’água permite a autenticação de voz.
  5. Cada provedor de serviço de IA deve revisar cada projeto de seu impacto (nível social, empresarial e de privacidade) antes de concordar em trabalhar nele.

Claro, os princípios da ética em IA não afetarão a disseminação de deepfakes caseiros online. No entanto, eles empurrarão qualquer projeto cinzento para fora do alcance do mercado público.

Em 2021-22, vozes de IA foram usadas em vários projetos de grande porte que introduziram implicações significativas para a ética e a sociedade. Esses incluíram clonar a voz do jovem Luke Skywalker para a série Mandalorian, voz de IA para God of War 2, e a voz de Richard Nixon para o histórico ‘Em Caso de Desastre na Lua’.

A confiança na tecnologia está crescendo além da mídia e do entretenimento. Empresas tradicionais em muitas indústrias estão usando vozes clonadas em seus projetos. Aqui estão alguns dos casos de uso mais proeminentes.

Casos de uso da indústria

Em 2023, a clonagem de voz continuará sua ascensão ao lado de várias empresas que estão prontas para colher seus numerosos benefícios. Desde a saúde e o marketing até o atendimento ao cliente e a indústria publicitária, a clonagem de voz está revolucionando a forma como as organizações constroem relacionamentos com seus clientes e otimizam seus fluxos de trabalho.

A clonagem de voz beneficia profissionais de saúde e trabalhadores sociais que trabalham em um ambiente online. Avatares digitais com a mesma voz que os profissionais de saúde criam laços mais fortes entre eles e seus pacientes, aumentando a confiança e retenção de clientes.

As aplicações potenciais da clonagem de voz na indústria cinematográfica e de entretenimento são vastas. Dublar conteúdo em vários idiomas, substituição de diálogo adicional para crianças e adultos (ADR) e uma infinidade de opções de personalização são tornadas possíveis por essa tecnologia.

Da mesma forma, no setor operacional, a clonagem de voz impulsionada por IA pode produzir resultados excelentes para marcas que precisam de soluções eficientes em termos de custo para sistemas de resposta de voz interativa ou vídeos de treinamento corporativo. Com a tecnologia de síntese de voz, os atores podem expandir seu alcance enquanto aumentam sua capacidade de ganhar royalties com gravações.

Finalmente, nos estúdios de produção publicitária, o surgimento da clonagem de voz ajudou significativamente a reduzir os custos e o número de horas associados à produção de comerciais. Desde que haja uma gravação de alta qualidade disponível para clonagem (mesmo de atores indisponíveis), os anúncios podem ser produzidos rapidamente e de forma mais criativa do que nunca.

Interessantemente, empresas e pequenas e médias empresas podem aproveitar a clonagem de voz para criar algo único para suas marcas. Projetos de grande escala podem realizar seus planos mais ambiciosos, enquanto pequenas empresas podem acessar modelos de escala anteriormente proibitivos. É isso que significa verdadeira democratização.

Conclusão

A clonagem de voz por IA oferece benefícios revolucionários para as empresas, como criar experiências de cliente únicas, integrar capacidades de processamento de linguagem natural em seus produtos e serviços e gerar imitações de vozes que soam completamente reais.

As empresas que buscam manter sua vantagem competitiva em 2023 devem olhar para a clonagem de voz por IA. As empresas podem usar essa tecnologia para desbloquear uma variedade de novas possibilidades para ganhar participação de mercado e reter clientes enquanto o fazem de forma eticamente responsável.

Anna é Chefe de Ética e Parcerias na Respeecher, uma tecnologia de clonagem de voz premiada com um Emmy, sediada na Ucrânia. Anna é ex-Assessora de Políticas na Reface, um aplicativo de mídia sintética alimentado por IA e co-fundadora de tecnologia da ferramenta de contra-desinformação Cappture, financiada pelo programa de aceleração Startup Wise Guys. Anna tem 11 anos de experiência em políticas de segurança e defesa, tecnologias e construção de resiliência. Ela é ex-Bolsista de Pesquisa no Centro Internacional de Defesa e Segurança em Tallinn e no Instituto de Estudos de Segurança de Praga. Ela também tem assessorado empresas ucranianas importantes sobre construção de resiliência como parte da Força-Tarefa de Guerra Híbrida na Kyiv School of Economics.