Connect with us

Como usar Vozes de IA Gerativas de Forma Ética para Negócios em 2023

Líderes de pensamento

Como usar Vozes de IA Gerativas de Forma Ética para Negócios em 2023

mm

O final de 2022 chegou nos calcanhares da adoção generalizada de tecnologias de IA devido à popularidade surpreendente da OpenAI e do ChatGPT. Pela primeira vez, a IA alcançou apelo de mercado de massa, comprovando sua utilidade e valor na criação de resultados de negócios bem-sucedidos.

Muitas tecnologias de IA que parecem uma revolução para as pessoas comuns em 2023 já estão em uso ativo por grandes empresas e mídia há vários anos. Acompanhe-me enquanto dou uma olhada mais de perto na tecnologia por trás dessas soluções, em particular, sistemas de IA gerativos para clonagem de voz, seus benefícios comerciais e abordagens éticas para o uso de IA.

Como funciona a clonagem de voz?

Em resumo, a clonagem de voz permite que uma pessoa fale usando a voz de outra pessoa.

Isso usa tecnologia de IA gerativa para criar gravações da voz de uma pessoa e usá-las para gerar novo conteúdo de áudio com a mesma voz daquela pessoa. Ela essencialmente permite que as pessoas ouçam o que alguém teria dito, mesmo que não tenham dito isso elas mesmas.

Do lado técnico, as coisas não parecem ser muito complicadas. Mas se você mergulhar um pouco mais fundo, há alguns requisitos mínimos para começar:

  1. Você precisa de pelo menos 5 minutos de áudio de alta qualidade gravado da voz de origem para cloná-la. Essas gravações devem ser claras e livres de ruído de fundo ou outras distorções, pois qualquer imperfeição pode afetar a precisão da saída do modelo.
  2. Depois disso, alimente essas gravações em um modelo de IA gerativa para criar um “avatar de voz”.
  3. Em seguida, treine o modelo para reproduzir padrões de fala em tom e tempo com precisão.
  4. Uma vez concluído, esse modelo treinado pode gerar conteúdo ilimitado usando a voz de origem de qualquer outra pessoa, tornando-se uma ferramenta eficaz para criar vozes réplica realistas.

Este é o ponto em que muitos levantam preocupações éticas. O que acontece quando podemos inserir qualquer texto na boca de outra pessoa e é impossível dizer se essas palavras são reais ou falsas?

Sim, essa possibilidade já se tornou uma realidade. Como no caso da OpenAI e do ChatGPT, estamos atualmente enfrentando uma série de questões éticas que não podem ser ignoradas.

Padrões éticos em IA

Como muitas outras tecnologias novas em seus estágios iniciais de adoção, a principal ameaça é criar um estigma negativo em torno da tecnologia, em vez de reconhecer as ameaças como uma fonte de discussão e conhecimento valioso. O que é importante é expor os métodos que atores malignos usam para abusar da tecnologia e de seus produtos, aplicar ferramentas de mitigação e continuar aprendendo. 

Hoje temos três camadas de estruturas para padrões éticos relacionados ao uso de IA gerativa. As camadas regulatórias nacionais e supranacionais estão em seu estágio inicial de desenvolvimento. O mundo das políticas pode não acompanhar a velocidade do desenvolvimento da tecnologia emergente, mas já podemos observar a UE liderando com a Proposta da UE sobre Regulamentação de IA e O Código de Práticas de 2022 sobre Desinformação que delineia as expectativas para as grandes empresas de tecnologia lidarem com a disseminação de conteúdo manipulado por IA. Em níveis nacionais, vemos os primeiros passos regulatórios dos EUA e do Reino Unido para abordar a questão com a Força-Tarefa Nacional de Deepfake e Proveniência Digital dos EUA e a Lei de Segurança Online do Reino Unido. 

A camada da indústria de tecnologia está se movendo mais rápido, pois as empresas e tecnólogos estão aceitando essa nova realidade como se relaciona às tecnologias emergentes e seu impacto na segurança e privacidade sociais. O diálogo sobre a ética da IA gerativa é vibrante e liderou o caminho para o desenvolvimento de iniciativas da indústria para Códigos de Conduta sobre o uso de IA gerativa (por exemplo, O Código de Conduta de Mídia Sintética da Parceria sobre IA) e declarações éticas divulgadas por diferentes empresas. A pergunta é, como tornar a conduta prática? E, elas são capazes de afetar produtos, recursos específicos e procedimentos de equipes? 

Depois de trabalhar nesse problema com várias comunidades de mídia e entretenimento, cibersegurança e ética de IA, formulei alguns princípios práticos para lidar com conteúdo e vozes de IA em particular: 

  1. Os proprietários de IP e a empresa que usa a voz clonada podem evitar muitas das complicações potenciais associadas ao uso de vozes originais assinando acordos legais.
  2. Os proprietários de projetos devem divulgar publicamente o uso de uma voz clonada para que os ouvintes não sejam enganados.
  3. As empresas que trabalham com tecnologia de IA para voz devem alocar uma porcentagem de recursos para desenvolver tecnologia capaz de detectar e identificar conteúdo gerado por IA.
  4. Rotular o conteúdo gerado por IA com marcas d’água permite a autenticação de voz.
  5. Cada provedor de serviço de IA deve revisar cada projeto de seu impacto (níveis sociais, comerciais e de privacidade) antes de concordar em trabalhar nele.

Claro, os princípios da ética em IA não afetarão a disseminação de deepfakes caseiros online. No entanto, eles empurrarão qualquer projeto na zona cinzenta para fora do alcance do mercado público.

Em 2021-22, vozes de IA foram usadas em diferentes projetos mainstream que introduziram implicações significativas para a ética e a sociedade. Esses incluíam clonar a voz do jovem Luke Skywalker para a série Mandalorian, voz de IA para God of War 2, e a voz de Richard Nixon para o histórico ‘Em Caso de Desastre na Lua’.

A confiança na tecnologia está crescendo além da mídia e do entretenimento. Empresas tradicionais em muitas indústrias estão usando vozes clonadas em seus projetos. Aqui estão alguns dos casos de uso mais proeminentes.

Casos de uso da indústria

Em 2023, a clonagem de voz continuará sua ascensão ao lado de vários negócios que devem colher seus numerosos benefícios. Desde a saúde e o marketing até o atendimento ao cliente e a indústria publicitária, a clonagem de voz está revolucionando a forma como as organizações constroem relacionamentos com seus clientes e otimizam seus fluxos de trabalho.

A clonagem de voz beneficia profissionais de saúde e trabalhadores sociais que trabalham em um ambiente online. Avatares digitais com a mesma voz que os profissionais de saúde criam laços mais fortes entre eles e seus pacientes, aumentando a confiança e retenção de clientes.

As aplicações potenciais da clonagem de voz na indústria de cinema e entretenimento são vastas. Dublar conteúdo em vários idiomas, substituição de diálogo adicional para crianças e adultos (ADR) e uma infinidade de opções de personalização são todos tornados possíveis por essa tecnologia.

Da mesma forma, no setor de operações, a clonagem de voz impulsionada por IA pode produzir resultados excelentes para marcas que precisam de soluções eficientes em termos de custo para sistemas de resposta de voz interativa ou vídeos de treinamento corporativo. Com a tecnologia de síntese de voz, os atores podem expandir seu alcance enquanto aumentam sua capacidade de ganhar royalties de gravações.

Finalmente, nos estúdios de produção publicitária, o surgimento da clonagem de voz ajudou significativamente a reduzir os custos e o número de horas associados à produção de comerciais. Desde que haja uma gravação de alta qualidade disponível para clonagem (mesmo de atores indisponíveis), os anúncios podem ser produzidos rapidamente e de forma mais criativa do que nunca.

Interessantemente, empresas e pequenas e médias empresas podem aproveitar a clonagem de voz para criar algo único para suas marcas. Projetos grandes podem realizar seus planos mais ambiciosos, enquanto pequenas empresas podem acessar modelos de escala anteriormente proibitivos em termos de custo. É isso que significa verdadeira democratização.

Conclusão

A clonagem de voz de IA oferece benefícios revolucionários para os negócios, como criar experiências de cliente únicas, integrar capacidades de processamento de linguagem natural em seus produtos e serviços e gerar imitações de voz altamente precisas que soam completamente reais.

As empresas que buscam manter sua vantagem competitiva em 2023 devem olhar para a clonagem de voz de IA. As empresas podem usar essa tecnologia para desbloquear uma variedade de novas possibilidades para ganhar participação de mercado e reter clientes, enquanto o fazem de forma eticamente responsável.

Anna é Chefe de Ética e Parcerias na Respeecher, uma tecnologia de clonagem de voz premiada com um Emmy, sediada na Ucrânia. Anna é ex-Assessora de Políticas na Reface, um aplicativo de mídia sintética alimentado por IA e co-fundadora de tecnologia da ferramenta de contra-desinformação Cappture, financiada pelo programa de aceleração Startup Wise Guys. Anna tem 11 anos de experiência em políticas de segurança e defesa, tecnologias e construção de resiliência. Ela é ex-Bolsista de Pesquisa no Centro Internacional de Defesa e Segurança em Tallinn e no Instituto de Estudos de Segurança de Praga. Ela também tem assessorado empresas ucranianas importantes sobre construção de resiliência como parte da Força-Tarefa de Guerra Híbrida na Kyiv School of Economics.