toco O futuro do podcasting é IA - Unite.AI
Entre em contato

Líderes de pensamento

O futuro do podcasting é AI

mm

Publicado

 on

Grosso modo, cerca de 22,000 novos podcasts são lançados em um mês. Existem cerca de 2.5 milhões (mais de 71 milhões de episódios) no diretório Apple Podcasts agora, de acordo com Insights do setor de podcasts. E esses são apenas os que conhecemos.

“Muitos podcasters nem estão passando pelas grandes plataformas agora. Eles estão indo direto para seus ouvintes, vendendo conteúdo premium e obtendo grande sucesso”, diz Andy Taylor, ex-BBC Radio e fundador da consultoria de P&D de Cardiff. Bwlb.

E isso para não falar do volume crescente de conteúdos do tipo podcast, sejam eles criados por marcas para promoção ou produtores de eventos que queiram, por exemplo, disponibilizar palestras sob demanda. Todo conteúdo precisa ser produzido e distribuído, seja por profissionais de áudio ou por pessoas que estão aprendendo o ofício. Portanto, quanto mais eles puderem automatizar grandes faixas de produção, mais eles poderão se concentrar no conteúdo.

“Os diferentes lugares onde o áudio está sendo publicado explodiram”, explica Jonathan Wyner, engenheiro-chefe da M Works Mastering e professor da Berklee College of Music em Boston. “Com todos esses contextos, há uma motivação real e imperativa para que os criadores sejam mais versáteis.”

Sem falar que é mais produtivo e eficiente.

A ascensão do AI

A inteligência artificial (IA) – software que pode automatizar tarefas anteriormente realizadas por humanos – é a chave para lidar com o tsunami de conteúdo de podcast. A IA não apenas pode acelerar a produção, mas também melhorar o som dos podcasts e preparar o cenário para as experiências de áudio de amanhã.

“A IA basicamente ajuda a cuidar de tarefas repetitivas para acelerar o fluxo de trabalho do podcaster”, explica Manos Chourdakis, engenheiro de pesquisa da nomono, que desenvolve ferramentas de podcasting baseadas em IA. “Por exemplo, com IA, você não precisa ouvir um podcast inteiro para descobrir onde alguém disse algo errado e, em seguida, substituí-lo ou removê-lo. Você poderia faça isso sozinho, mas a IA faz isso mais rápido.”

Depois, há tarefas que só podem ser realizadas com IA – pelo menos em escala, como remover ruídos ou aprimorar diálogos. “O aprimoramento do diálogo de boa qualidade seria impossível sem a IA”, diz Chourdakis. “Pelo menos impossível em um prazo razoável usando ferramentas tradicionais.”

Perfeito para tarefas domésticas

As aplicações de IA em podcasting são tão variadas quanto as tarefas de produção. Alguns são construídos diretamente em plataformas de podcast. Quando os criadores enviam seus podcasts para a plataforma de hospedagem Podcast.co, o sistema “ouve” automaticamente os arquivos de áudio e normaliza os níveis de som.

“Qualquer ferramenta que possa ajudar a reduzir as partes entorpecentes de um trabalho é uma coisa boa”, diz Mike Cunsolo, cofundador da plataforma. Cunsolo também corre Deixa, uma produtora de podcast que trabalha com marcas corporativas e Casamenteiro.fm, que conecta produtores de podcast com convidados. “Você sempre precisará desse elemento de conhecimento humano, mas logo as máquinas poderão aprender a entender o que torna um podcast interessante e reduzir o tempo na tarefa.”

Provedor de soluções Descrição aplica IA a muitos aspectos da engenharia de podcast, incluindo remoção de ruído e controle de eco. Uma das tarefas mais “entorpecentes” que Descript pode lidar é o tom da sala.

“Às vezes, os produtores precisam inserir silêncio digital em um podcast. Talvez entre as edições ou para prolongar o espaçamento entre as frases”, diz Jay LeBoeuf, chefe de negócios e desenvolvimento corporativo da Descript. “Mas isso soa incrivelmente antinatural.”

Se os produtores não captaram o tom da sala quando um podcast foi gravado, eles podem ter que voltar e buscá-lo. Ou eles podem ouvi-lo na gravação, copiar e colar onde necessário e, em seguida, editar o resultado para que se misture naturalmente.

Ou os computadores podem lidar com isso. O gerador de tons de ambiente baseado em IA do Descript analisa uma gravação, identifica o tom de ambiente e o sintetiza automaticamente onde for necessário. Essa tecnologia não apenas evita tarefas domésticas, mas também permite maior flexibilidade de produção.

“A IA nos permitirá usar hardware mais barato, salas com som pior e locais mais barulhentos e ainda obter bons resultados”, diz Chourdakis da Nomono.

Novos recursos baseados em IA

A IA também abre as portas para a inovação em podcasting — criando novas soluções que elevam o padrão para podcasters e ouvintes. Por exemplo, a ferramenta Epidemic Audio Reference (EAR) ajuda os podcasters a encontrar músicas sem direitos autorais com base nas músicas de que gostam.

“Digamos que você esteja procurando uma música de introdução ou finalização e esteja pensando em uma música em particular, mas ela é protegida por direitos autorais”, diz Chourdakis. “O sistema usa IA sob o capô para ajudá-lo a encontrar algo semelhante.”

Na Bwlb, a equipe de Taylor desenvolveu Acordeão, uma solução baseada em IA que pode pegar um podcast e reproduzi-lo em vários comprimentos.

“Todas as outras partes da nossa vida estão ficando mais inteligentes – casas inteligentes, geladeiras inteligentes”, diz Taylor. “As pessoas também querem mais controle e conveniência de sua experiência de podcast.”

Quando Taylor trabalhava em documentários para a BBC, ele era solicitado a fazer versões mais curtas para rodar em diferentes plataformas. O processo sempre foi manual. O Accordion aplica algoritmos de software ao conteúdo do podcast para criar versões inteligentes de diferentes durações. “Isso não acelera nada”, diz Taylor, “mas dá ao usuário controle sobre a duração do conteúdo sem perder a estrutura do tom ou a capacidade de audição”.

Colocando o foco na narrativa imersiva

Quanto mais podcasters usam ferramentas de IA, melhores eles se tornam. Em outras palavras, quanto mais dados eles ingerem, mais eles aprendem.

Os algoritmos de aprimoramento de diálogo do Nomono são baseados em grandes conjuntos de dados de gravações de voz – alguns limpos e inteligíveis, outros nem tanto – que ensinam as ferramentas de IA a gerar um som melhor. “Os podcasters não precisam de conhecimento avançado de áudio para produzir áudio de alta qualidade”, diz Chourdakis. “Ao automatizar algumas dessas tarefas, eles podem passar mais tempo concentrando-se em ótimas histórias e menos tempo em tarefas tediosas de limpeza.”

E, no futuro, eles podem evoluir mais facilmente para criar um novo gênero de podcasts espaciais imersivos. Por exemplo, a tecnologia da Nomono permite a produção de áudio baseada em objetos, o que permite aos produtores “colocar” vozes em uma paisagem sonora 3D ou criar versões dinâmicas que podem ser adaptadas aos ouvintes.

“A produção de mídia agora está entrando em uma fase em que, se você pode sonhar, pode acontecer”, diz LeBoeuf, da Descript. “E você não precisa mais ter um estúdio caro ou décadas de treinamento para atingir seus objetivos.”

Brad Grimes é um jornalista de tecnologia de longa data e ex-diretor de comunicações da Audiovisual and Integrated Experience Association.