Líderes de opinión
El Futuro de la Creación de Podcasts es la IA

Hablando en términos generales, alrededor de 22,000 nuevos podcasts se lanzan en un mes. Hay cerca de 2,5 millones (más de 71 millones de episodios) en el directorio de Apple Podcasts en este momento, según Podcast Industry Insights. Y esos son solo los que conocemos.
“Muchos podcasters ya no están pasando por las grandes plataformas ahora. Van directamente a sus oyentes, venden contenido premium y tienen un gran éxito”, dice Andy Taylor, anteriormente de BBC Radio y fundador de la consultoría de investigación y desarrollo Bwlb con sede en Cardiff.
Y eso es sin mencionar el creciente volumen de contenido similar a podcasts, ya sea creado por marcas para promocionar o productores de eventos que desean, por ejemplo, hacer que las charlas estén disponibles bajo demanda. Cada pieza de contenido necesita ser producida y distribuida, ya sea por profesionales de audio o personas que aprenden el oficio. Por lo tanto, cuanto más puedan automatizar grandes partes de la producción, más podrán centrarse en el contenido.
“Los diferentes lugares donde se publica el audio han explotado”, explica Jonathan Wyner, ingeniero jefe en M Works Mastering y profesor en Berklee College of Music en Boston. “Con todos esos contextos, hay una motivación y un imperativo reales para que los creadores sean más versátiles”.
No mencionar, más productivos y eficientes.
El Auge de la IA
La inteligencia artificial (IA) — software que puede automatizar tareas previamente realizadas por humanos — tiene la clave para manejar el tsunami de contenido de podcasts. No solo puede la IA acelerar la producción, sino que también puede hacer que los podcasts suenen mejor y sentar las bases para las experiencias de audio del mañana.
“La IA básicamente ayuda a cuidar las tareas repetitivas para agilizar el flujo de trabajo del podcaster”, explica Manos Chourdakis, ingeniero de investigación en Nomono, que desarrolla herramientas de podcasting basadas en IA. “Por ejemplo, con la IA, no tienes que escuchar todo el podcast para encontrar dónde alguien dijo algo mal, y luego reemplazarlo o eliminarlo. Puedes hacerlo tú mismo, pero la IA lo hace más rápido”.
Luego hay tareas que solo se pueden realizar con la IA — al menos a gran escala, como eliminar ruido o mejorar el diálogo. “La mejora del diálogo de alta calidad sería imposible sin la IA”, dice Chourdakis. “Al menos imposible en un plazo razonable utilizando herramientas tradicionales”.
Perfecto para Tareas Meniales
Las aplicaciones de la IA en la creación de podcasts son tan variadas como las tareas de producción. Algunas están integradas directamente en las plataformas de podcasts. Cuando los creadores suben sus podcasts a la plataforma de alojamiento Podcast.co, el sistema “escucha” automáticamente los archivos de audio y normaliza los niveles de sonido.
“Cualquier herramienta que pueda ayudar a reducir las partes aburridas de un trabajo es algo bueno”, dice Mike Cunsolo, cofundador de la plataforma. Cunsolo también dirige Cue, una empresa de producción de podcasts que trabaja con marcas corporativas, y Matchmaker.fm, que conecta a productores de podcasts con invitados. “Siempre necesitarás ese elemento de expertise humana, pero pronto las máquinas podrían aprender a entender qué hace que un podcast sea interesante y reducir el tiempo en la tarea”.
El proveedor de soluciones Descript aplica la IA a muchos aspectos de la ingeniería de podcasts, incluida la eliminación de ruido y el control de eco. Una de las tareas más “aburridas” que Descript puede manejar es el tono de la habitación.
“A veces, los productores necesitan insertar silencio digital en un podcast. Tal vez entre ediciones o para arrastrar el espaciado entre oraciones”, dice Jay LeBoeuf, jefe de negocios y desarrollo corporativo en Descript. “Pero eso suena increíblemente antinatural”.
Si los productores no capturaron el tono de la habitación cuando se grabó el podcast, pueden tener que regresar y obtenerlo. O pueden escucharlo en la grabación, copiar y pegar donde sea necesario, y luego editar el resultado para que se mezcle de manera natural.
O las computadoras pueden manejarlo. El generador de tono de habitación basado en IA de Descript analiza una grabación, identifica el tono de la habitación y sintetiza automáticamente donde se necesita. Esta tecnología no solo obvia tareas meniales, sino que también permite una mayor flexibilidad en la producción.
“La IA nos permitirá utilizar hardware menos costoso, habitaciones con peor sonido y lugares más ruidosos y aún así obtener buenos resultados”, dice Chourdakis de Nomono.
Nuevas Capacidades Basadas en IA
La IA también abre la puerta a la innovación en la creación de podcasts — creando nuevas soluciones que elevan el listón para los podcasters y los oyentes. Por ejemplo, la herramienta de referencia de audio Epidemic (EAR) ayuda a los podcasters a encontrar música libre de derechos de autor basada en canciones que les gusten.
“Digamos que estás buscando música de introducción o de cierre, y estás pensando en una canción en particular, pero está protegida por derechos de autor”, dice Chourdakis. “El sistema utiliza la IA en segundo plano para ayudarte a encontrar algo similar”.
En Bwlb, el equipo de Taylor desarrolló Accordion, una solución basada en IA que puede tomar un podcast y reproducirlo en varias longitudes.
“Otra parte de nuestra vida está volviéndose más inteligente — hogares inteligentes, refrigeradores inteligentes”, dice Taylor. “La gente quiere más control y conveniencia en su experiencia de podcast también”.
Cuando Taylor trabajó en documentales para la BBC, le pedían versiones más cortas para ejecutar en diferentes plataformas. El proceso siempre era manual. Accordion aplica algoritmos de software al contenido del podcast para crear inteligentemente versiones de diferentes longitudes. “No acelera nada”, dice Taylor, “pero le da al usuario el control sobre la duración del contenido sin perder la estructura del tono o la capacidad de escucha”.
Poniendo el Enfoque en la Narración Inmersiva
Cuanto más utilicen los podcasters las herramientas de IA, mejor serán. En otras palabras, cuanto más datos ingieran, más aprenderán.
Los algoritmos de mejora del diálogo de Nomono se basan en grandes conjuntos de datos de grabaciones de voz — algunas limpias e inteligibles, otras menos — que enseñan a las herramientas de IA a generar un mejor sonido. “Los podcasters no deberían necesitar conocimientos avanzados de audio para producir audio de alta calidad”, dice Chourdakis. “Al automatizar algunas de estas tareas, pueden pasar más tiempo centrados en una gran narración, y menos tiempo en tareas de limpieza tediosas”.
Y en el futuro, pueden evolucionar más fácilmente para crear un nuevo género de podcasts inmersivos y espaciales. Por ejemplo, la tecnología de Nomono permite la producción de audio basada en objetos, que permite a los productores “colocar” voces en un paisaje sonoro 3D o crear versiones dinámicas que se pueden adaptar a los oyentes.
“La producción de medios ahora está entrando en una fase en la que si puedes soñarlo, puede suceder”, dice LeBoeuf de Descript. “Y ya no necesitas tener un estudio costoso o décadas de capacitación para lograr tus objetivos”.












