Leaders d’opinion
L’avenir de la création de podcasts est l’IA

Pour parler grossièrement, environ 22 000 nouveaux podcasts sont lancés chaque mois. Il y a près de 2,5 millions (plus de 71 millions d’épisodes) dans le répertoire Apple Podcasts en ce moment, selon Podcast Industry Insights. Et ce ne sont que ceux que nous connaissons.
« Beaucoup de créateurs de podcasts ne passent même plus par les grandes plateformes maintenant. Ils vont directement à leurs auditeurs, vendent du contenu premium et connaissent un grand succès », déclare Andy Taylor, ancien de la BBC Radio et fondateur du cabinet de conseil en R&D basé à Cardiff, Bwlb.
Et ce n’est rien par rapport au volume croissant de contenus similaires à des podcasts, qu’ils soient créés par des marques pour la promotion ou par des producteurs d’événements qui veulent, par exemple, rendre des conférences disponibles à la demande. Chaque pièce de contenu doit être produite et distribuée, que ce soit par des professionnels de l’audio ou des personnes qui apprennent le métier. Par conséquent, plus ils peuvent automatiser de grandes parties de la production, plus ils peuvent se concentrer sur le contenu.
« Les différents endroits où l’audio est publié ont simplement explosé », explique Jonathan Wyner, ingénieur en chef chez M Works Mastering et professeur à Berklee College of Music à Boston. « Avec tous ces contextes, il y a une véritable motivation et une impérieuse nécessité pour les créateurs d’être plus polyvalents ».
Pour ne pas mentionner, plus productifs et efficaces.
L’essor de l’IA
L’intelligence artificielle (IA) — des logiciels qui peuvent automatiser les tâches précédemment effectuées par des humains — détient la clé pour gérer le tsunami de contenu de podcast. Non seulement l’IA peut accélérer la production, mais elle peut également améliorer la qualité sonore des podcasts et préparer le terrain pour les expériences audio de demain.
« L’IA aide essentiellement à prendre soin des tâches répétitives pour accélérer le flux de travail du créateur de podcast », explique Manos Chourdakis, ingénieur de recherche chez Nomono, qui développe des outils de création de podcasts basés sur l’IA. « Par exemple, avec l’IA, vous n’avez pas à écouter un podcast entier pour trouver où quelqu’un a dit quelque chose de mal, puis le remplacer ou le supprimer. Vous pourriez le faire vous-même, mais l’IA le fait plus rapidement ».
Ensuite, il y a des tâches qui ne peuvent être accomplies qu’avec l’IA — au moins à grande échelle, comme la suppression de bruit ou l’amélioration du dialogue. « Une amélioration de la qualité du dialogue serait impossible sans IA », déclare Chourdakis. « Au moins impossible dans un délai raisonnable en utilisant des outils traditionnels ».
Parfait pour les tâches fastidieuses
Les applications de l’IA dans la création de podcasts sont aussi variées que les tâches de production. Certaines sont intégrées directement dans les plateformes de podcasts. Lorsque les créateurs téléchargent leurs podcasts sur la plateforme d’hébergement Podcast.co, le système « écoute » automatiquement les fichiers audio et normalise les niveaux de son.
« Tout outil qui peut aider à réduire les aspects fastidieux d’un travail est une bonne chose », déclare Mike Cunsolo, co-fondateur de la plateforme. Cunsolo dirige également Cue, une société de production de podcasts qui travaille avec des marques corporatives, et Matchmaker.fm, qui met en relation les producteurs de podcasts avec des invités. « Vous aurez toujours besoin de cet élément d’expertise humaine, mais bientôt les machines pourraient apprendre à comprendre ce qui rend un podcast intéressant et réduire le temps passé sur la tâche ».
Le fournisseur de solutions Descript applique l’IA à de nombreux aspects de l’ingénierie de podcast, notamment la suppression de bruit et le contrôle de l’écho. L’une des tâches les plus « fastidieuses » que Descript peut gérer est la tonalité de la pièce.
« Parfois, les producteurs doivent insérer du silence numérique dans un podcast. Peut-être entre des éditions ou pour étirer l’espacement entre les phrases », déclare Jay LeBoeuf, responsable des affaires et du développement commercial chez Descript. « Mais cela sonne incroyablement peu naturel ».
Si les producteurs n’ont pas capturé la tonalité de la pièce lors de l’enregistrement d’un podcast, ils peuvent devoir y retourner et l’obtenir. Ou ils peuvent l’écouter dans l’enregistrement, copier-coller où nécessaire, puis éditer le résultat pour le faire fondre naturellement.
Ou les ordinateurs peuvent s’en charger. Le générateur de tonalité de pièce basé sur l’IA de Descript analyse l’enregistrement, identifie la tonalité de la pièce et la synthétise automatiquement où elle est nécessaire. Une telle technologie non seulement élimine les tâches fastidieuses, mais permet également une plus grande flexibilité de production.
« L’IA nous permettra d’utiliser du matériel moins coûteux, des salles qui sonnent moins bien et des endroits plus bruyants et d’obtenir de bons résultats », déclare Chourdakis de Nomono.
Nouvelles capacités basées sur l’IA
L’IA ouvre également la voie à l’innovation dans la création de podcasts — en créant de nouvelles solutions qui élevées la barre pour les créateurs de podcasts et les auditeurs. Par exemple, l’outil de référence Epidemic Audio (EAR) aide les créateurs de podcasts à trouver de la musique sans droit d’auteur en fonction de chansons qu’ils aiment.
« Disons que vous cherchez de la musique pour l’introduction ou la conclusion, et que vous pensez à une chanson en particulier, mais qu’elle est protégée par le droit d’auteur », déclare Chourdakis. « Le système utilise l’IA pour vous aider à trouver quelque chose de similaire ».
Chez Bwlb, l’équipe de Taylor a développé Accordion, une solution basée sur l’IA qui peut prendre un podcast et le reproduire à différentes longueurs.
« Toute autre partie de notre vie devient plus intelligente — maisons intelligentes, réfrigérateurs intelligents », déclare Taylor. « Les gens veulent plus de contrôle et de commodité dans leur expérience de podcast, eux aussi ».
Lorsque Taylor travaillait sur des documentaires pour la BBC, on lui demandait des versions plus courtes pour les diffuser sur différentes plateformes. Le processus était toujours manuel. Accordion applique des algorithmes logiciels au contenu du podcast pour créer intelligemment des versions de différentes longueurs. « Cela n’accélère rien », déclare Taylor, « mais cela donne à l’utilisateur le contrôle de la durée du contenu sans perdre la structure du ton ou la facilité d’écoute ».
Mettre l’accent sur les histoires immersives
Plus les créateurs de podcasts utilisent des outils d’IA, mieux ils deviennent. En d’autres termes, plus ils ingèrent de données, plus ils apprennent.
Les algorithmes d’amélioration du dialogue de Nomono sont basés sur de grands ensembles de données d’enregistrements vocaux — certains propres et intelligibles, d’autres moins — qui enseignent aux outils d’IA à générer un meilleur son. « Les créateurs de podcasts ne devraient pas avoir besoin de connaissances audio avancées pour produire un audio de haute qualité », déclare Chourdakis. « En automatisant certaines de ces tâches, ils peuvent passer plus de temps à se concentrer sur une grande histoire et moins de temps sur des tâches de nettoyage fastidieuses ».
Et à l’avenir, ils peuvent évoluer plus facilement pour créer un nouveau genre de podcasts immersifs et spatiaux. Par exemple, la technologie de Nomono permet une production audio basée sur des objets, qui permet aux producteurs de « placer » des voix dans un paysage sonore 3D ou de créer des versions dynamiques qui peuvent être adaptées aux auditeurs.
« La production de médias est maintenant entrée dans une phase où si vous pouvez le rêver, cela peut se produire », déclare LeBoeuf de Descript. « Et vous n’avez plus besoin d’avoir un studio coûteux ou des décennies de formation pour atteindre vos objectifs ».












