Lideri de opinie
Viitorul podcasting-ului este AI

Vorbind în linii mari, aproximativ 22.000 de podcasturi noi sunt lansate într-o lună. Există aproape 2,5 milioane (mai mult de 71 de milioane de episoade) în directorul Apple Podcasts în acest moment, conform Podcast Industry Insights. Și acestea sunt doar cele despre care știm.
“Mulți podcasteri nu mai trec prin platformele mari acum. Ei merg direct la ascultătorii lor, vând conținut premium și au succes mare”, spune Andy Taylor, fost de la BBC Radio și fondator al consultanței de cercetare și dezvoltare Bwlb din Cardiff.
Și asta fără a mai vorbi de volumul tot mai mare de conținut similar podcast-urilor, creat de mărci pentru promovare sau de producători de evenimente care doresc, de exemplu, să facă disponibile discursuri la cerere. Fiecare piesă de conținut trebuie produsă și distribuită, fie de către profesioniști în audio, fie de către oameni care învață meseria. Prin urmare, cu cât pot automatiza porțiuni mari de producție, cu atât mai mult se pot concentra pe conținut.
“Locurile diferite în care este publicat conținutul audio au explodat”, explică Jonathan Wyner, inginer șef la M Works Mastering și profesor la Berklee College of Music din Boston. “Cu toate aceste contexte, există o motivație și o imperativă reală pentru creatori să fie mai versatili”.
Și, nu în ultimul rând, mai productivi și mai eficienți.
Rise of AI
Inteligența artificială (AI) — software care poate automatiza sarcinile anterior efectuate de oameni — deține cheia pentru a face față valului de conținut de podcast. Nu numai că AI poate accelera producția, dar poate face ca podcast-urile să sune mai bine și să pregătească scena pentru experiențele audio de mâine.
“AI ajută în principal la îngrijirea sarcinilor repetitive pentru a grăbi fluxul de lucru al podcaster-ului”, explică Manos Chourdakis, inginer de cercetare la Nomono, care dezvoltă instrumente de podcasting bazate pe AI. “De exemplu, cu AI, nu trebuie să asculte un întreg podcast pentru a găsi unde cineva a spus ceva greșit, apoi să înlocuiască sau să elimine. Ai putea face asta singur, dar AI o face mai repede”.
Apoi există și sarcini care pot fi realizate doar cu AI — cel puțin la scară, cum ar fi eliminarea zgomotului sau îmbunătățirea dialogului. “Îmbunătățirea calității dialogului ar fi imposibilă fără AI”, spune Chourdakis. “Cel puțin imposibilă într-un timp rezonabil, folosind instrumente tradiționale”.
Perfect pentru sarcini minore
Aplicarea AI în podcasting este la fel de variată ca și sarcinile de producție. Unele sunt integrate direct în platformele de podcast. Când creatorii își încarcă podcast-urile pe platforma de găzduire Podcast.co, sistemul “ascultă” automat fișierele audio și normalizează nivelurile de sunet.
“Orice instrument care poate ajuta la reducerea părților care necesită atenție a unui job este un lucru bun”, spune Mike Cunsolo, co-fondatorul platformei. Cunsolo conduce, de asemenea, Cue, o companie de producție de podcast care lucrează cu mărci corporatiste, și Matchmaker.fm, care conectează producători de podcast cu invitați. “Veți avea întotdeauna nevoie de acel element de expertiză umană, dar curând mașinile ar putea învăța să înțeleagă ce face un podcast interesant și să reducă timpul de sarcină”.
Furnizorul de soluții Descript aplică AI la multe aspecte ale ingineriei de podcast, inclusiv eliminarea zgomotului și controlul ecoului. Una dintre sarcinile mai “obositoare” pe care Descript le poate gestiona este tonul camerei.
“Uneori producătorii trebuie să insereze tăcere digitală într-un podcast. Poate între editări sau pentru a prelungi spațiul dintre propoziții”, spune Jay LeBoeuf, șeful departamentului de afaceri și dezvoltare corporativă la Descript. “Dar asta sună incredibil de nefiresc”.
Dacă producătorii nu au capturat tonul camerei atunci când s-a înregistrat podcastul, ei ar putea să se întoarcă și să-l obțină. Sau pot asculta pentru el în înregistrare, copiați și lipiți unde este necesar, apoi editați rezultatul pentru a face să se potrivească în mod natural.
Sau computerele pot gestiona asta. Generatorul de ton de cameră bazat pe AI al lui Descript analizează o înregistrare, identifică tonul camerei și sintetizează automat acolo unde este necesar. O astfel de tehnologie nu numai că elimină sarcinile minore, dar permite și o mai mare flexibilitate de producție.
“AI ne va permite să folosim hardware mai ieftin, sălile cu sunet mai prost și locații mai zgomotoase și totuși să obținem rezultate bune”, spune Chourdakis de la Nomono.
Noi capacități bazate pe AI
AI deschide, de asemenea, ușa inovației în podcasting — creând soluții noi care ridică standardul pentru podcasteri și ascultători. De exemplu, instrumentul Epidemic Audio Reference (EAR) ajută podcast-erii să găsească muzică fără drepturi de autor pe baza cântecelor pe care le plac.
“Spuneți că căutați muzică de intro sau de final și sunteți gândiți la o anumită melodie, dar este protejată de drepturi de autor”, spune Chourdakis. “Sistemul folosește AI pentru a vă ajuta să găsiți ceva similar”.
La Bwlb, echipa lui Taylor a dezvoltat Accordion, o soluție bazată pe AI care poate lua un podcast și reproduce-l la diferite lungimi.
“Orice altă parte a vieții noastre devine mai inteligentă — case inteligente, frigidere inteligente”, spune Taylor. “Oamenii doresc mai mult control și confort din experiența lor de podcast, de asemenea”.
Când Taylor a lucrat la documentare pentru BBC, i se cerea să creeze versiuni mai scurte pentru a rule pe diferite platforme. Procesul a fost întotdeauna manual. Accordion aplică algoritmi software la conținutul podcast-ului pentru a crea inteligent versiuni de lungimi diferite. “Asta nu accelerează nimic”, spune Taylor, “dar oferă utilizatorului control asupra duratei conținutului fără a pierde structura sau ascultabilitatea”.
Punerea accentului pe povestirea imersivă
Cu cât podcast-erii folosesc mai mult instrumente AI, cu atât devin mai bune. Adică, cu cât mai multe date ingerează, cu atât mai mult învață.
Algoritmii de îmbunătățire a dialogului de la Nomono se bazează pe seturi mari de date de înregistrări vocale — unele curate și inteligibile, altele mai puțin — care învață instrumentele AI cum să genereze sunet mai bun. “Podcast-erii nu ar trebui să aibă nevoie de cunoștințe avansate de audio pentru a produce audio de înaltă calitate”, spune Chourdakis. “Prin automatizarea unor dintre aceste sarcini, ei pot petrece mai mult timp concentrându-se pe o povestire minunată și mai puțin timp pe sarcinile de curățare tedioase”.
Și în viitor, ei pot evolua mai ușor pentru a crea un nou gen de podcast-uri spațiale imersive. De exemplu, tehnologia Nomono permite producția de audio bazată pe obiecte, care permite producătorilor să “plaseze” voci într-un peisaj sonor 3D sau să creeze versiuni dinamice care pot fi personalizate pentru ascultători.
“Producția de media a intrat acum într-o fază în care, dacă poți visa, poate fi realizat”, spune LeBoeuf de la Descript. “Și nu mai ai nevoie de un studio scump sau de decenii de pregătire pentru a-ți atinge obiectivele”.












