Connect with us

Tankeledere

Fremtiden for podcasting er AI

mm

Groft sagt, så lanceres omkring 22.000 nye podcasts hver måned. Der er tæt på 2,5 millioner (mere end 71 millioner episoder) i Apple Podcasts-kataloget lige nu, ifølge Podcast Industry Insights. Og det er kun dem, vi kender til.

“Mange podcastere går ikke engang gennem de store platforme mere. De går direkte til deres lyttere, sælger premiumindhold og har stor succes,” siger Andy Taylor, tidligere fra BBC Radio og grundlægger af Cardiff-baserede R&D-konsulent Bwlb.

Og det siger ikke noget om den voksende mængde podcast-lignende indhold, enten skabt af mærker til promotion eller begivenhedsproducenter, der vil, for eksempel, gøre tal tilgængelige på krav. Hvert stykke indhold skal produceres og distribueres, enten af audioprofessionelle eller folk, der lærer faget. Derfor, jo mere de kan automatisere store dele af produktionen, jo mere kan de fokusere på indholdet.

“De forskellige steder, hvor audio offentliggøres, er bare eksploderet,” forklarer Jonathan Wyner, chefingeniør på M Works Mastering og professor på Berklee College of Music i Boston. “Med alle disse sammenhænge, er der en reel motivation og imperativ for skabere at være mere alsidige.”

Ikke at tale om, mere produktive og effektive.

Opkomsten af AI

Kunstig intelligens (AI) — software, der kan automatisere opgaver, der tidligere blev udført af mennesker — holder nøglen til at håndtere tsunami af podcastindhold. Ikke kun kan AI accelerere produktionen, men den kan også gøre podcasts lyde bedre og sætte scenen for de audiooplevelser i morgen.

“AI hjælper grundlæggende med at tage sig af repetitive opgaver for at accelerere workflowet for podcasteren,” forklarer Manos Chourdakis, forskningsingeniør på Nomono, som udvikler AI-baserede podcastværktøjer. “For eksempel, med AI, behøver du ikke at lytte til en hel podcast for at finde, hvor nogen sagde noget forkert, og derefter erstatte eller fjerne det. Du kunne gøre det selv, men AI gør det hurtigere.”

Så er der opgaver, der kun kan udføres med AI — i hvert fald i stor skala, såsom fjernelse af støj eller forbedring af dialog. “Godkvalitetsdialogforbedring ville være umulig uden AI,” siger Chourdakis. “I hvert fald umulig på en rimelig tidsramme med traditionelle værktøjer.”

Perfekt til menialopgaver

Anvendelser af AI i podcasting er lige så varierede som produktionsopgaverne. Nogle er bygget direkte ind i podcastplatforme. Når skabere uploader deres podcasts til hostingplatformen Podcast.co, “lytter” systemet automatisk til lydfilerne og normaliserer lydniveauerne.

“Ethvert værktøj, der kan hjælpe med at reducere de sindssyge dele af en opgave, er en god ting,” siger Mike Cunsolo, platformens medstifter. Cunsolo driver også Cue, en podcastproduktionsselskab, der arbejder med corporate-mærker, og Matchmaker.fm, som forbinder podcastproducenter med gæster. “Du vil altid have brug for det menneskelige ekspertiseelement, men snart kan maskiner lære at forstå, hvad der gør en podcast interessant, og reducere tiden på opgaven.”

Løsningsudbyderen Descript anvender AI til mange aspekter af podcastteknik, herunder støjfjernelse og ekkocontrol. En af de mere “sindssyge” opgaver, som Descript kan håndtere, er rumtone.

“Nogle gange har producenter brug for at indsætte digital stilhed i en podcast. Måske mellem redigeringer eller for at trække ud spacingen mellem sætningerne,” siger Jay LeBoeuf, chef for forretnings- og korporativ udvikling på Descript. “Men det lyder utrolig unaturligt.”

Hvis producenterne ikke optog rumtonen, da podcasten blev optaget, kan de måske gå tilbage og få den. Eller de kan lytte efter den i optagelsen, kopiere og indsætte, hvor det er nødvendigt, og derefter redigere resultatet, så det blander naturligt.

Eller computere kan håndtere det. Descripts AI-baserede rumtonegenerator analyserer en optagelse, identificerer rumtonen og synthesizerer den automatisk, hvor det er nødvendigt. Sådan teknologi ikke kun eliminerer menialopgaver, men giver også mulighed for større produktionsflexibilitet.

“AI vil give os mulighed for at bruge billigere hardware, dårligere lydende rum og støjende lokaliteter og alligevel få gode resultater,” siger Nomono’s Chourdakis.

Nye AI-baserede funktioner

AI åbner også døren for innovation i podcasting — skabende nye løsninger, der løfter standarden for podcastere og lyttere. For eksempel hjælper Epidemic Audio Reference (EAR)-værktøjet podcastere med at finde ophavsretsfri musik baseret på sange, de kan lide.

“Så er du på udkig efter intro- eller outro-musik, og du tænker på en bestemt sang, men den er beskyttet af ophavsret,” siger Chourdakis. “Systemet bruger AI under hood til at hjælpe dig med at finde noget lignende.”

Ved Bwlb udviklede Taylors team Accordion, en AI-baseret løsning, der kan tage en podcast og reproducere den i forskellige længder.

“Hver anden del af vores liv bliver smartere — smarte hjem, smarte køleskabe,” siger Taylor. “Folk ønsker mere kontrol og bekvemmelighed fra deres podcastoplevelse også.”

Da Taylor arbejdede på dokumentarfilm for BBC, blev han bedt om kortere versioner til at køre på forskellige platforme. Processen var altid manuel. Accordion anvender softwarealgoritmer til podcastindhold for at intelligent skabe versioner af forskellige længder. “Det accelererer ikke noget,” siger Taylor, “men det giver brugeren kontrol over varigheden af indholdet uden at gå på kompromis med tonestruktur eller lyttbarhed.”

Fokus på immersiv fortælling

Jo mere podcastere bruger AI-værktøjer, jo bedre bliver de. Med andre ord, jo mere data de indtager, jo mere lærer de.

Nomono’s dialogforbedringsalgoritmer er baseret på store datasæt af stemmeoptagelser — nogle rene og forståelige, nogle mindre — som lærer AI-værktøjerne, hvordan de kan generere bedre lyd. “Podcastere behøver ikke avanceret audioviden for at producere højkvalitetsaudio,” siger Chourdakis. “Ved at automatisere nogle af disse opgaver, kan de bruge mere tid på at fokusere på stor fortælling og mindre tid på kedelige rensningsopgaver.”

Og i fremtiden kan de udvikle sig mere let til at skabe en ny genre af immersive, rumlige podcasts. For eksempel giver Nomono’s teknologi mulighed for objektbaseret audio-produktion, der tillader producenter at “placere” stemmer i et 3D-lydlandskab eller skabe dynamiske versioner, der kan tilpasses lyttere.

“Medieproduktion er nu inde i en fase, hvor hvis du kan drømme det, kan det ske,” siger Descripts LeBoeuf. “Og du har ikke længere brug for et dyrt studie eller årtiers træning for at opnå dine mål.”

Brad Grimes er en langvarig teknologi-journalist og tidligere kommunikationsdirektør for Audiovisual and Integrated Experience Association.