Connect with us

Budoucnost podcastingu je AI

Myslitelé

Budoucnost podcastingu je AI

mm

Přibližně řečeno, asi 22 000 nových podcastů je spuštěno v měsíci. V současné době je v adresáři Apple Podcasts téměř 2,5 milionu (více než 71 milionů epizod), podle Podcast Industry Insights. A to jsou pouze ty, o kterých víme.

“Mnozí podcasteři již nejsou ani na velkých platformách. Jdou přímo k posluchačům, prodávají premium obsah a mají velký úspěch,” říká Andy Taylor, dříve z BBC Radio a zakladatel kardiffské výzkumné a vývojové společnosti Bwlb.

A nemluvme o rostoucím objemu podcastového obsahu, ať už vytvořeného značkami pro propagaci nebo producenty akcí, kteří chtějí například zpřístupnit přednášky na vyžádání. Každý kus obsahu musí být vyroben a distribuován, ať už audio profesionály nebo lidmi, kteří se učí řemeslu. Proto, čím více mohou automatizovat velké části produkce, tím více se mohou soustředit na obsah.

“Různá místa, kde je audio publikováno, prostě explodovala,” vysvětluje Jonathan Wyner, hlavní inženýr ve společnosti M Works Mastering a profesor na Berklee College of Music v Bostonu. “S těmito kontexty je zde skutečná motivace a imperativ pro tvůrce, aby byli více všestranní.”

Nemluvě o tom, aby byli produktivnější a efektivnější.

Vzestup AI

Umělá inteligence (AI) — software, který může automatizovat úkoly dříve prováděné lidmi — drží klíč k zvládnutí tsunami podcastového obsahu. AI nejen urychluje produkci, ale také může zlepšit kvalitu podcastů a nastavit scénu pro audio zkušenosti zítřka.

“AI基本ně pomáhá s opakujícími se úkoly, aby urychlila workflow podcastéra,” vysvětluje Manos Chourdakis, výzkumný inženýr ve společnosti Nomono, která vyvíjí AI-založené podcastové nástroje. “Například s AI nemusíte poslouchat celý podcast, abyste našli, kde někdo řekl něco špatně, a pak ho nahradit nebo odstranit. Můžete to udělat sami, ale AI to dělá rychleji.”

Pak jsou zde úkoly, které lze vykonat pouze s AI — alespoň ve velkém měřítku, jako je odstranění šumu nebo vylepšení dialogu. “Kvalitní vylepšení dialogu by bylo nemožné bez AI,” říká Chourdakis. “Aspoň nemožné v rozumném časovém rámci pomocí tradičních nástrojů.”

Perfektní pro podružné úkoly

Aplikace AI v podcastingu jsou tak rozmanité jako produkční úkoly. Některé jsou přímo vestavěny do podcastových platforem. Když tvůrci nahrávají své podcasty na hostingovou platformu Podcast.co, systém automaticky “poslouchá” audio soubory a normalizuje úroveň zvuku.

“Jakýkoli nástroj, který může pomoci snížit nudné části práce, je dobrá věc,” říká Mike Cunsolo, spoluzakladatel platformy. Cunsolo také provozuje Cue, podcastovou produkční společnost, která spolupracuje s korporátními značkami, a Matchmaker.fm, která spojuje podcastové producenty s hosty. “Vždy budete potřebovat ten lidský odborný prvek, ale brzy mohou stroje naučit, co dělá podcast zajímavým a snížit čas na úkol.”

Solution provider Descript aplikuje AI na mnoho aspektů podcastového inženýrství, včetně odstranění šumu a kontroly ozvěny. Jedním z více “nudných” úkolů, které Descript může zvládnout, je pokojový tón.

“Někdy producenti potřebují vložit digitální ticho do podcastu. Možná mezi editacemi nebo aby táhli mezery mezi větami,” říká Jay LeBoeuf, vedoucí podnikání a firemního rozvoje ve společnosti Descript. “Ale to zní neuvěřitelně nepřirozeně.”

Pokud producenti nezachytili pokojový tón, když byl podcast nahrán, mohou jít zpět a získat ho. Nebo mohou poslouchat, kopírovat a vkládat, kde je třeba, a pak editovat výsledek, aby se spojil přirozeně.

Nebo počítače mohou zvládnout. AI-založený generátor pokojového tónu Descript analyzuje nahrávku, identifikuje pokojový tón a automaticky syntetizuje, kde je třeba. Taková technologie nejen zruší podružné úkoly, ale také umožní větší flexibilitu produkce.

“AI umožní nám používat méně drahé hardware, horší znějící místnosti a hlučnější lokace a stále získat dobré výsledky,” říká Chourdakis z Nomono.

Nové AI-založené schopnosti

AI také otevírá dveře inovacím v podcastingu — vytváří nové řešení, které zvyšují laťku pro podcastery a posluchače. Například nástroj Epidemic Audio Reference (EAR) pomáhá podcastérům najít autorskými právy chráněnou hudbu na základě písní, které se jim líbí.

“Říkejte, že hledáte úvodní nebo závěrečnou hudbu a myslíte na konkrétní píseň, ale je chráněna autorskými právy,” říká Chourdakis. “Systém používá AI pod kapotou, aby vám pomohl najít něco podobného.”

V Bwlb Taylorův tým vyvinul Accordion, AI-založené řešení, které může vzít podcast a reprodukovat ho v různých délkách.

“Každá jiná část našeho života se stává chytřejší — chytré domy, chytré ledničky,” říká Taylor. “Lidé chtějí více kontroly a pohodlí ze své podcastové zkušenosti, také.”

Když Taylor pracoval na dokumentárních filmech pro BBC, byl požádán o kratší verze pro spuštění na různých platformách. Proces byl vždy manuální. Accordion aplikuje softwareové algoritmy na podcastový obsah, aby inteligentně vytvořil verze různých délek. “To nezrychluje nic,” říká Taylor, “ale dává uživateli kontrolu nad délkou obsahu bez ztráty tónu, struktury nebo poslouchatelnosti.”

Umístění zaměření na imerzivní vyprávění

Čím více podcastéři používají AI nástroje, tím lepší se stávají. Jinými slovy, čím více dat spotřebují, tím více se učí.

Algoritmy pro vylepšení dialogu Nomono jsou založeny na velkých datech hlasových nahrávek — některé čisté a srozumitelné, některé méně — které učí AI nástroje, jak generovat lepší zvuk. “Podcastéři by neměli potřebovat pokročilé audio znalosti, aby produkovali vysokou kvalitu audio,” říká Chourdakis. “Automatizací některých z těchto úkolů mohou strávit více času zaměřením se na skvělé vyprávění a méně času na nudné úkoly čištění.”

A v budoucnu mohou evoluce snadno vytvořit nový žánr imerzivních, prostorových podcastů. Například technologie Nomono umožňuje objektově založenou audio produkci, která umožňuje producentům “umístit” hlasy do 3D zvukového prostoru nebo vytvořit dynamické verze, které lze přizpůsobit posluchačům.

“Mediální produkce nyní vstupuje do fáze, kdy pokud si můžete něco představit, může to být skutečné,” říká LeBoeuf z Descript. “A již nemusíte mít drahé studio nebo desetiletí tréninku, abyste dosáhli svých cílů.”

Brad Grimes je dlouholetý technologický novinář a bývalý ředitel komunikace Audiovisual and Integrated Experience Association.