Connect with us

ポッドキャスティングの未来はAI

ソートリーダー

ポッドキャスティングの未来はAI

mm

大体の話、約22,000の新しいポッドキャストが1ヶ月に開始される。現在、Podcast Industry Insightsによると、Apple Podcastsディレクトリには約250万件(7100万エピソード以上)がある。それらは私たちが知っているものだけだ。

「多くのポッドキャスターは、現在、大手プラットフォームを通さずに、リスナーに直接プレミアムコンテンツを販売し、大きな成功を収めている」と、元BBCラジオのアンディ・テイラー(Andy Taylor)と、カーディフを拠点とするR&Dコンサルタント会社Bwlbの創設者は述べている。

そして、それは、ブランドがプロモーションのために作成したり、イベントプロデューサーがオンデマンドでトークを利用できるようにしたりする、ポッドキャストのようなコンテンツの増加については触れていない。すべてのコンテンツは、オーディオプロフェッショナルまたは技術を学んでいる人によって制作および配信される必要がある。したがって、制作の多くの部分を自動化することで、コンテンツに集中できる。

「オーディオが公開されている場所は、爆発的に増えている」と、M Works Masteringのチーフエンジニアであり、ボストンのバークリー音楽大学の教授でもあるジョナサン・ワイナー(Jonathan Wyner)は説明する。「そのような状況では、クリエイターがより多才でなければならないという、現実的な動機と義務がある。」

そして、より生産的で効率的であることも。

AIの台頭

人工知能(AI) — 人間が行っていたタスクを自動化できるソフトウェア — は、ポッドキャストコンテンツの津波に対処する鍵を握っている。AIは、制作を高速化するだけでなく、ポッドキャストの音質を向上させ、明日のオーディオ体験の舞台を整えることができる。

「基本的に、AIは繰り返しのタスクを処理して、ポッドキャスターのワークフローを迅速化する」と、AIベースのポッドキャスティングツールを開発するNomonoの研究エンジニア、マノス・チョルダキス(Manos Chourdakis)は説明する。「例えば、AIを使用すると、誰かが何かを間違って言ったところを探すために、全てのポッドキャストを聞く必要はなく、そこを置き換えるか削除することができる。你はそれを行うことができるが、AIはそれを行うのが速い。」

そして、AIなしでは、少なくとも規模では、ノイズを除去したり、ダイアログを強化したりするなどのタスクは実行できない。「高品質のダイアログ強化は、AIなしでは不可能 — 伝統的なツールを使用して、合理的な時間枠内で」とチョルダキスは言う。

単純なタスクに適している

ポッドキャスティングにおけるAIの応用は、制作タスクと同様に多様である。いくつかのツールは、ポッドキャストプラットフォームに直接組み込まれている。クリエイターがポッドキャストをホスティングプラットフォームPodcast.coにアップロードすると、システムは自動的にオーディオファイルを「聞き」、サウンドレベルを正規化する。

「仕事の面白くない部分を減らすことができるツールは、良いことだ」と、プラットフォームの共同創設者、マイク・カンソロ(Mike Cunsolo)は述べる。カンソロは、企業ブランドと協力するポッドキャスト制作会社Cueと、ポッドキャストプロデューサーをゲストと接続するMatchmaker.fmも運営している。「人間の専門知識が必要になるだろうが、機械は将来、ポッドキャストが面白いものであることを理解し、タスクに費やす時間を減らすことができるだろう。」

ソリューションプロバイダーDescriptは、ノイズ除去やエコー制御を含むポッドキャストエンジニアリングの多くの側面にAIを適用している。Descriptが処理できるより「面白くない」タスクの1つは、ルームトーンである。

「時々、プロデューサーは、編集の間や文の間のスペーシングを引き伸ばすために、デジタルサイレンスをポッドキャストに挿入する必要があるかもしれない」と、Descriptのビジネスおよびコーポレート開発担当、ジェイ・ルボフ(Jay LeBoeuf)は述べている。「しかし、それは非常に自然に聞こえない。」

プロデューサーがポッドキャストを録音したときにルームトーンをキャプチャしていない場合、戻ってそれを取得する必要があるか、録音でそれを聞き、必要な場所にコピーして貼り付け、自然にブレンドするように編集する必要がある。

またはコンピューターがそれを処理できる。DescriptのAIベースのルームトーンジェネレーターは、録音を分析し、ルームトーンを識別し、必要な場所に自動的に合成する。这种技術は、単純なタスクを除去するだけでなく、制作の柔軟性も向上させる。

「AIは、より安価なハードウェア、悪い音質の部屋、より騒がしい場所を使用して、依然として良い結果を得ることができるだろう」と、Nomonoのチョルダキスは述べている。

新しいAIベースの機能

AIはまた、ポッドキャストの新しいソリューションを作成する扉を開き、ポッドキャスターとリスナーにとっての標準を高める。例えば、Epidemic Audio Reference(EAR)ツールは、ポッドキャスターが好きな曲に基づいて、著作権フリーの音楽を見つけるのに役立つ。

「例えば、イントロやアウトロの音楽を探しているが、特定の曲を考えているが、それは著作権で保護されている」とチョルダキスは説明する。「システムは、下層でAIを使用して、似たようなものを見つけるのに役立つ。」

Bwlbでは、テイラーのチームは、Accordionを開発した。これは、ポッドキャストをさまざまな長さで再生できるAIベースのソリューションである。

「私たちの生活の他の部分はすべて、スマート化している — スマートホーム、スマート冷蔵庫」とテイラーは述べている。「人々は、ポッドキャスト体験からも、より多くのコントロールと利便性を求めている。」

テイラーがBBCのドキュメンタリーに取り組んでいたとき、彼は異なるプラットフォームで実行するためのショートバージョンを依頼されていた。プロセスは常に手動で行われていた。アコーディオンは、ソフトウェアアルゴリズムをポッドキャストコンテンツに適用して、知的にさまざまな長さのバージョンを作成する。「それは何も速くはならないが、ユーザーは、トーン、構造、または聴きやすさを失うことなく、コンテンツの長さを制御できる」とテイラーは述べている。

没入型ストーリーテリングに焦点を当てる

ポッドキャスターがAIツールを使用するほど、それらはより優れてくる。つまり、インジェストするデータが多いほど、より多くを学ぶ。

Nomonoのダイアログ強化アルゴリズムは、清潔で明瞭なものと、不明瞭なものの両方を含む、大規模なボイスレコーディングのデータセットに基づいており、これらはAIツールに、より優れた音を生成する方法を教える。「ポッドキャスターは、高品質のオーディオを制作するために、先進的なオーディオ知識を必要とすべきではない」とチョルダキスは述べている。「これらのタスクを自動化することで、彼らは、面白いストーリーテリングに集中し、退屈なクリーンアップタスクに費やす時間を減らすことができる。」

そして、将来的には、オブジェクトベースのオーディオ制作を可能にするNomonoのテクノロジーを使用して、より簡単に進化し、新しい没入型、空間ポッドキャストのジャンルを作成できる。例えば、プロデューサーは、3Dサウンドスケープに声「を配置」したり、リスナーに合わせてカスタマイズできるダイナミックバージョンを作成できる。

「メディア制作は、今、夢見ることができるものはすべて実現可能な段階に入っている」と、Descriptのルボフは述べている。「そして、高価なスタジオや数十年のトレーニングが必要ではなくなった。」

Brad Grimesは、長年のテクノロジー・ジャーナリストであり、Audiovisual and Integrated Experience Associationの元コミュニケーション・ディレクターです。