سوات قائدین
پوڈ کاسٹنگ کا مستقبل AI ہے۔

تقریباً 22,000 نئے پوڈ کاسٹ ایک ماہ میں لانچ کیے جاتے ہیں۔ ایپل پوڈکاسٹ ڈائرکٹری میں اس وقت تقریباً 2.5 ملین (71 ملین سے زیادہ اقساط) ہیں، کے مطابق پوڈ کاسٹ انڈسٹری کی بصیرت. اور یہ صرف وہی ہیں جن کے بارے میں ہم جانتے ہیں۔
"بہت سارے پوڈ کاسٹر اب بڑے پلیٹ فارمز سے بھی نہیں گزر رہے ہیں۔ وہ براہ راست اپنے سامعین تک جا رہے ہیں، پریمیم مواد فروخت کر رہے ہیں اور بڑی کامیابی حاصل کر رہے ہیں،" اینڈی ٹیلر کہتے ہیں، جو پہلے BBC ریڈیو کے تھے اور کارڈف میں R&D کنسلٹنسی کے بانی تھے۔ Bwlb.
اور اس کا مطلب یہ ہے کہ پوڈ کاسٹ جیسے مواد کے بڑھتے ہوئے حجم کے بارے میں کچھ بھی نہیں کہنا، چاہے وہ برانڈز کے ذریعے پروموشن کے لیے بنائے گئے ہوں یا ایونٹ پروڈیوسرز جو چاہتے ہیں، مثال کے طور پر، بات چیت کو آن ڈیمانڈ دستیاب کرانا۔ مواد کے ہر ٹکڑے کو تیار اور تقسیم کرنے کی ضرورت ہے، چاہے وہ آڈیو پیشہ ور افراد ہوں یا ہنر سیکھنے والے افراد۔ لہذا، وہ جتنا زیادہ پیداوار کے بڑے حصوں کو خودکار کر سکتے ہیں، اتنا ہی وہ مواد پر توجہ مرکوز کر سکتے ہیں۔
"جن مختلف جگہوں پر آڈیو شائع ہو رہا ہے وہ ابھی پھٹ گئے ہیں،" جوناتھن وائنر ایم ورکس ماسٹرنگ کے چیف انجینئر اور ایک پروفیسر کی وضاحت کرتا ہے۔ بوسٹن میں برکلی کالج آف میوزک. "ان تمام سیاق و سباق کے ساتھ، تخلیق کاروں کے لیے زیادہ ورسٹائل ہونے کے لیے ایک حقیقی محرک اور ضروری ہے۔"
ذکر کرنے کی ضرورت نہیں، زیادہ پیداواری اور موثر۔
ع کی عروج
مصنوعی ذہانت (AI) — سافٹ ویئر جو پہلے انسانوں کے ذریعے کیے گئے کاموں کو خودکار کر سکتا ہے — پوڈ کاسٹ مواد کے سونامی سے نمٹنے کی کلید رکھتا ہے۔ AI نہ صرف پروڈکشن کو تیز کر سکتا ہے، بلکہ یہ پوڈ کاسٹ کو بہتر بنا سکتا ہے اور آنے والے کل کے آڈیو تجربات کے لیے سٹیج سیٹ کر سکتا ہے۔
"AI بنیادی طور پر پوڈ کاسٹر کے ورک فلو کو تیز کرنے کے لیے دہرائے جانے والے کاموں کا خیال رکھنے میں مدد کرتا ہے،" مانوس چورڈاکس، ریسرچ انجینئر کی وضاحت کرتے ہیں۔ nomono، جو AI پر مبنی پوڈ کاسٹنگ ٹولز تیار کرتا ہے۔ "مثال کے طور پر، AI کے ساتھ، آپ کو یہ معلوم کرنے کے لیے پورا پوڈ کاسٹ سننے کی ضرورت نہیں ہے کہ کسی نے کہاں کچھ غلط کہا ہے، پھر اسے تبدیل کریں یا ہٹا دیں۔ سکتا ہے یہ خود کریں، لیکن AI یہ تیزی سے کرتا ہے۔
اس کے بعد ایسے کام ہیں جو صرف AI کے ذریعے پورے کیے جا سکتے ہیں - کم از کم پیمانے پر، جیسے شور کو ہٹانا یا مکالمے کو بڑھانا۔ "اچھے معیار کے مکالمے میں اضافہ AI کے بغیر ناممکن ہو گا،" Chourdakis کہتے ہیں۔ "روایتی ٹولز کا استعمال کرتے ہوئے مناسب ٹائم فریم میں کم از کم ناممکن۔"
معمولی کاموں کے لیے بہترین
پوڈ کاسٹنگ میں AI کی ایپلی کیشنز پیداواری کاموں کی طرح مختلف ہیں۔ کچھ براہ راست پوڈ کاسٹ پلیٹ فارم میں بنائے گئے ہیں۔ جب تخلیق کار اپنے پوڈ کاسٹ ہوسٹنگ پلیٹ فارم پر اپ لوڈ کرتے ہیں۔ Podcast.co، سسٹم خود بخود آڈیو فائلوں کو "سنتا ہے" اور آواز کی سطح کو معمول پر لاتا ہے۔
پلیٹ فارم کے شریک بانی، مائیک کنسولو کا کہنا ہے کہ "کوئی بھی ٹول جو کسی کام کے دماغ کو بے حس کرنے والے بٹس کو کم کرنے میں مدد دے سکتا ہے ایک اچھی چیز ہے۔" کونسولو بھی چلتا ہے۔ اشارہ، کارپوریٹ برانڈز کے ساتھ کام کرنے والی ایک پوڈ کاسٹ پروڈکشن کمپنی، اور Matchmaker.fm، جو پوڈ کاسٹ پروڈیوسرز کو مہمانوں سے جوڑتا ہے۔ "آپ کو ہمیشہ اس انسانی مہارت کے عنصر کی ضرورت ہوگی، لیکن جلد ہی مشینیں یہ سمجھنا سیکھ سکتی ہیں کہ پوڈ کاسٹ کو کیا چیز دلچسپ بناتی ہے اور کام پر وقت کم کرتی ہے۔"
حل فراہم کرنے والا تفصیل پوڈ کاسٹ انجینئرنگ کے بہت سے پہلوؤں پر AI کا اطلاق ہوتا ہے، بشمول شور ہٹانا اور ایکو کنٹرول۔ مزید "ذہن کو بے حس کرنے والے" کاموں میں سے ایک جو ڈسکرپٹ کو سنبھال سکتا ہے وہ روم ٹون ہے۔
"بعض اوقات پروڈیوسروں کو پوڈ کاسٹ میں ڈیجیٹل خاموشی داخل کرنے کی ضرورت ہوتی ہے۔ ہوسکتا ہے ترمیم کے درمیان یا جملوں کے درمیان وقفہ کو گھسیٹنے کے لیے،" Descript میں کاروبار اور کارپوریٹ ڈویلپمنٹ کے سربراہ جے لیبوف کہتے ہیں۔ "لیکن یہ ناقابل یقین حد تک غیر فطری لگتا ہے۔"
اگر پروڈیوسر نے پوڈ کاسٹ کے ریکارڈ ہونے پر کمرے کے لہجے پر قبضہ نہیں کیا، تو انہیں واپس جا کر اسے حاصل کرنا پڑ سکتا ہے۔ یا وہ اسے ریکارڈنگ میں سن سکتے ہیں، جہاں ضرورت ہو کاپی اور پیسٹ کر سکتے ہیں، پھر نتیجہ میں ترمیم کر کے اسے قدرتی طور پر بلینڈ کر سکتے ہیں۔
یا کمپیوٹر اسے سنبھال سکتے ہیں۔ Descript کا AI پر مبنی روم ٹون جنریٹر ایک ریکارڈنگ کا تجزیہ کرتا ہے، کمرے کے ٹون کی شناخت کرتا ہے، اور جہاں ضرورت ہو اسے خود بخود ترکیب کرتا ہے۔ اس طرح کی ٹیکنالوجی نہ صرف معمولی کاموں کو روکتی ہے، بلکہ یہ پیداوار میں زیادہ لچک پیدا کرنے کی اجازت دیتی ہے۔
Nomono's Chourdakis کا کہنا ہے کہ "AI ہمیں کم مہنگے ہارڈ ویئر، بدتر آواز والے کمرے، اور شور مچانے والے مقامات استعمال کرنے کی اجازت دے گا اور پھر بھی اچھے نتائج حاصل کریں گے۔"
نئی AI پر مبنی صلاحیتیں۔
AI پوڈ کاسٹنگ میں جدت طرازی کا دروازہ بھی کھولتا ہے - ایسے نئے حل تیار کرنا جو پوڈ کاسٹروں اور سامعین کے لیے بار بڑھاتے ہیں۔ مثال کے طور پر، ایپیڈیمک آڈیو ریفرنس (ای اے آر) ٹول پوڈ کاسٹروں کو ان کی پسند کے گانوں کی بنیاد پر کاپی رائٹ سے پاک موسیقی تلاش کرنے میں مدد کرتا ہے۔
"کہیں کہ آپ انٹرو یا آؤٹرو میوزک تلاش کر رہے ہیں، اور آپ کسی خاص گانے کے بارے میں سوچ رہے ہیں، لیکن یہ کاپی رائٹ کے ذریعے محفوظ ہے،" چورڈاکس کہتے ہیں۔ "سسٹم AI کو ہڈ کے نیچے استعمال کرتا ہے تاکہ آپ کو کچھ ایسا ہی تلاش کرنے میں مدد ملے۔"
Bwlb میں، ٹیلر کی ٹیم نے ترقی کی۔ Accordion، ایک AI پر مبنی حل جو ایک پوڈ کاسٹ لے سکتا ہے اور اسے مختلف لمبائیوں پر دوبارہ تیار کرسکتا ہے۔
"ہماری زندگی کا ہر دوسرا حصہ ہوشیار ہوتا جا رہا ہے - سمارٹ ہومز، سمارٹ ریفریجریٹرز،" ٹیلر کہتے ہیں۔ "لوگ اپنے پوڈ کاسٹ کے تجربے سے بھی زیادہ کنٹرول اور سہولت چاہتے ہیں۔"
جب ٹیلر نے بی بی سی کے لیے دستاویزی فلموں پر کام کیا، تو ان سے مختلف پلیٹ فارمز پر چلانے کے لیے چھوٹے ورژن طلب کیے گئے۔ عمل ہمیشہ دستی تھا۔ Accordion مختلف طوالت کے ورژنز کو ذہانت سے تخلیق کرنے کے لیے پوڈ کاسٹ مواد پر سافٹ ویئر الگورتھم کا اطلاق کرتا ہے۔ "یہ کسی بھی چیز کو تیز نہیں کرتا ہے،" ٹیلر کہتے ہیں، "لیکن یہ صارف کو ٹون کی ساخت یا سننے کی صلاحیت کو کھوئے بغیر مواد کی مدت پر کنٹرول فراہم کرتا ہے۔"
عمیق کہانی سنانے پر توجہ مرکوز کرنا
جتنے زیادہ پوڈ کاسٹر AI ٹولز استعمال کریں گے، وہ اتنے ہی بہتر ہوں گے۔ دوسرے الفاظ میں، وہ جتنا زیادہ ڈیٹا کھاتے ہیں، اتنا ہی وہ سیکھتے ہیں۔
Nomono کے ڈائیلاگ بڑھانے والے الگورتھم صوتی ریکارڈنگ کے بڑے ڈیٹا سیٹس پر مبنی ہیں — کچھ صاف اور قابل فہم، کچھ کم — جو AI ٹولز کو بہتر آواز پیدا کرنے کا طریقہ سکھاتے ہیں۔ "پوڈکاسٹروں کو اعلیٰ معیار کی آڈیو تیار کرنے کے لیے جدید آڈیو علم کی ضرورت نہیں ہونی چاہیے،" چورڈاکس کہتے ہیں۔ "ان میں سے کچھ کاموں کو خودکار بنانے سے، وہ کہانی سنانے پر زیادہ توجہ مرکوز کرنے میں اور تھکا دینے والے کلین اپ کاموں پر کم وقت گزار سکتے ہیں۔"
اور مستقبل میں، وہ عمیق، مقامی پوڈکاسٹس کی ایک نئی صنف تخلیق کرنے کے لیے زیادہ آسانی سے تیار ہو سکتے ہیں۔ مثال کے طور پر، Nomono کی ٹکنالوجی آبجیکٹ پر مبنی آڈیو پروڈکشن کو قابل بناتی ہے، جو پروڈیوسرز کو 3D ساؤنڈ اسکیپ میں آوازیں "لگانے" یا متحرک ورژن بنانے کی اجازت دیتی ہے جو سننے والوں کے لیے موزوں ہو سکتے ہیں۔
"میڈیا پروڈکشن اب ایک ایسے مرحلے میں داخل ہو رہی ہے جہاں اگر آپ خواب دیکھ سکتے ہیں، تو یہ ہو سکتا ہے،" Descript کے LeBoeuf کا کہنا ہے۔ "اور اب آپ کو اپنے مقاصد کو پورا کرنے کے لیے مہنگے اسٹوڈیو یا دہائیوں کی تربیت کی ضرورت نہیں ہے۔"