Connect with us

Podcasting’in Geleceği AI

Düşünce Liderleri

Podcasting’in Geleceği AI

mm

Kabaca konuşmak gerekirse, her ay yaklaşık 22.000 yeni podcast yayına giriyor. Şu anda Podcast Industry Insights göre Apple Podcasts dizininde 2,5 milyondan fazla (71 milyonun üzerinde bölüm) podcast var. Ve bunlar sadece bildiklerimizin bir kısmı.

“Çok sayıda podcaster artık büyük platformlardan geçmiyor. Doğrudan dinleyicilerine gidiyorlar, premium içerik satıyorlar ve büyük başarı elde ediyorlar” diyor Andy Taylor, eski Bwlb kurucusu ve Cardiff merkezli bir Ar-Ge danışmanlık şirketinin sahibi.

Ve bu, tanıtımlar için markalar tarafından oluşturulan veya etkinlik üreticileri tarafından oluşturulan, Örneğin, konuşmaları talebe göre kullanılabilir hale getirmek isteyenlerin yarattığı podcast benzeri içeriklerin artan hacmine dair hiçbir şey söylemiyor. Her bir içerik parçasının üretilmesi ve dağıtılması gerekiyor, ister ses profesyonelleri tarafından isterse zanaatı öğrenen kişiler tarafından. Bu nedenle, üretimdeki büyük alanları otomatikleştirebildikleri ölçüde, içerik üzerinde daha fazla odaklanabilirler.

“Seslerin yayınlandığı farklı yerler patladı” diyor Berklee College of Music in Boston‘da profesör ve M Works Mastering’in baş mühendisi Jonathan Wyner. “Tüm bu bağlamlarla birlikte, yaratıcıların daha çok yönlü olması için gerçek bir motivasyon ve zorunluluk var.”

Söz konusu daha üretken ve verimli olmak değil.

AI’ın Yükselişi

Yapay zeka (AI) — önceden insanlar tarafından yapılan görevleri otomatikleştirebilen yazılım — podcast içeriği tsunamisini ele almak için anahtarı elinde tutuyor. AI sadece üretimi hızlandırarak değil, aynı zamanda podcast’lerin sesini iyileştirebilir ve yarının ses deneyimlerinin sahnesini hazırlayabilir.

“AI temelde podcaster’ların iş akışını hızlandırmak için tekrarlanan görevlere bakmayı üstlenir” diyor Nomono‘da araştırma mühendisi Manos Chourdakis. “Örneğin, AI ile bir podcast’in tamamını dinlemenize gerek kalmaz, jemandın yanlış bir şey söylediği yeri bulup değiştirebilir veya kaldırabilirsiniz. Bunu kendiniz de yapabilirsiniz, ancak AI bunu daha hızlı yapar.”

Sonra, yalnızca AI ile yapılabilen — en azından ölçek olarak — görevler var, Örneğin gürültüyü kaldırmak veya diyalogu geliştirmek. “İyi kaliteli diyalog geliştirme geleneksel araçlar kullanılarak makul bir zaman diliminde imkansız olurdu” diyor Chourdakis.

Menial Görevler için İdeal

Podcasting’de AI uygulamaları üretim görevleri kadar çeşitli. Bazıları doğrudan podcast platformlarına entegre edilmiştir. Yaratıcılar podcast’lerini Podcast.co gibi barındırma platformlarına yüklediğinde, sistem otomatik olarak ses dosyalarını “dinler” ve ses seviyelerini normalize eder.

“Herhangi bir araç, işin zihin uyuşturucu parçalarını azaltmaya yardımcı oluyorsa, bu iyi bir şeydir” diyor platformun ortak kurucusu Mike Cunsolo. Cunsolo ayrıca Cue adlı bir podcast yapım şirketi işletiyor ve kurumsal markalarla çalışıyor ve Matchmaker.fm adlı bir platform işletiyor, bu platform podcast yapımcılarını konuklarla buluşturuyor. “Her zaman insan uzmanlığı unsuruna ihtiyacınız olacak, ancak makineler bir podcast’in ilginç olanını anlamayı öğrenebilir ve görev süresini azaltabilir.”

Çözüm sağlayıcı Descript, gürültü kaldırma ve yankı kontrolü de dahil olmak üzere podcast mühendisliğinin birçok yönüne AI uygular. Descript’in ele alabileceği daha “zihin uyuşturucu” görevlerden biri oda tonudur.

“Bazen üreticiler bir podcast’e dijital sessizlik eklemelidir. Belki de düzenlemeler arasında veya cümleler arasındaki boşluğu uzatmak için” diyor Descript’in iş ve kurumsal gelişim başkanı Jay LeBoeuf. “Ancak bu son derece doğal görünmüyor.”

Üreticiler bir podcast kaydedilirken oda tonunu yakalamazlarsa, geri dönüp alabilirler veya kaydedilen yerde dinleyebilir, kopyalayabilir ve necesario olduğunda düzenleyerek doğal bir şekilde birleştirebilirler.

Veya bilgisayarlar bunu ele alabilir. Descript’in AI tabanlı oda tonu jeneratörü bir kaydı analiz eder, oda tonunu tanımlar ve otomatik olarak gerekli yerlerde sentezler. Böyle bir teknoloji sadece zihin uyuşturucu görevlerini ortadan kaldırmakla kalmaz, aynı zamanda daha büyük üretim esnekliği sağlar.

“AI, daha ucuz donanım, daha kötü sesli odalar ve daha gürültülü mekanlar kullanmamızı ve yine de iyi sonuçlar almamızı sağlayacak” diyor Nomono’nun Chourdakis.

Yeni AI Tabanlı Özellikler

AI ayrıca podcasting’de inovasyona da kapı açıyor — podcastçiler ve dinleyiciler için standartları yükselten yeni çözümler yaratıyor. Örneğin, Epidemic Audio Reference (EAR) aracı, podcastçilerın bir şarkıya benzer telif ücretsiz müzik bulmasına yardımcı olur.

“Şarkı için intro veya outro müziği arıyorsunuz ve belirli bir şarkı düşünüyorsunuz, ancak bu telif hakkı tarafından korunuyor” diyor Chourdakis. “Sistem, benzer bir şey bulmanıza yardımcı olmak için AI kullanıyor.”

Bwlb’de Taylor’ın ekibi, Accordion adlı bir AI tabanlı çözümü geliştirdi, bu çözüm bir podcast’i çeşitli uzunluklarda yeniden üretebilir.

“Hayatımızın her diğer kısmı akıllı hale geliyor — akıllı evler, akıllı buzdolapları” diyor Taylor. “İnsanlar podcast deneyimlerinden de daha fazla kontrol ve rahatlık istiyor.”

Taylor, BBC için belgeseller üzerinde çalışırken, farklı platformlarda çalışmak için daha kısa sürümler istendi. Sürekli manuel bir süreçti. Accordion, podcast içeriğine yazılım algoritmaları uygulayarak akıllıca farklı uzunluklarda sürümler oluşturur. “Hızlandırıyor değil” diyor Taylor, “ancak kullanıcıya içerik süresini kaybetmeden ton yapısı veya dinlenebilirlik olmadan kontrol etme imkanı veriyor.”

İmmersif Hikaye Anlatımına Odaklanma

Podcastçiler AI araçlarını ne kadar çok kullanırsa, o kadar iyi olurlar. Diğer bir deyişle, ne kadar çok veri alırlarsa, o kadar çok öğrenirler.

Nomono’nun diyalog geliştirme algoritmaları, bazıları temiz ve anlaşılır, bazıları menosu olan büyük ses kayıtları veri setlerine dayanır ve AI araçlarına daha iyi ses üretmesini öğretir. “Podcastçiler yüksek kaliteli ses üretmek için gelişmiş ses bilgisine ihtiyaç duymamalıdır” diyor Chourdakis. “Bu görevlerin bir kısmını otomatikleştirerek, büyük hikaye anlatımına odaklanabilir ve zihin uyuşturucu temizleme görevlerine daha az zaman harcayabilirler.”

Ve gelecekte, kolayca yeni bir tür olan immersif, spatial podcast’leri yaratmaya evrilebilirler. Örneğin, Nomono’nun teknolojisi nesne tabanlı ses üretimini sağlar, bu da üreticilerin sesleri 3D ses manzarasında “yerleştirmelerine” veya dinleyicilere göre dinamik sürümler oluşturmalarına olanak tanır.

“Medya üretimi şimdi bir aşamaya giriyor, burada hayal edilebiliyorsa gerçekleşebilir” diyor Descript’in LeBoeuf. “Ve artık pahalı bir stüdyoya veya on yıllar süren eğitime ihtiyacınız yok.”

Brad Grimes uzun süredir teknoloji gazetecisi ve Audiovisual and Integrated Experience Association'ın eski iletişim direktörüdür.