Yapay Zeka

Araştırmacılar Derin Sinir Ağları ile İnsan Konuşması Tanıma Modeli Geliştiriyor

Yayınlanan 3 Mart, 2022

Güncellenmiş 9 Aralık 2022

Alex McFarland

Almanya'dan bir grup araştırmacı, makine öğrenimi ve derin sinir ağlarına dayanan yeni bir insan konuşması tanıma modelini araştırıyor. Yeni model, insan konuşmasının tanınmasını büyük ölçüde geliştirmeye yardımcı olabilir.

İşitme cihazı algoritmaları genellikle insan konuşmasını tanımayı iyileştirmek için kullanılır ve belirli sayıda kelimenin tanındığı sinyal-gürültü oranını belirleyen çeşitli deneylerle değerlendirilir. Ancak, bu deneyler genellikle zaman alıcı ve pahalıdır.

Yeni model, yayınlanan araştırmada ayrıntılı olarak açıklandı. Amerika Akustik Derneği Dergisi.

İşitme Engelli Dinleyiciler İçin Tahminler

Jana Rossbach, Carl Von Ossietzky Üniversitesi'nden yazarlardan biridir.

Rossbach, "Modelimizin yeniliği, işitme engelli dinleyiciler için çok farklı karmaşıklığa sahip gürültü türleri için iyi tahminler sağlaması ve ölçülen verilerle hem düşük hatalar hem de yüksek korelasyonlar göstermesidir" dedi.

Araştırma ekibi, otomatik konuşma tanıma (ASR) aracılığıyla bir dinleyicinin cümle başına kaç kelime anlayabileceğini hesapladı. Alexa ve Siri gibi konuşma tanıma araçları, yaygın olarak bulunan bu ASR'ye güvenir.

Çalışma ve Sonuçlar

Ekip tarafından yürütülen çalışmaya sekiz normal işiten ve 20 işitme engelli birey dahil edildi. Dinleyiciler, konuşmayı gizleyen birçok farklı karmaşık gürültüye maruz bırakıldı ve işitme engelli dinleyiciler, yaşa bağlı işitme kaybı seviyelerine göre üç gruba ayrıldı.

Yeni model sayesinde araştırmacılar, farklı derecelerde işitme kaybı olan işitme engelli dinleyicilerin insan konuşma tanıma performansını tahmin edebildiler. Bu tahminleri, zamansal modülasyonda farklı karmaşıklıklara ve gerçek konuşmaya ne kadar benzer olduklarına sahip çeşitli gürültü maskeleyiciler için yapabildiler. Tüm bunlar, olası işitme kaybı açısından her bir kişinin bireysel olarak gözlemlenmesini ve analiz edilmesini sağladı.

"Tahminlerin tüm gürültü türleri için iyi sonuç vermesine en çok şaşırdık. Modelin tek bir rakip konuşmacı kullanırken sorun yaşamasını bekliyorduk. Ancak durum böyle değildi,” dedi Rossbach.

Model tek kulaklı işitmeye odaklandığından, ekip şimdi iki kulaklı işitme için çift kulaklı bir model oluşturmaya çalışacak. Ayrıca, yeni modelin dinleme çabasını veya konuşma kalitesini de tahmin etmek için kullanılabileceğini söylüyorlar.

İlgili konular:AI yapay zeka derin öğrenme

Alex McFarland

Alex McFarland, yapay zekadaki en son gelişmeleri araştıran bir yapay zeka gazetecisi ve yazarıdır. Dünya çapında çok sayıda yapay zeka girişimi ve yayınıyla işbirliği yaptı.

Unite.AI

Araştırmacılar Derin Sinir Ağları ile İnsan Konuşması Tanıma Modeli Geliştiriyor

İşitme Engelli Dinleyiciler İçin Tahminler

Çalışma ve Sonuçlar

Beğenebilirsin