Yapay Zeka
Çağrı Merkezi Görüşmeleri için Yapay Zeka Tabanlı Yalan Dedektörü

Almanya'daki araştırmacılar, öncelikle çağrı merkezi ve destek personeli ile sesli iletişim kuran müşteriler için yapay zeka tabanlı bir yalan makinesi görevi görmesi amaçlanan bir ses analiz sistemi oluşturmak için makine öğrenimini kullandı.
MKS sistem İdam cezasının ahlakı ve öğrenim ücretleri de dahil olmak üzere tartışmalı konulardaki tartışmalar sırasında 40 öğrenci ve öğretmenin özel olarak oluşturulmuş ses kayıtlarından oluşan bir veri seti kullanıyor. Model, Evrişimli Sinir Ağları (CNN'ler) ve Uzun Kısa Süreli Bellek (LSTM) kullanan bir mimari üzerinde eğitildi ve %98'lik bir raporlanan doğruluk oranına ulaştı.
Çalışmanın belirtilen amacı müşteri iletişimlerinden alıntı yapsa da, araştırmacılar onun genel amaçlı bir yalan dedektörü olarak etkili bir şekilde çalıştığını kabul ediyor:
Bulgular, çok çeşitli hizmet süreçlerine uygulanabilir ve özellikle telefon aracılığıyla gerçekleşen tüm müşteri etkileşimleri için yararlıdır. Sunulan algoritma, temsilcinin bir müşterinin kendi inancına göre konuşup konuşmadığını bilmesinin yararlı olduğu her durumda uygulanabilir.
'Bu, örneğin şüpheli sigorta taleplerinin veya iş görüşmelerinde verilen yanlış ifadelerin azalmasına yol açabilir. Bu, hizmet şirketlerinin operasyonel kayıplarını azaltmakla kalmayacak, aynı zamanda müşterileri daha doğruyu söylemeye teşvik edecektir.'
Veri Kümesi Oluşturma
Almanca dilinde halka açık uygun bir veri kümesinin yokluğunda, Neu-Ulm Uygulamalı Bilimler Üniversitesi'nden (HNU) araştırmacılar kendi kaynak malzemelerini oluşturdular. El ilanları üniversiteye ve yerel okullara asıldı ve en az 40 yaşında olan 16 gönüllü seçildi. Gönüllülere 10 avroluk bir Amazon kuponu verildi.
Oturumlar, fikirleri kutuplaştırmak ve kışkırtıcı konular etrafında güçlü tepkiler uyandırmak için tasarlanmış bir münazara kulübü modelinde yürütüldü ve telefondaki sorunlu müşteri konuşmalarında oluşabilecek stresi etkili bir şekilde modelledi.
Gönüllülerin topluluk önünde üç dakika boyunca özgürce konuşmak zorunda kaldıkları konular şunlardı:
– Almanya'da ölüm cezası ve kamuya açık infazlar yeniden getirilmeli mi?
– Almanya'da maliyeti karşılayan öğrenim ücretleri alınmalı mı?
– Eroin ve kristal meth gibi sert uyuşturucuların kullanımı Almanya'da yasallaştırılmalı mı?
– McDonald's veya Burger King gibi sağlıksız fast food sunan restoran zincirleri Almanya'da yasaklanmalı mı?
Ön İşleme
Proje, konuşmanın dilsel düzeyde analiz edildiği ve söylemin 'sıcaklığının' doğrudan dil kullanımından çıkarıldığı NLP yaklaşımı yerine Otomatik Konuşma Tanıma (ASR) yaklaşımında akustik konuşma özelliklerinin analizini tercih etti.
Önceden işlenmiş ekstrakte edilen numuneler başlangıçta, konuşma analizinde hala çok popüler olan güvenilir, eski bir yöntem olan Mel-frekans Cepstral Katsayıları (MFCC'ler) aracılığıyla analiz edildi. Yöntem ilk kez 1980'de önerildiğinden bu yana, konuşmadaki yinelenen kalıpları tanıma açısından bilgi işlem kaynakları açısından oldukça tutumludur ve çeşitli ses yakalama kalitesi düzeylerine dayanıklıdır. Oturumlar Aralık 2020'de karantina koşullarında VOIP platformları üzerinden gerçekleştirildiğinden, gerektiğinde düşük kaliteli sesi hesaba katabilecek bir kayıt çerçevesine sahip olmak önemliydi.
Yukarıda belirtilen iki teknik sınırlamanın (1980'lerin başındaki sınırlı CPU kaynakları ve yoğun bir ağ bağlamında VOIP bağlantısının tuhaflıkları) burada bir araya gelerek, ideal çalışma koşullarının ve yüksek seviyeli kaynakların yokluğunda (görünüşe göre) alışılmadık derecede sağlam olan ve sonuçta ortaya çıkan algoritmanın hedef alanını taklit eden, etkili bir şekilde 'teknik olarak seyrek' bir model oluşturması ilginçtir.
Bundan sonra Hızlı Fourier Dönüşümü (FFT) algoritması, Mel Ölçeğine nihai eşleme yapılmadan önce her bir 'ses karesinin' spektral profilini sağlamak için ses segmentlerine uygulandı.
Eğitim, Sonuçlar ve Sınırlamalar
Eğitim sırasında, çıkarılan öznitelik vektörleri, zaman dağılımlı bir evrişimli ağ katmanına geçirilir, düzleştirilir ve ardından bir LSTM katmanına geçirilir.

AI doğruluk dedektörü için eğitim sürecinin mimarisi. Kaynak: https://arxiv.org/ftp/arxiv/papers/2107/2107.11175.pdf
Son olarak, konuşmacının doğru olduğuna inandıkları şeyleri söyleyip söylemediğine dair ikili bir tahmin oluşturmak için tüm nöronlar birbirine bağlanır.
Eğitimden sonraki testlerde, sistem, niyeti ayırt etme açısından %98.91'e varan bir doğruluk düzeyi elde etti (konuşulan içeriğin amacı yansıtmayabileceği durumlarda). Araştırmacılar, çalışmanın ampirik olarak ses kalıplarına dayalı inanç tanımlamasını gösterdiğini ve bunun dilin NLP tarzı yapısökümü olmadan başarılabileceğini düşünüyor.
Sınırlamalar açısından, araştırmacılar test örneğinin küçük olduğunu kabul ediyor. Makale açıkça belirtmese de, düşük hacimli test verileri, varsayımların, mimari özelliklerin ve genel eğitim sürecinin verilere aşırı uyması durumunda daha sonraki uygulanabilirliği azaltabilir. Rapor, proje boyunca inşa edilen sekiz modelden altısının öğrenme sürecinin bir noktasında aşırı uyumlu olduğunu ve model için ayarlanan parametrelerin uygulanabilirliğini genelleştirmek için yapılacak daha fazla iş olduğunu belirtiyor.
Ayrıca, bu tür araştırmalar ulusal özellikleri hesaba katmalıdır ve makale, verilerin üretilmesine dahil olan Alman deneklerin, kültürler arasında doğrudan kopyalanamayan iletişim modellerine sahip olabileceğini belirtmektedir - bu tür herhangi bir çalışmada ortaya çıkması muhtemel bir durum. herhangi bir ulus






