Anderson’un Açısı
Yapay Zeka Gerçek Bir Kişiyle Daha Hızlı Bağlantı Kurmanıza Yardım Edebilir

Yeni bir araştırmaya göre, açık kaynaklı ChatGPT tarzı AI kurulumları, doğal dil kullanarak, her hafta değişen ve kasıtlı olarak engelleyici gibi görünen sinir bozucu menü seçeneklerini takip etmeden, çağrı merkezinde doğru kişiye çağrıları yönlendirebilir.
Gerçek bir kişiye ulaşmak için çağrı merkezine ulaşmaya çalışmak, genellikle yavaş bir tempoda çoklu seçim seçeneklerini gezinmek zorunda kalma nedeniyle sinir bozucu bir deneyim olabilir – genellikle durumunuzun hangisine uygun olduğunu bilmeksizin. Hiçbiri uygun değilse, deneyimli kullanıcılar genellikle bir insan danışmanına erişmek ve ‘seçenek cehenneminden’ kurtulmak için hileler ve çalışma yöntemleri benimserler. Bizim çoğumuz bu deneyimi daha çok veya menos ‘savaşçı’ ve kullanıcı dostu olarak tanır.
Şaşırtıcı olmayan bir şekilde, çağrı merkezleri; AI sistemleri tarafından güçlendirilmesi veya değiştirilmesi için ön saflardadır ve, bazı kesimlerden dikkatli bir yaklaşım önerilmesine rağmen, çağrı merkezi AI otomasyonu, teknoloji başlıkları ve AI tabanlı yenilik için erken ROI umudu için düşük asma meyvelerdir.
Kapalı Dükkan
Ancak bazı alanlar vardır ki, açık kaynak ilkeleri ve serbestçe kullanılabilir veriler burada nadiren uygulanır veya mevcuttur, ve bu da buradadır. Mantıklıdır: Müşteri yanıt sistemlerini otomatikleştirmek isteyen herhangi bir şirket, kazandıkları içgörülerini, metodolojilerini veya kurumsal IP’lerini güçleştireceğinden, bu kaynakları paylaşma konusunda sınırlı veya sıfır ilgi gösterecektir.
Birincisi, bu kaynakları paylaşmak, rakiplerle bir avantajını kaybetmesine neden olacaktır; daha da önemlisi, AI-ile çalışan sistemlerin ifşa etmeye eğilimli olması nedeniyle, yasal olarak risklidir.
Bu, birkaç iyi yatırımlı oyuncunun, birbirlerinden bağımsız olarak AI destekli çağrı merkezi yanıt sistemleri geliştirmesine ve B2B başlangıçlar ve kurulmuş oyuncuların AI destekli müşteri yanıt yetenekleri için artan talebi karşılamak için yola çıkmasına neden olmuştur.

Bir PolyAI ses asistanı, kurgusal şirket ‘Augusta Lawn Care’ için bir müşteri hizmeti çağrısını açar, mevcut çağrı merkezi altyapısı aracılığıyla otomatik yanıtları büyük miktarda eğitim konuşmalarına dayanarak sağlar. Kaynak
Ayrıca, çağrı merkezi labirentinin sinir bozucu deneyimini ortadan kaldırmak için yapılan yarış, araştırma çabalarına bir teşvik olmuştur – ancak bu tür yayınların çoğu, genellikle Arxiv ve diğer açık araştırma yayınlama ağlarından uzakta gerçekleşir, IVR geliştirme’nin genellikle gizli doğası ile tutarlı olarak.
Bunun yerine, AI müşteri yanıt sistemlerinin otomasyonuna ilişkin araştırma, veri ve iş zekası, genellikle Unite.ai gibi açık kaynak seçeneklerinden ziyade, çok az açık kaynak seçeneğiyle birlikte, kıskançça korunur – hatta FOSS sistemleri ve verilerin yasal olarak sound bir seçenek sunduğu şüpheli olsa da.
Yerel Çağrı
Bununla birlikte, Kolombiya’dan bir yeni makale, en azından biraz, IVR’yi kurumsal kasasından çıkarmaya çalışıyor. Yeni çalışma, IVR Dokunma Tonları Ötesinde: LLM’ler Kullanılarak Müşteri Niyeti Yönlendirme adlı bir entry, Bogotá’daki Universidad Distrital Francisco José de Caldas’tan bir araştırmacıdan geliyor ve LLM’leri kullanarak çalışan bir Müşteri Niyeti Yönlendirme (CIR) sistemi için işleyen bir şema üretmek için kapalı olmayan ilk proje olduğunu iddia ediyor.
Gerçek çağrı verilerine veya özel menü ağaçlarına erişmeye çalışmak yerine, yeni proje, tüm bileşenleri üç AI modeli kullanarak sıfırdan üretir: biri gerçekçi bir çağrı merkezi menüsü icat etmek için; diğeri yüzlerce çağrı şikayetini simüle etmek için; ve üçüncüsü, bu şikayetleri doğru yere yönlendirmeye çalışan bir sohbet botu olarak hareket etmek için.
Sonuç, tamamen sentetik ancak inandırıcı bir test yatağıdır ve kurgusal bir telekom şirketini, 920 ayrı kullanıcı sorgusuyla birlikte içerir, bu da deneyin yasal risklerden kaçınmasını ve AI’nin belirsiz, karmaşık konuşmayı nasıl yorumlayabileceğini ve çağrıcıyı doğru kişiye bağlayabileceğini araştırmasını sağlar.
Testler, şemanın sistemi, ‘düzleştirilmiş’ menü seçeneklerine sahip olduğunda, çağrıcı şikayetlerini doğru çağrı merkezi varış noktasına %89,13’üne kadar doğru bir şekilde eşleştirebileceğini gösteriyor.
Çalışma ayrıca, çağrıcılar daha casual veya değişken dil kullandığında, AI’nin daha fazla hata yaptığını, ancak bu hataların bir kısmının AI’nin yanlış anlaması nedeniyle değil, telefon menüsünün kendisinin karmaşık olması nedeniyle meydana geldiğini buldu.
![Yeni proje kapsamında paylaşılan müşteri etkileşim örnekleri. [Kaynak] https://figshare.com/articles/dataset/Beyond_IVR_Touch-Tones_Customer_Intent_Routing_using_LLMs/30118690](https://www.unite.ai/wp-content/uploads/2025/10/figshare-examples-data.jpg)
Yeni proje kapsamında paylaşılan müşteri etkileşim örnekleri. Kaynak
Projenin verileri halka açık olarak sağlandı.
Yöntem
Üçlü yaklaşımın ilk modeli, kurgusal bir telekom şirketinin ayrıntılı bir telefon menüsü oluşturur; ikinci model, bazıları basit, diğerleri yeniden ifade edilmiş veya daha casual hale getirilmiş olan benzersiz çağrı mesajları üretir – bunlar, insanların yardım için aradığında nasıl konuştuğunu simüle etmek için kullanılır. Bununla ilgili olarak, projede 920 örnek üretildi.
Üçüncü model, her bir çağrıcıyı, yalnızca mesaj ve menü sürümüne dayanarak, doğru departmana bağlama görevi verildi: Bu şema, deneyin tam olarak tekrarlanabilir olmasını sağlarken, gerçek çağrı verilerine veya müşteri bilgilerini açığa çıkarmaya gerek kalmadan olanak sağladı:
![Üçlü yaklaşım için seçilen üç sistem. [Kaynak] https://arxiv.org/pdf/2510.21715](https://www.unite.ai/wp-content/uploads/2025/10/table-1-5.jpg)
Üçlü yaklaşım için seçilen üç sistem. Kaynak
Kullanılan üç model sırasıyla gpt-3.5-turbo; gpt-4o-mini; ve gpt-4.1-mini idi.
Inandırıcı bir müşteri hizmeti ortamını simüle etmek için, telefon menüsünü sıfırdan sentezlemek gerekliydi. İlgili veri setlerinin kıtlığı nedeniyle, gpt-3.5-turbo modeli, kurgusal bir telekom sağlayıcısı için tam, çok dallı bir yapı oluşturmak için yönlendirildi.
Her dal, faturalama, teknik destek, hesap yönetimi ve yeni hizmetler gibi hizmet alanlarını temsil etmek için yapılandırıldı, gerçekçi alt seçeneklerle ve ağaç boyunca değişken derinlikte.
Bu yapay menüden, daha sonra test için iki versiyon oluşturuldu: biri, bir insan tarafından tüm menüyü okumaya benzer şekilde, düz metin hiyerarşisi olarak; diğeri, her biri kendi düğme basın sekansına sahip olan bir endpoint listesi olarak.
Bu, sistemin hem ayrıntılı hem de ‘sadeleştirilmiş’ bir versiyonunda yönlendirme zorluğunu test etmesine olanak sağladı:

AI’ye, çağrıcıları doğru yere yönlendirmeye yardımcı olmak için iki telefon menüsü versiyonu sağlandı: bir düz metin hiyerarşisi ve bir doğrudan menü seçenekleri listesi.
Çağrı mesajlarını test için üretmek için, ikinci bir dil modeli kullanıldı – bu, bazıları basit, diğerleri yeniden ifade edilmiş veya daha casual hale getirilmiş olan benzersiz şikayet veya istek setleri üretti.
Her biri, gerçek çağrıcıların sorunlarını nasıl ifade edebileceğini simüle etmek için, birkaç yeniden ifade edilmiş versiyonlara genişletildi, ve değişken uzunluk, ton ve hatta küçük hatalar veya ‘doldurma’ dili değişiklikleri tanıtıldı.
Başlangıçta üretilen 920 çağrı mesajı, sistemin doğruluğunu test etmek ve gerçek dünya konuşmasının öngörülemezliğini simüle etmek için tasarlandı.
Üçüncü aşama, son modelin her bir çağrı mesajını, iki farklı IVR sistemi sunumu (yukarıdaki resme bakınız) temelinde doğru menü varış noktasına nasıl doğru bir şekilde eşleştirebileceğini test etti.
İlk versiyonda, AI’ye, her dalı ve alt seçeneği metin formunda açıklanan tam, ayrıntılı telefon ağacı verildi. İkinci versiyonda, yalnızca bir düğme sekansına bağlı son varış noktalarının bir listesi görüldü.
Hedef, daha sade bir menü versiyonunun, modelin her bir çağrıyı nereye yönlendireceğine karar vermesini daha kolay hale getirdiğini görmekti. Her iki durumda da, sistem bir mesaj aldı ve yalnızca yolu döndürmesi istendi, böylece otomatik puanlama kolaylaştırıldı.
İzolasyon
Test sonuçlarını bozmamak için, deney her bir modeli birbirlerinden izole tuttu: Telefon menüsü, ilk model tarafından tasarlandı, ancak sonra manuel olarak sonlandırıldı, böylece diğer sistemler için yabancı kaldı.
Çağrı mesajları daha sonra gpt-4o-mini tarafından ayrı olarak üretildi, yalnızca endpoint isimlerini kullanarak ve menü yapısına erişimi olmadan. Son olarak, gpt-4.1-mini, çağrı yönlendirmesini ele aldı, ancak yalnızca menü metnini ve gelen mesajları gördü ve bunların hiçbirini oluşturmaya dahil olmadı.
Metrikler
Yönlendirme sisteminin performansı nasıl ölçüleceğini belirlemek için, iki standart metrik kullanıldı: doğruluk modelin, tam doğru yolu (örneğin, 1‑2‑3) döndüren durumların yüzdesi olarak tanımlanmıştır. Hataların konumunu izole etmek için, her bir yolun diğerleriyle nasıl karıştırıldığını gösteren karışıklık matrisleri de oluşturuldu*. Değerlendirmeler, pandas ve scikit-learn kütüphaneleri kullanılarak Python’da gerçekleştirildi.
Sonuçlar
Testlerde, modelin doğruluğu, telefon menüsünün nasıl sunulduğuna güçlü bir şekilde bağlıydı: AI, düzleştirilmiş menü yolları listesi verildiğinde, daha basit veri kümesinde %89,13’lük bir doğruluk elde etti, bu da tam açıklamalı menü versiyonunda %81,30’luk bir doğruluğa karşılık geliyordu:

Üçüncü (LLM3) model için yönlendirme doğruluğu, farklı istem formatları ve veri kümesi türleri boyunca, düzleştirilmiş menü yollarının hiyerarşik açıklamalardan daha iyi performans gösterdiğini ve doğruluğun, girdi dilinin yeniden ifade edildiği veya gayriresmi hale getirildiği durumlarda biraz düştüğünü gösteriyor.
Bu model, daha büyük, dil olarak çeşitli veri kümesi için de geçerliydi, burada da düzleştirilmiş versiyon daha iyi performans gösterdi, %86,52’ye karşı %77,07 puan aldı.
Bu sonuçlar, makaleye göre, daha basit, liste tabanlı istemlerin, modelin sorguları daha güvenilir bir şekilde eşleştirmesine yardımcı olduğunu gösteriyor.
Doğruluk, çağrı mesajlarının paraphrase ve gayriresmi versiyonları tanıtıldığında biraz düştü, bu da gerçekçiliği artırdığını, ancak sınıflandırmanın daha zor hale geldiğini gösterdi.
Makale şöyle diyor:
‘Sonuçlarımız, LLM’lerin IVR yollarını düzleştirdiğinde (yani %89,13), verbose menü açıklamalarına (yani %77,07) kıyasla niyetleri daha doğru bir şekilde yönlendirdiğini gösteriyor, bu da gürültüyü azalttığı ve yönlendirme göreviyle daha iyi eşleştiği anlamına geliyor.
‘Bu, LLM’lerin sınıflandırma ayarlarında netlik ve özlülüğün performansını artırdığı ilkesini desteklemektedir.
‘Önemlisi, menüleri düzleştirilmiş yollara dönüştürmek, gerçek dünya kullanımında basit ve otomatikleştirilebilir bir işlemdir.’
Sonuç
En kapalı ve dışlayıcı araştırma dallarından birinde en azından bazı açık çalışmaların gerçekleştiğini görmek yenilikçi bir yaklaşım. Görülecek olan, LLM’leri bağlamsal olarak çerçeveleyen ‘çerçevelerin’ gelecekte gerekli olup olmayacağı veya modelin yalnızca (yerel olarak mevcut) iş zekasına erişmesi gerekip gerekmediği, bu durumun şirketin verileri üçüncü taraf sağlayıcılarla paylaşma ihtiyacını ortadan kaldırıp kaldırmayacağıdır.
Nihayetinde, burada çalışan daha geniş tasarım ilkeleri, çağrı merkezi dışında alanlarda da doğal olarak gelecekteki AI sistemleri tarafından benimsenecek gibi görünüyor, bu da bu kullanım durumuna kasıtlı olarak hizalanmayı gerektirmez.
* Kaynak makaleye bakınız.
İlk olarak Çarşamba, 29 Ekim 2025 tarihinde yayımlandı.










