Connect with us

Nikola Mrksic, PolyAI’nin Kurucu Ortağı ve CEO’su – Röportaj Serisi

Röportajlar

Nikola Mrksic, PolyAI’nin Kurucu Ortağı ve CEO’su – Röportaj Serisi

mm

Nikola Mrksic, PolyAI‘nin kurucu ortağı ve CEO’sudur, PolyAI bir lider entreprise hazır ses asistanları tedarikçisidir.

İlk olarak sizi AI’ye neler çekti?

Matematik ve bilgisayar bilimlerine çok küçük yaşta ilgi duydum. Cambridge’de eğitim alırken, Steve Young ve Zoubin Ghahramani gibi önde gelen birçok makine öğrenimi araştırmacısıyla çalışma fırsatım oldu. Steve, benimle birlikte VocalIQ’de konuşma diyalog sistemleri üzerine çalışmak için beni ikna etti. Daha sonra, Steve ile birlikte veri odaklı dil anlama modelleri üzerine çalıştığım bir doktora yaptım ve bu modeller farklı kullanım durumları ve dillerde çalışabiliyordu. Konuşma AI’sı gerçekten zor ve karmaşık bir çalışma alanıdır ve birçok bilimsel ve mühendislik başarısı bizi bekliyor ve beni o günden beri meşgul ediyor.

2017’de PolyAI’yi, bir konuşma AI şirketi olarak başlattınız, PolyAI’nin arkasındaki oluşum hikayesini tartışabilir misiniz?

Kurucu ortaklarım Shawn Wen, Eddy Su ve ben, Cambridge’de aynı zamanda doktora yaptık. Yıllarca diyalog sistemleri üzerinde çalıştık, ancak sonunda, üzerinde çalıştığımız gibi gelişmiş sistemlerin çok az ticari uygulaması olduğunu fark ettik. Bu nedenle, gerçek dünyada faydalı olabilecek bir konuşma AI çözümü oluşturmak için bir araya geldik. Gerçekten konuşma, çoklu dönüş, işlem diyalog sistemleri için bir fırsat gördük ve bu sistemlerin günlük hayatta gerçek insanlarla etkileşime girebileceğini düşündük.

Müşteri hizmetlerine odaklandık, çünkü mevcut teknolojik yetenekler ve müşteri gereksinimlerinin iyi bir şekilde eşleştiğini hissettik.

Kullanılan bazı makine öğrenimi ve doğal dil işleme teknolojilerini tartışabilir misiniz?

Ana sırlarımızdan biri, milyarlarca doğal konuşmaya önceden eğitilmiş farklı özel kodlayıcı modellerimizdir. Bu modeller, girişte slang veya deyimler kullanıldığında bile niyeti çıkarabilir, bu da telefon üzerinden iletişim için son derece önemlidir. Müşteriler anahtar kelimelerle konuşmazlar, hikayeler anlatırlar, kesintiye uğratırlar, sorular sorarlar ve genel olarak konuşmayı kontrol etmek isterler.

Son zamanlarda ConVEx modelimizi duyurduk, bu model çok verimli bir varlık çıkarıcıdır ve bize konuşmalardan değerleri doğru bir şekilde çıkarmamızı sağlar.

ASR orkestrasyon sürecimiz, farklı aksanlardan kaynaklanan gürültüyü nötrleştirmek için konuşma tanıma platformlarını ince ayarlamak ve farklı bağlamlar için ince ayar yapmak içindir.

Ayrıca, müşteri hizmetleri işlemlerini içeren önceden tasarlanmış kullanım örnekleriyle birlikte oldukça güçlü bir diyalog politikası kütüphanesi geliştirdik, böylece müşteriler için yeni bir ses asistanı çok nhanh bir şekilde oluşturabiliriz.

İyi bir konuşma AI ürününü kötü bir konuşma AI ürününden ayıran şey nedir?

İyi bir ürün, kullanıcıların ne demek istediğini sürekli olarak anlayacaktır ve kullanıcıların kendilerini tekrarlamalarına asla izin vermeyecektir. Aramalar genellikle gürültülü ortamlarda gerçekleşir, bu nedenle ürünlerin girişlere karşı dayanıklı olması gerekir. Markalar büyük pazarlara ulaştıkça, ürünlerin çeşitli aksanları ve niyetleri ifade etme yollarını anlamaları gerekir. Bunların her ikisi de ürünlerin güçlü konuşma tanıma yetenekleri, dayanıklı niyet sınıflandırması ve varlık çıkarma garantisi gerektirir.

Harika bir ürün, kullanıcılar için aktif olarak ilgilendirici olacaktır. Kullanıcının düşünce akışını takip edebilecek ve kullanıcıların birden fazla niyet ve bilgi parçasını aynı anda paylaşabileceği, ayrıca kullanıcıların farklı bağlamlar arasında atlayabileceği karmaşık, günlük durumlarda başa çıkabilecektir. Bu, güçlü çok etiketli sınıflandırma ve bağlam yönetimi gerektirir.

İlgi çekici bir ürün, insan özelliklerini göstermeden tuhaf veya çok robotik olmayacak. Bu, hızlı etkileşimleri, gerçekçi sesleri, sürekli geri bildirim ipuçlarını ve bir miktar rastgelelik ve kusurları içerir.

Son olarak, harika bir konuşma AI ürünü, kullanıcılarla her yerde etkileşime girecek ve platforma özgü bir deneyimi sunacaktır, bu da ses, SMS, sohbet veya sosyal mesajlaşma platformları arasında olabilir. Etkileşim paradigmaları her iletişim platformunun özgüllüğünü benimsemelidir.

Şirketlerin konuşma AI yerine sohbet botlarına yönlendirme girişimlerine kıyasla konuşma AI kullanmasının bazı avantajları nelerdir?

Müşteri deneyimi kritiktir ve müşteri tutundurma için birincil sürücü olmuştur. Birinci öncelik, müşterilerin yapmak istediklerini yapmalarını kolaylaştırmalıdır.

Telefon, müşterilerin bir şirkete ulaşmak için tercih ettiği en yaygın kanaldır. Tüm müşteri etkileşimlerinin %65’i hala telefon üzerinden gerçekleşiyor. COVID-19 salgını sırasında, çağrı merkezleri daha önce hiç olmadığı kadar çok müşteri desteğiyle karşı karşıya kaldı.

Tabii ki, harika bir deneyim, müşterilerin nasıl iletişim kurduklarına bakılmaksızın, markaların aynı düzeyde deneyimi sunmasını sağlar, bu nedenle metin kanallarını tercih edenler için de basit bir deneyim sunarız.

Müşterinin söylemeye çalıştığı şeyin niyetini tespit etmek ne kadar zor?

Ses kanalları aracılığıyla müşterileri anlamakla ilgili bir dizi zorluk vardır. Kullanıcıların anlamını doğru ve tutarlı bir şekilde anlamak için birçok bileşenin iyi çalışması gerekir.

İlk olarak, konuşma tanıma zordur, özellikle insanlar gürültülü ortamlardan aradığında, örneğin hoparlörde veya trafik veya tünellerden sürerken. Konuşma tanıma, farklı aksanlara ve lehçelere sahip bölgelerde de zor olabilir. Konuşma tanıma modellerini verilen bağlama göre optimize etmek için etkili bir yol geliştirdik.

ConveRT modelimiz milyarlarca konuşmaya eğitildiği için, zayıf sinyallerde bile niyeti tespit edebilir, tıpkı insanların genellikle bir kelime veya iki kelime kaçırsalar bile ne dediklerini anlayabildikleri gibi.

Bir başka consideration, kullanıcıların aynı anda birden fazla eylem yapmasını isteyebilmesidir. Örneğin, biri “Kartımı kaybettim. Kullanılıp kullanılmadığını bana söyleyebilir ve kilitleyebilir misin?” diyebilir. Bu durumda, model iki niyeti tanımlamak ve mantıklı bir sırayla bunlara göre davranmalıdır.

Model ayrıca, müşterilerin sunduğu varlıkları çıkarmak ve anlamak zorundadır. Örneğin, “Cumartesi öğle yemeği için bana, eşime ve 2 çocuğuma bir masa var mı?” cümlesinde, yüzeydeki niyet, bir masa için kullanılabilirlik kontrolüdür, ancak model tarih (Cumartesi) ve kişi sayısını (4) ve müşterinin sağladığı diğer ilgili bilgileri çıkarmalıdır.

Son olarak, konuşma her zaman lineer değildir. Müşteriler, ses asistanının tetikleyicisine bağlı olmayan sorularla kesintiye uğratabilir, bu nedenle asistanın bir tür girişi “dinlemeye” açık olması ve farklı tetikleyicilere, Örneğin, sıkça sorulan sorulara veya kullanıcı tarafından daha önce sağlanan bilgilere yapılan değişikliklere açık olması gerekir.

Bir şirketin PolyAI ile konuşma AI botu başlatmak için gereken süreç ve zaman çizelgesi nedir?

Tangible iş etkileri olan ses asistanları sunmak için buradayız. Bu nedenle, her bir katılımı, müşterilerin CX hedeflerini, ana metriklerini ve destek süreçlerini tanımlamak ve ifade etmek için bir keşif ile başlatıyoruz. Bu, ses asistanının müşterileri yönlendireceği yolculukları belirlediğimiz yerdir. Bu, ayrıca önceden eğitilmiş ConveRT modelimiz sayesinde, müşterilerden büyük miktarda konuşma verisi gerektirmez.

Buradan, müşteriden çok az girdi gerektirmeden bir ses asistanı geliştirebiliriz, bu nedenle iç IT ekipleri için hiç de talepkar değildir.

Karmaşıklığa bağlı olarak, 2 hafta gibi kısa bir sürede bir kanıt değeri oluşturabilir ve 2 ay içinde tam bir dağıtım yapabiliriz.

Harika bir röportaj için teşekkür ederiz, daha fazla bilgi edinmek isteyen okuyucular PolyAI‘yi ziyaret edebilir.

Antoine bir vizyoner lider ve Unite.AI'in kurucu ortağıdır ve AI ve robotik geleceğini şekillendirmek ve tanıtmak için sarsılmaz bir tutkuyla hareket etmektedir. Bir seri girişimci olarak, toplum için elektrik kadar yıkıcı olacağına inandığı AI'nin potansiyeli hakkında sık sık konuşur ve coşkusunu dile getirir.
Bir futurist olarak, bu yeniliklerin dünyamızı nasıl şekillendireceğini keşfetmeye adanmıştır. Ayrıca, Securities.io kurucusudur, bu platform geleceği yeniden tanımlayan ve tüm sektörleri yeniden şekillendiren teknolojilere yatırım yapmaya odaklanmıştır.