Yapay Zekâ
Dr. Lingjia Tang, CTO ve Kurucu Ortağı, Clinc – Röportaj Serisi

Dr. Lingjia Tang, Clinc‘in CTO ve kurucu ortağı, Michigan Üniversitesi’nde Bilgisayar Bilimi profesörüdür. Dr. Tang’ın büyük ölçekli üretim altyapısı için akıllı uygulamalar oluşturma konusundaki araştırmaları akademik topluluk tarafından rộng olarak tanınmaktadır ve saygı görmektedir. Microsoft ve Google’da çalışmanın yanı sıra, Lingjia, Virginia Üniversitesi’nden Bilgisayar Bilimi alanında doktorasını almıştır. Lingjia, yakın zamanda ISCA Hall of Fame, Facebook Araştırma Ödülleri ve Google araştırma Ödülü gibi prestijli ödülleri almıştır.
Siz neler sizi AI’ye çekti? AI işini başlatmak istemenize ne yol açtı?
2000’lerin ortalarında, büyük ölçekli sistemler ve bu sistemlerin daha verimli çalışması için sunucuların nasıl tasarlanabileceği konusunda araştırmalar yapıyordum. O zamanlar, geleneksel web uygulamalarından daha çok makine öğrenimi odaklı işlevlere geçiyorduk. İşte o zaman AI ile ilgili algoritmalarla ilgilenmeye başladım ve AI uygulamalarının temel olarak nasıl çalıştığını anlamaya çalıştım. Kısa süre sonra, birlikte çalıştığım araştırma ekibi, kendi AI uygulamalarımızı oluşturarak bunları benchmark olarak kullanmaya karar verdi, bu da ilk araştırma makalelerimizi yayınlamamız ve ilk ürünümüzü, Sirius – açık uçlu ses ve görüş kişisel asistanı geliştirmemize yol açtı.
Açık kaynaklı bir yazılım olarak, Sirius, insanların kendi konuşma sanal asistanlarını oluşturmalarına olanak tanıyordu. O zamanlar, bu capability genel halk için çok sınırlıydı ve büyük şirketlerin, Google ve Apple’ın kontrolü altındaydı. Ancak, yazılımı yayınladığımızda ve ilk hafta içinde on binlerce indirme gördüğümüzde, kritik bir boşluğu doldurduğumuzu anladık. Bu, bizim için dönüm noktasıydı ve bu tür bir yazılım için büyük bir pazar talebi olduğunu anladık.
2015 yılında, herkesin – her geliştiricinin, şirketin, kişinin – sanal asistan oluşturmak için uzmanlık, araçlar ve inovasyona erişimine olanak tanımayı amaçlayarak Clinc’i kurduk.
Clinc, anahtar kelimelere veya komutlara güvenmeden konuşma AI çözümleri sunar. Bu nasıl gerçekleştirilir? Doğal Dil İşleme (NLP) açısından hangi zorlukların üstesinden gelinmiştir?
Clinc’i diğer konuşma AI platformlarından ayıran, temel AI algoritmalarının “odadaki insan” deneyimi sunmasıdır, bu da karmaşık ve komut dışı dili anlar. Bu, insan konuşmasında yapılan hataları düzeltmeye ve “iyileştirmeye” olanak tanır ve karmaşık konuşma akışlarını sağlar – gerçek bir insan tarafından anlaşılabilir konuşmalar. Konuşma-to-metne söz eşleştirme algoritmasıyla karşılaştırıldığında, Clinc, kullanıcı girdisinden dozens faktörleri analiz eder, bunlar arasında sözleşme, sentiment, intent, ses tonu, günün saati, konum ve ilişkiler bulunur ve bu faktörleri kullanarak, eğitilmiş beyininden çıkarılan bilgiyi temsil eden bir cevap verir. Örneğin, sanal asistanıma “bir burger için ne kadar para harcadım?” diye sorduğumda, paranın ve harcamanın söz edildiğini, specifically bir hamburgerden bahsedildiğini ve bir hamburgerin bir yemek türü olduğunu ve recent harcamalarımın bir restoranda yapıldığını anlamalıdır.
Bu düzeyde anlama elde etmek kolay değildir. Genel olarak, konuşma AI’yi iki bileşene ayırırız: Doğal Dil Anlama (NLU) ve diyalog yönetimi. Bizim üstesinden gelmemiz gereken zorluk, anahtar bilgilerini doğru bir şekilde çıkaran ve kullanıcıların ne sorduğunu tahmin edebilen bir sistem oluşturmaktı.
Sofistike, bağlamsal, üstten alta NLU ile bunu başarmaktayız, bu da konuşmanın doğal akışını takip edebilecek şekilde tasarlanmıştır, argo ve bağlamı anlar. Bu, rekabetçi çözümlerin kullandığı üstten alta, kurallara dayalı NLP yaklaşımının aksine, konuşma iyileşmesine izin vermez, yani kullanıcı bir hata yaptığında, rekabetçi çözümler kullanıcıyı başa döndürür, zaman kaybetmesine ve sadece kullanıcıyı kızdırmasına neden olur. Ayrıca, dil verilerini çıkarmak için kalabalık kaynak kullanıyoruz, böylece daha zengin ve çeşitli bir veri kümesi oluşturup AI modellerini eğitebiliyoruz.
Clinc AI sistemiyle derin öğrenmenin nasıl kullanıldığını tartışabilir misiniz?
Clinc, derin öğrenmeyi kısmen geleneksel eski okul modeliyle birleştirerek kullanıyor. Özellikle, kelimeleri ve dilleri anlamak ve diyalog akışını belirlemek için derin öğrenmeyi kullanıyoruz. Genel olarak, tüm diyalogumuz derin öğrenme ve sembolik AI’nin bir bileşimidir. Dil oluşturma için henüz derin öğrenmeyi kullanmıyoruz, çünkü müşterilerimiz主要 olarak bankacılık sektöründedir ve sanal asistanların müşterilerine neler söyleyip neler söyleyemeyeceğini belirleyen birçok düzenleme vardır. Bu nedenle, derin öğrenmenin bu dil kısıtlamalarına uyup uymayacağı konusunda hala belirsizlik vardır.
Şu anda, konuşma AI topluluğunun derin öğrenmeyi tamamen benimsemeye hazır olmadığını düşünmüyorum, ancak akademik topluluk %100 olarak derin öğrenmeye odaklanmış durumda. Yeni modellerin neler yapabileceğini görmek için sabırsızlanıyorum.
Bir şirket, AI’nın cevaplarını belirli bir kitleye hedeflemek için nasıl özelleştirebilir? Clinc’in şu anda müşterileri tarafından nasıl kullanıldığına ilişkin bazı örnekler verebilir misiniz?
Müşterilere, platformu lisanslama ve kendi başına oluşturma veya tamamen oluşturulmuş ve eğitilmiş sohbet botumuz Finie’yi özelleştirme ve uygulamalarına veya mesajlaşma hizmetlerine entegre etme seçeneği sunuyoruz. Finie, bakiyeler, işlemler, harcama geçmişi, ATM bulma, para transferi ve daha fazlasını ele alabilir.
Müşterilerin Clinc’in AI’sini belirli bir kitleye hedeflemek için özelleştirdiği en sevdiğim örnek, Türkiye’nin en büyük özel bankası İşbank’tır. 2018 yılında, İşbank bize dijital bankacılık asistanı Maxi’yi geliştirmek için döndü. Maxi’ye benzersiz bir kişilik kazandırmak için, İşbank 14 odak grubu düzenledi ve banka müşterilerinin bir sanal asistanda hangi özelliklere ve yeteneklere sahip olmak istediğini ölçtü. Ayrıca, bankacılık görevleriyle ilgili cümleleri Türkçe olarak okuyan bir seslendirme sanatçısı çalıştırdılar. İşbank’ın konuşma bankacılığı ekibi, gerçek insanların ihtiyaçlarını nasıl ifade edebileceğini düşünerek bu cümleleri oluşturdu. Önerimize göre, ekip Amazon Mechanical Turk gibi kalabalık kaynak pazarlarında katılımcılara farklı şekilde aynı soruları sormalarını sağladı, örneğin bakiyelerini görüntülemek (“bakiyem nedir”, “hesabimdaki para miktarı”, “hesabimdaki nakit miktarını göster”) veya bir faturayı ödemek (“faturamı öde”, “fatura ödemeleri”).
Bu örnek, İşbank’ın müşterilerine hesaplarını daha iyi yönetmelerine yardımcı olacak bir dijital bankacılık asistanı sunmaya ne kadar yatırım yaptığını göstermektedir. Clinc ile İşbank, Maxi’yi 7,5 milyondan fazla kişiye lanç etti, Türkçe olarak. Lansmandan bu yana, İşbank 5,5 milyondan fazla kullanıcı tarafından geniş bir kabul gördü, kullanıcı başına ortalama 9,8 etkileşim gerçekleşti. Son aylarda, Türkiye’deki COVID-19 vakalarının artmasıyla, İşbank Maxi’yi COVID-19 ile ilgili sorulara cevap verecek şekilde hızla eğitti. Mart 2020’den bu yana, Maxi 1,2 milyondan fazla müşteri sorusuna cevap verdi, bu da kullanımın %62’den fazla artması anlamına geliyor.
Kadınlar AI hakkında daha fazla bilgi öğrenmek istiyorsa ancak erkeklerin hakim olduğu bir alanda olduğu için tereddüt ediyorsa ne önerirsiniz?
Öncelikle, AI’nin erkeklerin hakim olduğu bir alan olduğuna inanmıyorum. AI’de gerçekten iyi performans gösteren birçok kadın öncü vardır ve etkili bir şekilde çalışıyorlar. AI ile sosyal politika, insanların günlük yaşamlarında büyük bir etkiye sahip olabilecek benzersiz bir alandır. Burada gerçekten çeşitli görüşlere ihtiyaç duyuyoruz, özellikle AI’de ırk ve cinsiyet önyargısı ile ilgili birçok konuşma var. AI geliştiricileri topluluğunun toplum ve politika üzerinde orantısız bir etkiye sahip olmaya devam edeceğini düşünüyorum.
AI alanına katılmak isteyen kadınlara, özellikle AI’nin günlük yaşamlarında büyük bir etkiye sahip olabileceği düşünüldüğünde, bunu gerçekten öneriyorum. AI, son yıllarda çok fazla büyüme ve inovasyona sahne oldu ve gerçekten de bu alanda bulunmak heyecan verici.
Clinc hakkında paylaşmak istediğiniz başka bir şey var mı?
Clinc şu anda büyük adımlar atıyor. Kişisel olarak, Clinc’in yeni CTO’su olarak görevi devraldım ve geliştiriciler ve veri bilimcileri ile birlikte teknolojinin erişimini genişletmek için nasıl çalışabileceğimize odaklanıyorum. Geleceğe baktığımda, AI güçlendirilmiş uygulamaların talebinin, yıllarca veri bilimi deneyimi ve makine öğrenimi arka planı olmayan insanlara da ulaşabileceği yönde değişeceğini görüyorum. Örneğin, grafik tasarım diplomasına sahip olmanıza gerek yok, ancak Photoshop’u kullanabilirsiniz. AI de bu yönde ilerliyor, yani AI veya makine öğrenimi eğitimi olmayan geliştiriciler de sonuçlar elde edebilecek ve yüksek kaliteli uygulamalar üretebilecekler. Genel olarak, son kullanıcıya değil, aynı zamanda çözümümüze ilgi gösteren geliştiricilere, hangi seviyede olurlarsa olsunlar, bağlı olduğumuzu vurgulamak istiyoruz.
Harika bir röportaj için teşekkür ederim, ilerlemenizi takip etmeyi dört gözle bekliyorum. Daha fazla bilgi öğrenmek isteyenler Clinc ziyaret edebilir.












