Röportajlar
James Kaplan, MeetKai Metaverse’in CEO & Kurucu Ortağı – Röportaj Serisi

James Kaplan, Los Angeles, California’da bulunan ve şu anda AI konuşma yarışını hiç görülmemiş özelliklerle liderlik eden bir Yapay Zeka, Sanal Gerçeklik ve Konuşma Arama şirketi olan MeetKai‘in CEO & Kurucu Ortağı’dır. MeetKai’nin teknolojisini, iOS, Google Play ve AppGallery aracılığıyla küresel olarak dağıtmaktadır.
6 yaşındayken AI için bir tutkunuz vardı, bu teknolojiyle ilk olarak nasıl tanıştınız?
AI ile tanışmam video oyunlarından geldi. İlk olarak Oregon Trail oyunundaki AI’nin nasıl çalıştığını anlamaya çalıştım – çok zeki değildi, ama yine de bir AI formuydu. Oradan MMORPG’lere geçtim. Çevrimiçi oyunlar oynamayı gerçekten seviyordum, ama öğeleri toplamak için uğraşmaktan hoşlanmıyordum. Bu nedenle, botlar yazmaya başladım.
İlk AI uygulamaları nelerdi?
MMO’lar için botlar yazmak, geliştirdiğim belirli bir AI formunun ilk denemesiydi. Başlangıçta botlarım oldukça basitti ve makrolardan daha fazla yapay zeka değil. Ancak bot algılama birçok oyunda iyileştikçe, botların bir oyuncuya benzemesi gerekti. Botlar yazmayı her zaman sevdım – okula giderken bir Taylor Swift yarışmasını kazanmak için bir bot yazdım (ve gerçekten konser verdi!). Ayrıca, ilk Pokémon Go botunu yazdım ve ilgimi kaybettikten sonra birçok kişinin banlanmasına neden oldum.
2018’de mevcut AI ses asistanlarıyla ilgili hayal kırıklığına uğradıktan sonra MeetKai’yi başlattınız. Çoğu AI asistanı neden faltaşı gibi bir deneyim sunar?
Sorunun özü, çoğu AI asistanının dış API’lere çok fazla bağımlı olmasıdır. Bunları kontrol etseler bile, örneğin Alexa için e-ticaret araması, aynı sorunlardan mustarip olurlar. Basitçe söyleyeyim, bir ses asistanının zeki olmasını bekleyebilirsiniz, ama tüm yaptığı konuşmayı metne dönüştürmek ve bu metni bir metin tabanlı arama motoruna koymaktır? MeetKai’yi, bir ses asistanının oluşturduğu tüm uçtan uca işleme pipelineını kontrol ederek, bir “atlayış” AI asistanı sağlayarak başlattık. Daha karmaşık sorgular ve konuşmalar için bir konuşma arama motoru geliştirdik. Diğer asistanlar, bu sınırlayıcı faktörlerin üzerine çoklu dönüş konuşma desteği oluşturamadıkları için faltaşı gibi deneyimler sunuyorlar. Hedefimize ulaşmaya çalışıyoruz, ancak teknolojisini mevcut oyuncuların aynı sayıda alanını karşılayacak şekilde ölçeklendirme aşamasının çok erken bir aşamasındayız.
Devrim niteliğinde bir ses asistanı deneyimi oluştururken, doğal dil anlama ve doğal dil işleme konusunda hangi zorluklar vardır?
İleri nesil NLU’nun birincil zorluğu, niyetler ve varlıkların ötesine geçmektir. Çoğu NLU, dil anlama için çok geleneksel bir yaklaşıma sahiptir. Her girdi ifadesi bir niyete sınıflandırılır ve sonra tokenler, bir dizi etiketleme modeli kullanılarak varlıklar olarak etiketlenir. Bu standart yaklaşımın düzinelerce sorunu olduğunu söyleyebilirim. Ancak en kritik olanlar:
- Baglamdan bağımsız bir niyet sınıflandırması, çoklu dönüş konuşmaları işleyemez. Çoğu yaklaşım, yalnızca transkribe edilen ham metne bakar. Bağlamla ilgilenmez – kullanıcı kim, neyi sevdiğiyle ilgilenmez, sadece son olarak ne hakkında sorduyla ilgilenir. Bu, kullanıcı “kozmo” gibi kısa bir şey söylediğinde özellikle önemlidir. Örneğin, birisinin “kozmo” demesi, içki veya dergi anlamına gelebilir ve kişiden kişiye büyük ölçüde farklılık gösterir.
- Varlık tanıma modelleri, kategorik olmayan değerler için kötü bir iş çıkarır. Büyük dil modelleri, verisetinde olmayan yeni varlıklara yeterli hızda uyum sağlayamaz. AI, daha derin bir bağlamı dikkate alarak varlıkları tanımak için çok daha sofistike bir yol geliştirmelidir. Örneğin, bir kullanıcının konumu, bir restoran adı mı yoksa başka bir şey mi olduğuna büyük ölçüde etki etmelidir.
- Varlık ilişkileri iyi dikkate alınmaz. En sevdiğim örnek, çoğu arama motorunun negasyon konusunda nasıl başarısız olduğuna dair. Diğer ses asistanlarında “romans içermeyen bir film” aramayı deneyin ve ne demek istediğimi anlayacaksınız.
Şu anda çoğu ses asistanı sesi metne çevirir ve bir Google araması yapar. MeetKai AI nasıl farklı çalışır?
MeetKai ve Google arasındaki birincil fark, aramada web sayfaları yerine öğeleri kendileri için aramak için çok daha zengin bir dil anlama modeli kullanmamızdır. “Tom Cruise’un aksiyon içermeyen filmleri” gibi bir şey aradığınızda, Google bu tokenlerin sayfada görünmesini arar (Tom Cruise, filmler, aksiyon). MeetKai’de, Tom Cruise’un bir aktör, filmlerin aranan medya sınıfı ve aksiyonun istenmeyen tür olduğu doğru şekilde anlarız. Bununla birlikte, çok daha akıllı aramalar yapabiliriz.
MeetKai yakın zamanda ilk yaşam tarzı VR dünyasını başlattı: MeetKai Metaverse. Bu uygulamayı tartışabilir misiniz?
Metaverse alanında faaliyet gösteren çoğu şirket, kişi-kişi etkileşimi üzerinde çalışıyor. Bunun ötesinde, içerik genellikle ya çizgi film gibi ya da 360° video. MeetKai Metaverse ile bizim hedefimiz, tamamen farklı bir açıya odaklanmak – kişi-AI. AI güçlendirilmiş karakterlerle etkileşime girebileceğiniz bir metaverse geliştiriyoruz. Ayrıca, daha gerçekçi ve etkileyici bir görünüm sağlamak için ortamın prosedürel olarak oluşturulmasına yönelik çalışıyoruz. Metaverse’mizde keşfedilebilecek ilk iki dünya, iki ilk kullanım durumu için tasarlandı: meditasyon ve müzeler. İlkinde, bir Wing Chun uzmanını dijitalleştirdik ve ilk kez, devrim niteliğinde meditasyon teknikleriyle rahatlama durumuna girmeyi öğreten bir AI karakteri yarattık. İkincisinde, sürekli büyüyen bir sanat müzesi oluşturduk ve sanatı hakkında soru sorabilen ve tur sağlayabilen bir AI güçlendirilmiş küratör sağladık.
MeetKai Metaverse’de AI nasıl kullanılır?
AI’ı üç yerde kullanıyoruz:
- Metaverse’mizdeki her karakterin konuşma yeteneklerini güçlendirmek için.
- Kullanıcıya sesli rehberlik yoluyla kullanılabilir hale getirilen içeriği dinamik olarak oluşturmak için. İlk iki deneyimimizdeki meditasyon seansları ve sanat galerisi turları buna örnek verilebilir.
- 3D uzayı prosedürel olarak oluşturmak için, elle düzenleme gerektirmeksizin.
Ses asistanlarının geleceği için ne gibi bir vizyonunuz var?
Ses asistanlarının bir geleceği olabilmesi için, komut tabanlı bir sistemden çok daha fazlasına dönüşmeleri gerekir. Bu, birçok özel alanda derin uzmanlık ve yeteneklere sahip olmak anlamına gelir. Farklı alanlara özgü ses asistanlarını bir araya getirmenin, bir tümleşik zeki meta asistan oluşturmanın anahtarı olacağını düşünüyorum. Bu, ses asistanlarının bu alana girdiğinden beri gördüğümüz “her şeyi bir seferde yapmak” girişimlerinin aksine.
MeetKai veya MeetKai Metaverse hakkında paylaşmak istediğiniz başka bir şey var mı?
Metaverse yol haritamızın çok başında olduğumuz için hala çok şey var. Sonraki hedefimiz, gerçek dünyadaki herhangi bir deneyimi metaverse’de çoğaltabilmek ve ardından onu aşmak. Bu, aynı deneyimleri gerçek dünyada yaşamayı sınırlayan maliyet ve zaman faktörlerini ortadan kaldırmak anlamına gelir. Metaverse, yaşamlarımızı daha zengin bir şekilde yaşamamızı sağlayabilir, onları değiştirebilir. Henüz çözülmesi gereken beberapa teknik zorlukumuz var, ancak ulaşılabilir olan bir dizi kilometre taşığımız var. Donanım ortaklarımızla birlikte VR alanının hızlı bir şekilde ilerlemesini sağlamak için çalışıyoruz. Sadece VR’nin ötesinde, metaverse deneyimlerimizi VR dışında mümkün hale getirmek istiyoruz. Yakın aylarda daha fazla bilgi duyuracağız.
Harika bir röportaj için teşekkür ederim, ilerlemenizi takip ediyorum. Daha fazla bilgi edinmek isteyen okuyucular MeetKai ziyaret edebilir.












