Röportajlar
Mohammad Abu Sheikh, CNTXT AI’nin Kurucusu ve CEO’su – Röportaj Serisi

Mohammad Abu Sheikh MENA bölgesindeki AI peyzajını dönüştürüyor, pasif tüketimden egemen inovasyona doğru bir değişimi teşvik ediyor. CNTXT AI’nin CEO’su ve 10 milyon dolarlık AI fonunun kurucusu olarak, üç başarılı çıkış gerçekleştirdi ve bir milyardan fazla dolarlık finansman sağladı. Çalışmaları, dil, kültür ve veri egemenliğine dayalı bir AI ekosisteminin temelini oluşturuyor.
CNTXT AI bir dijital dönüşüm şirketidir ve bulut altyapısı, endüstriyel yazılım ve robotik çözümler sağlar. Bu çözümler, Orta Doğu ve Kuzey Afrika’daki organizasyonların operasyonlarını modernleştirmelerine ve veri odaklı içgörüler elde etmelerine yardımcı olur.
Sizi CNTXT AI’yi başlatmaya ne teşvik etti ve Arapça konuşulan dünyada egemen AI vizyonunuz nasıl başladı?
Bu bölgede kullanılmayan verilerin bolluğunu gördük. AI’yi ölçeklendirme sorunlarının çoğu, veri hazırlığının eksikliğinden kaynaklanıyordu – bu da sonunda AI hazırlığının eksikliği anlamına geliyordu. Bu nedenle CNTXT AI’yi başlattık.
İlk olarak, LocAI’yi inşa ederken karşılaştığımız aynı sorunları çözüyorduk… AI71, TII ve G42 (IIAI) ile çalışırken bu zorlukları ilk elden gördük. Bu varlıkların sorunlarını çözmelerine yardımcı olarak, vizyon daha net hale geldi ve iş büyümeye devam etti.
Arapça AI eğitimi için en büyük Arapça dijital kütüphanesini oluşturmakta önemli bir rol oynadınız. Bunu yaparken karşılaştığınız en büyük zorluklar nelerdi ve bunları nasıl aştınız?
Kalite, en büyük zorluklardan biriydi. Bir diğeri, yüksek kaliteli Arapça verilerin internet上的 sınırlı erişilebilirliğiydi: Arapça, ciddiye alınmıyor. Tüm çevrimiçi içeriğin yalnızca küçük bir kısmı Arapçadır ve yalnızca %3-5’i Arapça’dır. Bu, neredeyse hiç değil. Bu sorunu, verileri kendimiz dijitalleştirmek, oluşturmak ve düzenlemek için veri etiketleyicileri, annotatörleri ve veri bilimcilerini görevlendirerek çözdük.
CNTXT AI, kültür ve hesaplamanın kesişme noktasında faaliyet gösteriyor. MENA bölgesine kültürel olarak ilgili çözümler oluşturma hedefiyle AI’deki son inovasyonları nasıl dengeliyorsunuz?
Kültürel olarak temellenmiş modelleri sıfırdan inşa ediyoruz. Altyapadan son ürüne kadar, kültür başlangıçtan itibaren gömülüdür – sonradan eklenmez. Belirli kültürler, lehçeler ve ihtiyaçlar düşünülerek tasarlıyor, inovasyon yapıyor ve inşa ediyoruz. Arapça bir dildir, ancak bölgede birçok lehçe ve kültürel bağlam taşır, bu nedenle yerel ülkeler için yerel ürünleri inşa ediyoruz. Ve bunu, kendi ülkelerinde, yerel annotatörlerle, insanlarla çalışarak yapıyoruz.
Ayrıca LocAI’yi kurucu ortağı ve SMPL AI Fonu’nun liderisiniz. Bu girişimler, CNTXT AI’nin misyonunu nasıl tamamlıyor?
LocAI, uygulama katmanıdır – insanların gerçekten etkileşimde olduğu kısım. CNTXT AI tarafından oluşturulan veri ve altyapının doğrudan üzerinde oturur. Bu, başarılı olmasının nedeni budur: CNTXT AI tarafından sağlanan AI temellerini gerçek dünya çözümlerine dönüştürür.
SMPL AI’nin diğer方面i ise topluluğa geri vermeye odaklanıyor. Erken aşamadaki startups’a yatırım yapmak ve bölgesel AI ekosistemini inşa etmeye yardımcı olmakla ilgili. AI’yi kendimiz inşa ederken öğrendiğimiz araçları ve dersleri paylaşıyoruz, böylece kurucular daha hızlı büyüyebilir ve ortak tuzaklardan kaçınabilir.
Munsit, dünyanın en doğru Arapça konuşma tanıma modeli olarak adlandırıldı. Bu modelin geliştirilmesini ne teşvik etti ve neden şimdi?
Bu modelin geliştirilmesini teşvik eden şey basitçe ihtiyaç idi.
Her zaman gereksinimden inşa ediyoruz. Pazarda bakıyoruz ve manzaranın olgun olduğunu görüyoruz – hükümet kurumları ve özel müşteriler hepsi böyle bir çözüm istiyordu.
Mevcut modeller görevi yerine getirebilecek durumda değildi. Çoğu İngilizce teknoloji üzerine inşa edilmiş ve sonra uyarlanmıştır. Arapça için sıfırdan tasarlanmamışlar ve kesinlikle bizim çözmeye çalıştığımız özel sorunlar için değil.
Bu nedenle kendimize ait olanı inşa etmeye karar verdik. Bu, Arapça önceliklidir – tasarımı itibariyle.
Munsit’in arkasındaki araştırma, zayıf bir şekilde denetlenen öğrenme yaklaşımını tanıtüyor. Bu nedir ve Arapça ASR’yi ölçeklenebilir şekilde eğitmek için neden bu kadar önemliydi?
Etiketleme pahalıdır. Bu nedenle, her ses dosyasını elle etiketlemek zorunda kalmadan geleneksel yöntemlerin ötesine geçmek zorunda kaldık. Zayıf bir şekilde denetlenen öğrenme, bizim için elle transkript olmadan yüksek kaliteli bir veri seti oluşturmayı mümkün kıldı – özellikle Arapça gibi sınırlı veri ve birçok farklı lehçesi olan bir dil için çok önemli.
Profesyonel olarak transkript edilmiş ses yerine, 30.000 saatlik etiketsiz Arapça konuşması ile başladık. Otomatik kontroller kullanarak en iyilerini oluşturan, filtreleyen ve temizleyen bir etiketleme işlem hattı oluşturduk. Bu, elle transkript olmadan yüksek kaliteli 15.000 saatlik bir veri seti verdi.
Bu yaklaşım, gerçek yaşam durumlarındaki konuşulan Arapça’nın zenginliğini hızlı ve maliyet etkin bir şekilde yakalayarak modelimizi sıfırdan eğitmeyi mümkün kıldı. Bu yöntemden olmadan, bu ölçekte bir Arapça ASR sistemi inşa etmek yıllar ve elle yapılan çabanın milyonlarca dolarlık maliyeti gerektirecekti.
Munsit, OpenAI, Microsoft ve Meta’dan modelleri birden fazla benchmark’te geride bıraktı. Bu başarı, Arapça AI inovasyonunun geleceği hakkında ne diyor?
Arapça AI’nin geleceği bizim ellerimizde; ve bu başarı tam olarak bunu kanıtlıyor. Artık teknolojilere sahip olmadığımız veya bölgemizi önceliklendirmeyen üçüncü taraflara güvenemeyiz.
Munsit, bölgemiz için, bölgemizden, yerel yeteneklerle yerel sorunları çözebileceğimizi gösteriyor. Bu, Arapça AI’nin bir sonraki dalgasının içten geleceğinin açık bir işareti.
Munsit’in gelecekteki sürümlerinde nasıl gelişmesini öngörüyorsunuz ve CNTXT’de Arapça sesli AI’nin bir sonraki sınırları neler?
Beklemekten başka çaremiz yok. Şunu söyleyebilirim ki, Munsit ve CNTXT AI’de şu anda inşa ettiğimiz diğer modeller tarafından güçlendirilen, yeni bir Arapça AI çözümleri seti geliyor. Bu sadece başlangıç.
Sık sık “egemen AI”nin öneminden bahsediyorsunuz. Bu terim size ne anlama geliyor ve neden Körfez ve daha geniş MENA bölgesi için kritik?
Bana göre egemen AI, geleceğimizi şekillendiren veriler, altyapı ve modeller üzerinde tam mülkiyet ve kontrol anlamına geliyor. Bu, kendi kaderimize sahip olmamız gerektiği için kritik.
Veri egemenliği her şey. Veri kıymetli ve elimizde kalmasını sağlamak zorundayız.
Geleceğimizi inşa etmek için başkalarına güvenemeyiz ve teknolojiyi bizim için inşa etsinler diye bekleyemeyiz. Bu bölgedeki AI’nin geleceği, bu bölgeden gelecektir. Tam da bunu hedefliyoruz.
CNTXT AI’nin önümüzdeki beş yıl içinde Orta Doğu’daki AI ekosistemini nasıl şekillendireceğini öngörüyorsunuz?
Gerçek AI hazırlığını sağlayarak. Gidip şirketlerin ve hükümetlerin neye ihtiyacı olduğunu anlıyoruz, veri ve AI stratejilerini inşa ediyor ve sonra onları inşa etmeye, test etmeye, dağıtmaya ve ölçeklemeye yardımcı oluyoruz.
Veri yeni petrolse, yapılandırılmamış veri de rafine edilmemiş petrol gibi – potansiyeli dolu, ancak işlenene kadar işe yaramaz. Bu nedenle CNTXT AI’yi, organizasyonların verilerini temizlemelerine, yapılandırmalarına ve etkinleştirmelerine yardımcı olmak için inşa ettik. Çünkü gerçek AI dönüşümü orada başlıyor.
Hem girişimci hem de yatırımcı olarak, ortaya çıkan pazarlardaki AI startups’ı inşa eden diğer kuruculara ne gibi tavsiyelerde bulunurdunuz?
Şimdi başlayın. Hızlı hareket edin. Hızlı başarısız olun, daha hızlı öğrenin ve devam edin.
En önemlisi, gerçek sorunlar için inşa edin. Yerden uzaklaşmayın – kullanıcıları dinleyin, sadece hype’ı değil. Yeni ortaya çıkan pazarlarda, alaka ve uyum kritik öneme sahiptir.
Harika röportaj için teşekkür ederiz, daha fazla bilgi edinmek isteyen okuyucular CNTXT AI ziyaret edebilir.












