Connect with us

Wawancara

Mohammad Abu Sheikh, Pendiri & CEO CNTXT AI – Seri Wawancara

mm

Mohammad Abu Sheikh sedang mengubah lanskap AI di wilayah MENA, mengarahkan perubahan dari konsumsi pasif ke inovasi berdaulat. Sebagai CEO CNTXT AI dan pendiri dana AI sebesar $10 juta, ia telah memimpin tiga keluaran sukses dan mengamankan lebih dari satu miliar dolar dalam pendanaan. Pekerjaannya meletakkan dasar untuk ekosistem AI yang berakar pada bahasa, budaya, dan kedaulatan data.

CNTXT AI adalah perusahaan transformasi digital yang menyediakan infrastruktur cloud, perangkat lunak industri, dan solusi robotik untuk membantu organisasi memodernisasi operasi dan membuka wawasan data yang didorong di Timur Tengah dan Afrika Utara.

Apa yang menginspirasi Anda untuk memulai CNTXT AI, dan bagaimana visi Anda untuk AI berdaulat di dunia berbahasa Arab dimulai?

Kami melihat kelimpahan data yang tidak termanfaatkan di bagian dunia ini. Banyak masalah dalam penskalaan AI berasal dari kurangnya kesiapan data — yang pada akhirnya berarti kurangnya kesiapan AI. Itulah mengapa kami memulai CNTXT AI.

Awalnya, kami menyelesaikan masalah yang sama yang kami hadapi saat membangun LocAI… Kami melihat tantangan ini secara langsung bekerja dengan AI71, TII dan G42 (IIAI). Ketika kami membantu entitas-entitas ini menyelesaikan masalah tersebut, visi menjadi lebih jelas dan bisnis itu terus tumbuh.

Anda telah memainkan peran kunci dalam membangun perpustakaan digital Arab terbesar untuk pelatihan AI. Apa saja tantangan terbesar dalam melakukan hal ini, dan bagaimana Anda mengatasi mereka?

Kualitas adalah salah satu tantangan terbesar. Yang lain adalah ketersediaan terbatas data Arab berkualitas tinggi online: Arab sangat kurang diwakili. Hanya sebagian kecil konten bahasa Arab yang telah didigitalkan, dan hanya 3–5% dari semua konten online berada dalam bahasa Arab. Itu hampir tidak ada. Kami mengatasi masalah ini dengan menerjunkan labeler data, annotator, dan ilmuwan data untuk mendigitalkan, membuat, dan mengkurasi data kami sendiri.

CNTXT AI beroperasi di persimpangan budaya dan komputasi. Bagaimana Anda menjaga inovasi AI terdepan dengan tujuan membangun solusi yang relevan dengan budaya untuk wilayah MENA?

Kami membangun model yang berakar pada budaya dari awal. Dari infrastruktur hingga produk akhir, budaya tertanam dari awal — itu bukan sesuatu yang kami tambahkan kemudian. Kami merancang, berinovasi, dan membangun dengan mempertimbangkan budaya, dialek, dan kebutuhan spesifik dari awal. Arab adalah satu bahasa, tetapi membawa banyak dialek dan konteks budaya di seluruh wilayah, jadi kami membangun produk lokal untuk negara-negara lokal. Dan kami melakukannya dengan bekerja sama dengan annotator lokal, orang-orang di lapangan, di negara mereka sendiri.

Anda juga telah mendirikan LocAI dan memimpin Dana AI SMPL. Bagaimana ventura-ventura ini melengkapi misi CNTXT AI?

LocAI adalah lapisan aplikasi — bagian yang benar-benar diinteraksikan oleh orang. Ini duduk tepat di atas data dan infrastruktur yang dibangun oleh CNTXT AI. Itulah yang membuatnya sukses: itu mengubah fondasi AI yang disediakan oleh CNTXT AI menjadi solusi dunia nyata yang dapat digunakan orang.

SMPL AI, di sisi lain, adalah tentang memberi kembali kepada komunitas. Ini fokus pada investasi di awal tahap startup dan membantu membangun ekosistem AI regional. Kami berbagi alat dan pelajaran yang telah kami pelajari dari membangun AI kami sendiri, sehingga pendiri dapat tumbuh lebih cepat dan menghindari jebakan umum.

Munsit telah disebut sebagai model pengenalan ucapan Arab paling akurat di dunia. Apa yang mendorong pengembangan model ini, dan mengapa sekarang?

Apa yang mendorong pengembangan model ini adalah kebutuhan.

Kami selalu membangun dari kebutuhan. Kami melihat ke pasar dan melihat lanskap yang matang — lembaga pemerintah dan klien swasta semua meminta solusi seperti ini.

Model yang ada tidak cukup untuk tugas ini. Sebagian besar dibangun dengan teknologi Inggris dan kemudian disesuaikan. Mereka tidak dirancang untuk Arab dari awal, dan pasti tidak untuk masalah yang kami selesaikan.

Jadi kami memutuskan untuk membangun sendiri. Ini adalah Arab pertama — oleh desain.

Penelitian di balik Munsit memperkenalkan pendekatan pembelajaran yang lemah. Apa yang dimaksud dengan ini dan mengapa itu penting untuk melatih ASR Arab dalam skala besar?

Annotasi mahal. Jadi kami harus melampaui metode tradisional yang bergantung pada sejumlah besar transkripsi manual. Pembelajaran yang lemah membantu kami menskala tanpa harus melabeli setiap file audio dengan tangan — yang sangat penting untuk Arab, bahasa dengan data terbatas dan banyak dialek.

Bukannya menggunakan audio yang ditranskripsi secara profesional, kami memulai dengan 30.000 jam ucapan Arab yang tidak dilabeli. Kami membangun pipa annotasi yang menghasilkan, menyaring dan membersihkan yang terbaik menggunakan pemeriksaan otomatis. Ini memberi kami dataset berkualitas tinggi sebesar 15.000 jam — semua tanpa transkripsi manusia.

Pendekatan ini membuat kami dapat melatih model kami dari awal, menangkap kekayaan ucapan Arab di seluruh situasi nyata, dengan cepat dan efektif biaya. Tanpa metode ini, membangun sistem ASR Arab dalam skala ini akan memakan waktu bertahun-tahun dan jutaan dalam upaya manual.

Munsit mengungguli model dari OpenAI, Microsoft, dan Meta di berbagai benchmark. Apa yang dicapai ini katakan tentang masa depan inovasi AI Arab?

Masa depan AI Arab ada di tangan kita; dan itulah yang dicapai ini buktikan. Kami tidak lagi bisa mengandalkan teknologi yang tidak kami miliki atau bergantung pada pihak ketiga yang tidak memprioritaskan wilayah kami.

Munsit menunjukkan bahwa kami dapat membangun AI kelas dunia, dari wilayah, untuk wilayah — menggunakan bakat lokal untuk menyelesaikan masalah lokal. Ini adalah sinyal yang jelas bahwa gelombang inovasi AI Arab berikutnya akan datang dari dalam.

Bagaimana Anda melihat Munsit berkembang dalam versi masa depan, dan apa yang menjadi frontir berikutnya untuk AI suara Arab di CNTXT?

Anda hanya perlu menunggu dan melihat. Apa yang bisa saya katakan adalah bahwa kami memiliki suite baru solusi AI Arab-pertama yang siap diluncurkan — semua didukung oleh Munsit dan model lain yang saat ini kami bangun di CNTXT AI. Ini hanya awal.

Anda sering berbicara tentang pentingnya “AI berdaulat.” Apa yang dimaksud dengan istilah ini bagi Anda, dan mengapa itu penting untuk Teluk dan wilayah MENA yang lebih luas?

Bagi saya, AI berdaulat berarti memiliki kepemilikan dan kontrol penuh atas data, infrastruktur, dan model yang membentuk masa depan kita. Ini penting karena kita perlu memiliki nasib kita sendiri, dan itu dimulai dengan data.

Kedaulatan data adalah segalanya. Data adalah hal yang berharga, dan kita perlu memastikan bahwa itu tetap berada di tangan kita.

Kita tidak bisa mengandalkan teknologi yang dibangun untuk kita dan duduk diam sementara orang lain membangun teknologi untuk kita. Masa depan AI di wilayah ini akan datang dari wilayah ini. Itulah yang kami kerjakan.

Bagaimana Anda melihat CNTXT AI membentuk ekosistem AI di Timur Tengah dalam lima tahun ke depan?

Dengan memungkinkan kesiapan AI yang sebenarnya. Kami masuk, memahami apa yang dibutuhkan perusahaan dan pemerintah, membangun strategi data dan AI, dan kemudian membantu mereka membangun, menguji, mengirim, dan menskala.

Jika data adalah minyak baru, maka data tak terstruktur adalah minyak yang tidak dimurnikan — penuh potensi tetapi tidak berguna sampai diproses. Itulah mengapa kami membangun CNTXT AI untuk membantu organisasi membersihkan, mengatur, dan mengaktifkan data mereka. Karena itulah transformasi AI yang sebenarnya dimulai.

Dari sudut pandang Anda sebagai wirausaha dan investor, apa saran yang akan Anda berikan kepada pendiri lain yang membangun startup AI di pasar yang baru muncul?

Mulailah sekarang. Bergeraklah dengan cepat. Gagal dengan cepat, belajar lebih cepat, dan terus mengulangi.

Yang paling penting, bangun untuk masalah nyata. Tetap dekat dengan tanah — dengarkan pengguna, bukan hanya hype. Di pasar yang baru muncul, relevansi dan kemampuan beradaptasi adalah kunci.

Terima kasih atas wawancara yang baik, pembaca yang ingin mempelajari lebih lanjut dapat mengunjungi CNTXT AI.

Antoine adalah seorang pemimpin visioner dan mitra pendiri Unite.AI, didorong oleh semangat yang tak tergoyahkan untuk membentuk dan mempromosikan masa depan AI dan robotika. Seorang wirausaha serial, ia percaya bahwa AI akan sama-sama mengganggu masyarakat seperti listrik, dan sering tertangkap berbicara tentang potensi teknologi mengganggu dan AGI.

As a futurist, ia berdedikasi untuk mengeksplorasi bagaimana inovasi ini akan membentuk dunia kita. Selain itu, ia adalah pendiri Securities.io, sebuah platform yang fokus pada investasi di teknologi-teknologi canggih yang mendefinisikan kembali masa depan dan membentuk kembali seluruh sektor.