Connect with us

محمد أبو شيخ، المؤسس والرئيس التنفيذي لشركة CNTXT AI – سلسلة المقابلات

مقابلات

محمد أبو شيخ، المؤسس والرئيس التنفيذي لشركة CNTXT AI – سلسلة المقابلات

mm

محمد أبو شيخ يقوم بتحويل مشهد الذكاء الاصطناعي في منطقة الشرق الأوسط وشمال أفريقيا، مما يدفع التحول من الاستهلاك السلبي إلى الابتكار السيادي. كما أنه الرئيس التنفيذي لشركة CNTXT AI ومؤسس صندوق الذكاء الاصطناعي البالغ قيمته 10 ملايين دولار، فقد قاد ثلاثة خروجات ناجحة وضمن أكثر من مليار دولار في التمويل. يعمل على وضع الأسس لبيئة الذكاء الاصطناعي التي ترتكز على اللغة والثقافة وسيادة البيانات.

CNTXT AI هي شركة تحويل رقمي توفر بنية تحتية سحابية وبرمجيات صناعية وحلول روبوتية للمساعدة في تحديث العمليات وفك شفرة المعلومات المبنية على البيانات عبر الشرق الأوسط وشمال أفريقيا.

ما الذي ألهمك لبدء CNTXT AI، وكيف بدأ رؤيتك للذكاء الاصطناعي السيادي في العالم الناطق بالعربية؟

لقد رأينا وفرة من البيانات غير المستغلة في هذه المنطقة من العالم. كان هناك الكثير من المشاكل في توسيع نطاق الذكاء الاصطناعي ناتجة عن نقص في جاهزية البيانات — مما يعني في النهاية نقصًا في جاهزية الذكاء الاصطناعي. لذلك بدأنا CNTXT AI.

في البداية، كنا نحل نفس المشاكل التي واجهناها أثناء بناء LocAI… رأينا هذه التحديات بشكل مباشر أثناء العمل مع AI71 وTII وG42 (IIAI). عندما ساعدنا هذه الكيانات على حل هذه المشاكل، أصبحت الرؤية أوضح وأكثر وضوحًا، والعمل استمر في النمو.

لقد لعبت دورًا رئيسيًا في بناء أكبر مكتبة رقمية عربية لتدريب الذكاء الاصطناعي. ما كانت بعض أكبر التحديات في القيام بذلك، وكيف تم التغلب عليها؟

الجودة كانت واحدة من أكبر التحديات. وكان آخرها محدودية توافر البيانات العربية عالية الجودة على الإنترنت: العربية ممثلة بجدية. تم تحويل جزء صغير فقط من المحتوى العربي إلى صيغة رقمية، وتمثل نسبة المحتوى العربي على الإنترنت أقل من 3-5٪ من إجمالي المحتوى على الإنترنت. هذا شيء قليل جدًا. التغلب على هذه المشكلة كان من خلال نشر ملصقين للبيانات ومراقبين و科学يين لتحويل البيانات وإنشائها وتحسينها بأنفسنا.

تعمل CNTXT AI على تقاطع الثقافة والحوسبة. كيف تتوازن بين الابتكار في الذكاء الاصطناعي المتقدم وهدف بناء حلول ذكية ثقافيًا للشرق الأوسط وشمال أفريقيا؟

نحن نبني نماذج متجذرة ثقافيًا من البداية. من البنية التحتية إلى المنتج النهائي، الثقافة متأصلة من البداية — ليست شيئًا نضيفه في وقت لاحق. نحن نصمم ونهتم ونبني بالاعتماد على ثقافات ولهجات واحتياجات محددة منذ اليوم الأول. العربية هي لغة واحدة، ولكنها تحمل العديد من اللهجات والسياقات الثقافية عبر المنطقة، لذلك نبني منتجات محلية لبلدان محلية. ونفعل ذلك بالتعاون مع المراقبين المحليين، الناس على الأرض، في بلدانهم.

لقد شاركت أيضًا في تأسيس LocAI وتقود صندوق SMPL AI. كيف تتماشى هذه المشاريع مع مهمة CNTXT AI؟

LocAI هو طبقة التطبيق — الجزء الذي يتفاعل معه الناس فعليًا. يقع مباشرة فوق البيانات والبنية التحتية التي بناها CNTXT AI. هذا ما جعله ناجحًا: يتحول الأسس الذكية التي توفرها CNTXT AI إلى حلول حقيقية يمكن الناس استخدامها.

من ناحية أخرى، يركز SMPL AI على العودة للمجتمع. يركز على الاستثمار في الشركات الناشئة في مرحلة مبكرة ومساعدة بناء النظام البيئي الإقليمي للذكاء الاصطناعي. نحن نشارك الأدوات والدروس التي تعلمناها من بناء الذكاء الاصطناعي بأنفسنا، بحيث يمكن للمؤسسين النمو بشكل أسرع وتجنب الفخاخ الشائعة.

تم وصف Munsit بأنه أكثر نموذج دقيق لتعرف الكلام العربي في العالم. ما الذي دفع تطوير هذا النموذج، ولماذا الآن؟

ما دفع تطوير هذا النموذج كان بسيطًا: الحاجة.

نحن نبنى دائمًا من الضرورة. لقد نظرنا إلى السوق ورأينا أن المنظر كان ناضجًا — كانت الوكالات الحكومية والعملاء الخاصون يطلبون جميعًا حلًا مثل هذا.

النماذج الحالية لم تكن قادرة على المهمة. معظمها مبني على التكنولوجيا الإنجليزية ومن ثم تم تعديله. لم يتم تصميمها للعربية من البداية، وأيضًا ليس لمشاكل محددة نحن نحلها.

لذلك قررنا بناء نموذجنا الخاص. إنه عربي من البداية — من حيث التصميم.

يمكن أن يشرح ما يعني النهج التعليمي الضعيف في بحث Munsit، ولماذا كان هذا ضروريًا لتدريب Arabic ASR على نطاق واسع؟

التعليق مكلف. لذلك كان علينا أن نتجاوز الأساليب التقليدية التي تعتمد على كميات كبيرة من النصوص المنسوخة يدويا. ساعدنا التعلم الضعيف على النمو دون الحاجة إلى وضع علامات على كل ملف صوتي يدويا — وهو أمر مهم بشكل خاص للعربية، لغة محدودة ومتعددة اللهجات.

بدلاً من استخدام الصوت المنسوخ احترافياً، بدأنا بـ 30,000 ساعة من الكلام العربي غير المسمى. بنينا خط أنابيب تعليق يولد ويفilter وينقي الأفضل باستخدام فحوصات آلية. هذا أعطانا مجموعة بيانات عالية الجودة تبلغ 15,000 ساعة — كل ذلك دون كتابة يدوية.

هذا النهج جعل من الممكن تدريب نموذجنا من الصفر، واستيعاب ثراء اللغة العربية المنطوقة عبر المواقف الحقيقية، بسرعة وفعالية. بدون هذا الأسلوب، بناء نظام Arabic ASR على هذا النطاق كان سيتطلب سنوات وجهدًا يدوياً بملايين الدولارات.

تفوق Munsit على نماذج من OpenAI وMicrosoft وMeta عبر عدة معايير. ماذا يقول هذا الإنجاز عن مستقبل الابتكار في الذكاء الاصطناعي العربي؟

مستقبل الذكاء الاصطناعي العربي بين أيدينا؛ وهذا بالضبط ما يثبت هذا الإنجاز. لم نعد قادرون على الاعتماد على التكنولوجيا التي لا نملكها أو الاعتماد على أطراف ثالثة لا تؤثر على منطقتنا.

يظهر Munsit أننا يمكن أن نبني الذكاء الاصطناعي من الدرجة الأولى، من المنطقة، من أجل المنطقة — باستخدام المواهب المحلية لحل المشاكل المحلية. إنه إشارة واضحة أن موجة الابتكار القادمة في الذكاء الاصطناعي العربي ستأتي من الداخل.

كيف ترى تطور Munsit في الإصدارات القادمة، وما هي الحدود الجديدة للذكاء الاصطناعي الصوتي العربي في CNTXT؟

ستنتظر فقط وترى. ما يمكنني قوله هو أن لدينا مجموعة جديدة من حلول الذكاء الاصطناعي العربية الأولى القادمة — كلها مدعومة من Munsit ونماذج أخرى نحن بصدد بنائها حاليًا في CNTXT AI. هذا مجرد البداية.

غالبًا ما تتحدث عن أهمية “الذكاء الاصطناعي السيادي”. ماذا يعني هذا المصطلح لك، ولماذا هو حاسم للخليج و区域 الشرق الأوسط وأفريقيا؟

الذكاء الاصطناعي السيادي يعني لي امتلاك السيطرة الكاملة على البيانات والبنية التحتية والنماذج التي تشكل مستقبلنا. هذا أمر حاسم لأننا نحتاج إلى امتلاك مصيرنا، وهذا يبدأ بالبيانات.

سيادة البيانات هي كل شيء. البيانات ثمينة، ونحن بحاجة إلى التأكد من أنها تبقى في أيدينا.

لا نستطيع أن نسمح لنفسنا بتسليم مستقبلنا والجلوس في حالة من الخمول بينما يبني الآخرون التكنولوجيا من أجلنا. مستقبل الذكاء الاصطناعي في هذه المنطقة سيتأتى من هذه المنطقة. هذا بالضبط ما نعمل نحوه.

كيف ترى CNTXT AI يلعب دورًا في تشكيل نظام الذكاء الاصطناعي في الشرق الأوسط على مدار الخمس سنوات القادمة؟

من خلال تمكين جاهزية الذكاء الاصطناعي الحقيقية. نحن نذهب ونفهم ما تحتاجه الشركات والحكومات، ونبني استراتيجيات البيانات والذكاء الاصطناعي، ثم نساعدهم على بناء واختبار وتحديث ونشر وتوسيع نطاقها.

إذا كانت البيانات هي النفط الجديد، فإن البيانات غير المهيكلة هي نفط غير منقوع — مليء بالاحتمالات ولكن بدون فائدة حتى يتم معالجتها. لذلك بنينا CNTXT AI لمساعدة المنظمات على تنظيف وتنظيم وتفعيل بياناتها. لأن هذا هو المكان الذي يبدأ فيه التحول الحقيقي للذكاء الاصطناعي.

من موقعك كريادي ومستثمر، ماذا ستقوله للأسس الأخرى التي تبني شركات الذكاء الاصطناعي في الأسواق الناشئة؟

ابدا الآن. تحرك بسرعة. فشل بسرعة، وتعلم بشكل أسرع، وستستمر في التكرار.

الأهم من ذلك، ابني لحلول مشاكل حقيقية. ابقَ قريباً من الأرض — استمع إلى المستخدمين، لا مجرد الضوضاء. في الأسواق الناشئة، الصلاحية والتناسب هي المفتاح.

شكرًا على المقابلة الرائعة، القراء الذين يرغبون في معرفة المزيد يجب أن يزوروا CNTXT AI.

أنطوان هو قائد رؤى ومؤسس شريك في Unite.AI، مدفوعًا بشغف لا يتزعزع لتشكيل وتعزيز مستقبل الذكاء الاصطناعي والروبوتات. رجل أعمال متسلسل، يعتقد أن الذكاء الاصطناعي سيكون مدمرًا للمجتمع مثل الكهرباء، وغالبًا ما يُقبض عليه وهو يثرثر عن إمكانات التكنولوجيات المدمرة و AGI.

كما أنه مستقبلي، فهو مخصص لاستكشاف كيف سيشكل هذه الابتكارات العالم. بالإضافة إلى ذلك، فهو مؤسس Securities.io، وهي منصة تركز على الاستثمار في التكنولوجيات المتقدمة التي تعيد تعريف المستقبل وتهيئ القطاعات بأكملها.