مقابلات
مانويل روميرو، المؤسس المشارك والرئيس العلمي في Maisa – سلسلة المقابلات

مانويل روميرو، المؤسس المشارك والرئيس العلمي في Maisa، هو باحث ومهندس في مجال الذكاء الاصطناعي يركز على تطوير أنظمة ذكاء اصطناعي موثوقة ومتقدمة. شارك في تأسيس Maisa في عام 2024 لإنشاء ذكاء اصطناعي مسؤول يمكنه تنفيذ عمليات أعمال معقدة مع شفافية وسيطرة. قبل Maisa، شغل روميرو مناصب هندسية ومهندس تعلم الآلة في شركات بما في ذلك Clibrain وNarrativa، حيث تخصص في معالجة اللغة الطبيعية وأنظمة الذكاء الاصطناعي على نطاق كبير. في وقت مبكر من مسيرته المهنية، عمل كمطور برمجيات كامل الطاقات ومختص في DevOps قبل الانتقال إلى بحث وتطوير الذكاء الاصطناعي المتقدم، ليصبح مساهماً نشطاً في النظام البيئي المفتوح المصدر للذكاء الاصطناعي.
Maisa AI يطور “عمال رقميين مستقلين”، وكلاء ذكاء اصطناعي مصممين لتحسين عمليات العمل التجارية المعقدة مع الحفاظ على القابلية للتتبع والحوكمة والموثوقية. يسمح المنصة للشركات ببناء وتشغيل وكلاء ذكاء اصطناعي باستخدام اللغة الطبيعية، مما يتيح التutomatisation عبر الأنظمة والبيانات الداخلية دون الحاجة إلى برمجة متقدمة. من خلال التركيز على التفكير القابل للتحقق والتنفيذ المنظم، يهدف Maisa إلى التغلب على القيود الشائعة المرتبطة بأنظمة الذكاء الاصطناعي التوليدية ومساعدة الشركات على نشر الذكاء الاصطناعي المستقل بسلامة على نطاق واسع.
لقد ركزت في كثير من الأحيان على فهم “لماذا” الأعمق وراء أنظمة الذكاء الاصطناعي. من وجهة نظر تقنية، ما الذي دفعك إلى تأسيس Maisa في عام 2024، وما هو الفجوة في هندسة الذكاء الاصطناعي للشركات التي اعتقدت أنها لم تتم معالجتها؟
الدوافع وراء تأسيس Maisa جاءت من إدراك أن معظم أنظمة الذكاء الاصطناعي للشركات بنيت حول النماذج، وليس الأنظمة.
خلال ازدهار الذكاء الاصطناعي التوليدي، ركزت العديد من الشركات على دمج نماذج لغة كبيرة في سير العمل الحالية. ومع ذلك، كانت هذه الأنظمة غالبًا ما تكون هشة وغامضة وصعبة التشغيل على نطاق واسع. كانت تفتقر إلى:
- التنفيذ التحديد حيث يهم الأمر.
- الرصد القوي والقابلية للتتبع
- التناسخ
الفجوة التي رأيناها هي غياب البنية التحتية الحقيقية للذكاء الاصطناعي للشركات. كانت الشركات تبني تطبيقات حول واجهات برمجة التطبيقات للنماذج، لكنها تفتقر إلى شيء مكافئ لعمارة الكمبيوتر للعمل المعرفي.
تم إنشاء Maisa لمعالجة هذه الفجوة من خلال تصميم هندسة مركزية حول وحدة معالجة المعرفة (KPU)، وهي نظام يتيح للذكاء الاصطناعي العمل بشكل موثوق بداخل سير العمل الحقيقي للشركات.
لقد عملت عبر معالجة اللغة الطبيعية والنظم التوليدية المتقدمة قبل تأسيس Maisa. كيف أثرت تلك الخبرات على الخيارات الهندسية وراء المنصة؟
خبرتي في العمل في معالجة اللغة الطبيعية واللغة الطبيعية التوليدية، ولا سيما حول تدريب ونماذج اللغة الكبيرة (مئات منها)، جعلت شيئًا واضحًا عند محاولة بناء أنظمة حقيقية على قمتهم. هندسة التランスفورمر قوية بشكل استثنائي، ولكنها تأتي مع ثلاثة قيود أساسية على الأقل يجب معالجتها لاستخدامها بشكل موثوق في الإنتاج.
الأول هو الهلوسة. تنتج هذه النماذج النص بشكل احتمالي ويمكن أن تنتج مخرجات تبدو صحيحة ولكنها ليست مدعومة بمعلومات موثقة.
الثاني هو قيود السياق. حتى مع نوافذ سياق أكبر، تعمل النماذج داخل مساحة رمز محددة، مما يجعل من الصعب التفكير في معرفة كبيرة أو معقدة.
الثالث هو المعلومات الحديثة. تمثل النماذج المسبقة لمحة عن المعرفة في وقت التدريب، بينما تتطلب البيئات التجارية أنظمة يمكنها التفكير في معلومات تتغير باستمرار.
التعرف على هذه القيود شكلت العديد من القرارات الهندسية وراء Maisa. بدلاً من الاعتماد على النموذج وحده، ركزنا على بناء نظام يتيح الوصول المنظم إلى المعرفة، وآليات التحقق، والتنفيذ الخاضع للسيطرة بحيث يمكن للذكاء الاصطناعي العمل بشكل موثوق في سير العمل التجارية الحقيقية.
许多 الشركات تجرب الذكاء الاصطناعي التوليدي ولكنها تواجه صعوبات في الانتقال بعيداً عن التجارب. من وجهة نظر تصميم النظام، ما هو السبب الأساسي لفشل التوسع في العديد من المنظمات؟
تواجه العديد من الشركات صعوبات في الانتقال بعيداً عن تجارب الذكاء الاصطناعي التوليدي لأن معظم التطبيقات مبنية كتجارب بدلاً من أنظمة قوية. غالبًا ما تعتمد النماذج الأولية على هندسة الاستدعاء والتنسيق الخفيف وأنابيب الاسترجاع البسيطة، والتي يمكن أن تثبت القيمة ولكنها لا توفر الموثوقية والرصد والسيطرة المطلوبة للبيئات الإنتاجية. عندما تحاول المنظمات توسيع هذه الأنظمة، تواجه مشاكل مثل مخرجات غير متسقة، وعدم وجود تتبع، وصعوبة التكامل مع سير العمل التجارية، والرقابة المحدودة على كيفية سلوك الذكاء الاصطناعي. في جوهره، المشكلة هي أن نماذج اللغة الكبيرة هي مولدات احتمالية، بينما تتطلب العمليات التجارية سلوكًا قابلًا للتنبؤ والتدقيق. بدون هندسة تتيح هيكلاً حول التفكير والتحقق والتنفيذ والرصد، يبقى نظام الذكاء الاصطناعي التوليدي صعب التوسع بعيداً عن الحالات الاستخدامية المعزولة.
تم تصميم وكلاء Maisa الرقميين ليكونوا قابليين للتتبع والهيكلة بدلاً من كونهم مولدين احتماليين فقط. ماذا يعني ذلك في المصطلحات العملية للشركات التي تقيم الذكاء الاصطناعي للاستخدام الإنتاجي؟
عندما نقول إن وكلاء Maisa الرقميين قابليين للتتبع والهيكلة بدلاً من كونهم مولدين احتماليين فقط، نعني أن الذكاء الاصطناعي يعمل داخل نظام خاضع للسيطرة حيث يمكن تتبع وتحكيم أفعالها وعمليات التفكير. بدلاً من السماح للنموذج بالتوليد الحر لمخرجات وعمليات اتخاذ القرار، يهيكل النظام كيفية تفاعل الذكاء الاصطناعي مع البيانات والأدوات وسير العمل. يمكن تسجيل كل خطوة في العملية وتفتيشها والتحقق منها، وتنفيذ الإجراءات من خلال واجهات محددة بدلاً من مخرجات النموذج مباشرة. بالنسبة للشركات، هذا يعني أن أنظمة الذكاء الاصطناعي يمكن رصدها ومراقبتها وتكاملها في العمليات الحيوية بثقة أكبر. إنه يغير الذكاء الاصطناعي من كونه مساعدًا أسودًا إلى نظام يمكن فهم سلوكه وسيطرته وثقته في البيئات الإنتاجية.
كما مهندس وحدة معالجة المعرفة، كيف تختلف هذه الوحدة عن طبقة التوجيه النموذجية أو محرك سير العمل المبني حول نماذج اللغة الكبيرة؟
تختلف وحدة معالجة المعرفة عن طبقات التوجيه النموذجية لأنها مصممة لإدارة دورة حياة التفكير المدفوع بالذكاء الاصطناعي بدلاً من مجرد تنسيق استدعاءات النموذج والخطوات. تعمل معظم إطارات التوجيه كمنظمي لسير العمل يربطون بين خطوات مثل الاسترجاع واستدعاء النموذج وتنفيذ الأدوات. تعمل وحدة معالجة المعرفة على مستوى هندسي أعمق من خلال هيكلة كيفية الوصول إلى المعرفة وكيفية التفكير وكيفية تنفيذ الإجراءات داخل النظام. تعامل معالجة المعرفة كطبقة حسابية أساسية، وتكامل الذاكرة والتحقق والتنفيذ الخاضع للسيطرة بحيث يمكن للذكاء الاصطناعي العمل بشكل موثوق بداخل سير العمل التجارية المعقدة بدلاً من مجرد توليد استجابات.
في الصناعات الخاضعة للتنظيم، يكون تحمل المخاطر منخفضًا. ما هي القرارات التصميمية المحددة التي اتخذتها لضمان أن مخرجات الذكاء الاصطناعي تظل موثوقة ولا تنتشر الأخطاء عبر سير العمل المعقدة؟
في الصناعات الخاضعة للتنظيم، تكون الموثوقية والسيطرة أساسيتين، لذلك قمنا بتصميم النظام مع حواجز أمان متعددة لضمان أن مخرجات الذكاء الاصطناعي تظل موثوقة. أحد المبادئ الأساسية هو التنفيذ الهيكلي، حيث لا يمكن للذكاء الاصطناعي تشغيل الإجراءات الحيوية مباشرة دون المرور عبر واجهات خاضعة للسيطرة. كما أدرجنا طبقات التحقق التي تتحقق من مخرجات النموذج مقابل مخططات أو قواعد أو آليات ثانوية قبل قبولها. بالإضافة إلى ذلك، يحتفظ النظام بالرصد الكامل، وتسجيل خطوات التفكير وتفاعلات الأدوات والقرارات بحيث يمكن تتبعها ومراجعتها. معًا، تساعد هذه القرارات التصميمية على منع انتشار الأخطاء عبر سير العمل وتسمح للمنظمات بتشغيل أنظمة الذكاء الاصطناعي بدرجة الموثوقية والحوكمة المطلوبة في البيئات الخاضعة للتنظيم.
ما هي الحالات الاستخدامية الأكثر إقناعًا في البداية حيث رأيت وكلاء Maisa الرقميين يتحركون من المساعدة الموجهة إلى التنفيذ الكامل للذكاء الاصطناعي؟
تظهر بعض الحالات الاستخدامية الأكثر إقناعًا في البداية في سير العمل المعرفية حيث يتم تعريف العمليات جيدًا ولكنها لا تزال تتطلب تحليلًا وتحديدًا كبيرين. في مجالات مثل مراجعة الامتثال والعمليات الدعمية الفنية وإدارة المعرفة الداخلية، يمكن لوكلاء Maisa الرقميين أن يتجاوزوا المساعدة البشرية ويتحركوا نحو تنفيذ مهام هيكلية من النهاية إلى النهاية. يمكنهم استرجاع وتحليل كميات كبيرة من المعلومات الداخلية، وتطبيق الإجراءات المحددة، والتفاعل مع أنظمة الشركات من خلال أدوات خاضعة للسيطرة، وإنتاج مخرجات تغذي مباشرة إلى سير العمل التشغيلية. التغيير الرئيسي يحدث عندما لا يكون الذكاء الاصطناعي مجرد مولد اقتراحات، ولكن يمكنه تنفيذ إجراءات محددة بثقة داخل نظام خاضع للسيطرة، مما يسمح للمنظمات بتأتمتة أجزاء من العمل المعرفي المعقد بدلاً من مجرد تعزيزه.
كما تزداد التدقيقات التنظيمية حول الذكاء الاصطناعي على الصعيد العالمي، كيف ترى البنية التحتية للذكاء الاصطناعي تتطور لتلبية متطلبات الامتثال دون تقييد الابتكار؟
كما تزداد التدقيقات التنظيمية حول الذكاء الاصطناعي، أعتقد أننا سوف نشهد تحولاً بعيداً عن الهندسات التي تعتمد على استدعاء واجهات برمجة التطبيقات للنماذج وتثق في مخرجاتها بشكل أعمى. ستطالب الشركات والمنظمات بزيادة عدد الأنظمة التي يكون سلوكها قابلًا للرصد والتحقق والسيطرة. هذا هو المكان الذي تصبح فيه هندسات مثل وحدة معالجة المعرفة مهمة. هذا النوع من الهندسة يسمح للمنظمات بفرض التحكم، وتتبع القرارات، وضمان موثوقية مخرجات الذكاء الاصطناعي قبل أن تؤثر على العمليات الحقيقية. مع مرور الوقت، أتوقع أن تصبح هذه الأنواع من الأنظمة الأساس القياسي للبنية التحتية للذكاء الاصطناعي الموثوق.
لقد تحدثت عن الأخلاقيات والمسؤولية جنبًا إلى جنب مع عملك الفني. كيف تؤثر تلك المنظورات على نهجك في بناء أنظمة ذكاء اصطناعي شفافة؟
الأخلاقيات والمسؤولية، بالنسبة لي، تترجم مباشرة إلى خيارات التصميم. إذا كانت أنظمة الذكاء الاصطناعي ستشارك في سير العمل التشغيلية الحقيقية، لا يمكن أن تعمل كأ盒ة سوداء غير شفافة. هذا المنظور أثرت بشكل كبير على كيفية نهجي لبناء أنظمة الذكاء الاصطناعي. الشفافية، والقابلية للتتبع، والرقابة البشرية يجب أن تكون مدعومة في الهندسة من البداية. هذا يعني ضمان أن خطوات التفكير يمكن ملاحظتها، والقرارات يمكن مراجعتها، والإجراءات يتم تنفيذها من خلال آليات خاضعة للسيطرة. عندما يتم دمج هذه المبادئ في مستوى البنية التحتية، تصبح أنظمة الذكاء الاصطناعي أكثر موثوقية وأسهل للمنظمات للحكم عليها مسؤولية.
متطلعًا إلى الأمام، هل تعتقد أن البنية التحتية للذكاء الاصطناعي الإيجنتي ستصبح أساسية مثل بنية السحابة كما فعلت في العقد السابق — وماذا يحتاج إلى الحدوث تقنيًا لتحقيق هذا التحول؟
أعتقد أن البنية التحتية للذكاء الاصطناعي الإيجنتي لديها إمكانية أن تصبح أساسية مثل بنية السحابة كما أصبحت في العقد السابق. كما تتطلع المنظمات إلى تطبيق تطبيقات أوتوماتيكية متزايدة التعقيد على العمل المعرفي، سوف تحتاج إلى أنظمة يمكنها تنسيق التفكير والذاكرة والتنفيذ عبر العديد من المهام ومصادر البيانات. ومع ذلك، من أجل أن يحدث هذا التحول، يجب أن تنضج الهندسة التحتية بعيداً عن دمج النماذج البسيط. نحن بحاجة إلى بنية تحتية توفر التفكير الهيكلي، والوصول الموثوق إلى معرفة الشركات، والرصد القوي، والتنفيذ الخاضع للسيطرة بحيث يمكن للذكاء الاصطناعي أن يتحول من أدوات تجريبية إلى بنية تحتية موثوقة تعتمد عليها المنظمات لتشغيل العمليات الحيوية.
شكرًا على المقابلة الرائعة، القراء الذين يرغبون في معرفة المزيد يجب أن يزوروا Maisa AI.












