الذكاء الاصطناعي
ريكي كوستا، الرئيس التنفيذي لشركة Quantum Stat – سلسلة المقابلات

ريكي كوستا هو الرئيس التنفيذي لشركة Quantum Stat، وهي شركة تقدم حلولاً تجارية لمبادرات NLP وذكاء اصطناعي
ما الذي جعلك مهتماً في البداية بالذكاء الاصطناعي؟
الصدفة. كنت أقرأ كتابًا عن الاحتمالية عندما وجدت نظرية مشهورة. في ذلك الوقت، كنت أفكر ببراءة عن كيفية تطبيق هذه النظرية على مشكلة لغة طبيعية كنت أحاول حلها في العمل. كما оказалось، كان الخوارزم已经 موجودًا دون أن أعرف، وكان يسمى بايز نيف، وهو نموذج توليدي بسيط يستخدم في التعلم الآلي الكلاسيكي. كانت تلك النظرية هي نظرية بايز. شعرت أن هذه الصدفة كانت دلالة، وزرعت بذرة الفضول لاستمرار التعلم.
أنت الرئيس التنفيذي لشركة Quantum Stat، وهي شركة تقدم حلولاً لمعالجة اللغة الطبيعية. كيف وجدت نفسك في هذا الموقع؟
عندما يكون هناك ثورة في تكنولوجيا جديدة، تكون بعض الشركات أكثر ترددًا من غيرها عند مواجهة المجهول. بدأت شركتي لأن متابعة المجهول ممتعة بالنسبة لي. كما شعرت أنه الوقت المناسب للانطلاق في مجال معالجة اللغة الطبيعية بالنظر إلى جميع الأبحاث الرائعة التي ظهرت في السنوات القليلة الماضية. مجتمع معالجة اللغة الطبيعية لديه القدرة الآن على تحقيق الكثير مع القليل من البيانات لتحسين الأداء.
للمقاطعين الذين قد لا يكونون على دراية بهذا المجال، هل يمكنك أن تشاركنا ماذا تفعل معالجة اللغة الطبيعية؟
معالجة اللغة الطبيعية هي مجال فرعي من الذكاء الاصطناعي والتحليلات التي تحاول فهم اللغة الطبيعية في النص أو الكلام أو التعلم متعدد الأنماط (نص وصور/فيديو) وحوسبتها إلى النقطة التي تكون فيها تقديم رؤى قيمة و/أو تقديم خدمة قيمة. يمكن أن تأتي القيمة من زوايا متعددة، من استرجاع المعلومات في نظام الملفات الداخلي للشركة إلى تصنيف المشاعر في الأخبار أو.bot تويتر GPT-2 الذي يساعد في تسويق وسائل التواصل الاجتماعي (مثل الذي بنيناه قبل بضعة أسابيع).
لديك درجة البكالوريوس في الآداب من كلية هانتر في علم النفس التجريبي. هل تشعر أن فهم الدماغ البشري وعلم النفس البشري هو موردًا عند فهم وتوسيع مجال معالجة اللغة الطبيعية؟
هذا يتناقض، ولكن للأسف، لا. التشبيه بين الخلايا العصبية والشبكات العصبية العميقة هو فقط للتأمل والتفكير. يمكن أن تتعلم الكثير من العلوم المعقدة والهندسة. الصعوبة في فهم كيفية عمل الدماغ تكمن في أننا نتعامل مع نظام معقد. “الذكاء” هو ظاهرة متأصلة من تعقيد الدماغ وتفاعله مع بيئته، ومن الصعب تحديده. علم النفس والعلوم الاجتماعية الأخرى، التي تعتمد على “التقليل” (من أعلى إلى أسفل)، لا تعمل في هذا الإطار المعقد. هنا التأمل: تخيل شخصًا يحاول تقليل أغنية “دعها تكون” إلى مقياس دو ماجور. لا يوجد شيء في ذلك المقياس يمكن أن يتنبأ بأن “دعها تكون” ستنشأ منه. نفس الشيء يحدث مع شخص يحاول تقليل السلوك إلى نشاط عصبي في الدماغ.
هل يمكنك أن تشاركنا لماذا البيانات الكبيرة مهمة جدًا عند معالجة اللغة الطبيعية وذكاء اصطناعي أكثر تحديدًا؟
كما هو الحال، لأن نماذج التعلم العميق تُقدم البيانات، كلما زادت البيانات التي قدمتها إلى النموذج، زادت الحالات النادرة التي سيراها عند الاستدلال في البرية. هذا الهيكل “يحفز” مجموعات بيانات كبيرة لتحسين دقة الإخراج. ومع ذلك، إذا كنا نريد تحقيق سلوك أكثر ذكاءً من نماذج الذكاء الاصطناعي، يجب أن ننظر إلى ما وراء كمية البيانات التي لدينا وأكثر نحو كيف يمكننا تحسين قدرة النموذج على التفكير بشكل أكثر كفاءة، وهو ما لا يجب أن يتطلب الكثير من البيانات. من منظور التعقيد، تجارب автоматиات الخلية التي أجراها فيزيائيون مثل جون فون نيومان وستيفن وولفرام في القرن الماضي أظهرت أن التعقيد يمكن أن ي出现 من شروط وقيود بسيطة. ما هي هذه الشروط/القيود بالنسبة للذكاء الاصطناعي، هو ما يبحث عنه الجميع.
أطلقت مؤخرًا قاعدة بيانات “Big Bad NLP”. ما هي هذه القاعدة وكيف تهتم بالذكاء الاصطناعي؟
تم إنشاء هذه القاعدة لتزويد مطوري معالجة اللغة الطبيعية بإمكانية الوصول السلس إلى جميع مجموعات البيانات المهمة في الصناعة. تساعد هذه القاعدة في فهرسة مجموعات البيانات التي لها تأثير ثانوي هو القدرة على استعلام المستخدمين. يستغرق معالجة البيانات معظم الوقت في خط أنابيب النشر، وتحاول هذه القاعدة التخفيف من هذه المشكلة قدر الإمكان. بالإضافة إلى ذلك، إنها منصة مجانية لأي شخص بغض النظر عما إذا كنت باحثًا أكاديميًا أو ممارسًا أو خبيرًا مستقلًا في الذكاء الاصطناعي يريد الحصول على سرعة في معالجة اللغة الطبيعية. الرابط
تقدّم Quantum Stat حاليًا حلولاً شاملة. ما هي بعض هذه الحلول؟
نساعد الشركات على تسهيل خط أنابيب نمذجة معالجة اللغة الطبيعية من خلال تقديم التطوير في أي مرحلة. يمكننا تغطية مجموعة واسعة من الخدمات من تنظيف البيانات في مرحلة المعالجة الأولية إلى نشر خادم النموذج في الإنتاج (تتم تسليط الضوء على هذه الخدمات أيضًا على صفحتنا الرئيسية). لا تصل جميع مشاريع الذكاء الاصطناعي إلى النتيجة بسبب طبيعة المجهول حول كيفية عمل بياناتك/هيكل المشروع مع نموذج متقدم. نظرًا لهذه عدم اليقين، تقدم خدماتنا للشركات فرصة للتكرار على مشروعها بنسبة جزء من تكلفة توظيف مهندس تعلم الآلة بدوام كامل.
ما هي أحدث التطورات في الذكاء الاصطناعي التي تجدها أكثر إثارة للاهتمام؟
أهم تطور في الآونة الأخيرة هو نموذج الترانسفورمر، قد سمعته: BERT وRoBERTa وALBERT وT5 وغيرها. هذه نماذج الترانسفورمر جذابة جدًا لأنها تسمح للباحثين بالحصول على أداء على مستوى الدولة مع مجموعات بيانات أصغر. قبل الترانسفورمر، كان مطلوبًا من المطور الحصول على مجموعة بيانات كبيرة جدًا لتدريب نموذج من الصفر. منذ أن تأتي هذه النماذج مسبقة التدريب على مليارات الكلمات، فهي تسمح بمزيد من التكرار السريع لمشاريع الذكاء الاصطناعي، وهي ما نتعامل معه في الوقت الحالي.
هل هناك شيء آخر تود مشاركته حول Quantum Stat؟
نحن نعمل على مشروع جديد يتعلق بتحليل المشاعر في السوق المالي سيتم إطلاقه قريبًا. لقد استخدمنا عدة نماذج ترانسفورمر لتقديم رؤى غير مسبوقة حول كيفية تطور الأخبار المالية في الوقت الفعلي. انتظر!
لمعرفة المزيد، قم بزيارة Quantum Stat أو اقرأ مقالنا حول قاعدة بيانات Big Bad NLP.










