قادة الفكر
المسار الحرج لتحويل التطوير النمطي إلى آلي

العلامة الفارقة التالية في أبحاث الذكاء الاصطناعي هي تحويل التطوير النمطي إلى آلي. كل تقدم في التفكير واللغة والتصور هو، في بعض المعنى، خطوة نحو هذا الهدف. ومع ذلك، فإن المسار إلى آليّة النمذجة يتطلب حل مجموعة من التحديات الأساسية التي يجب كسرها أولاً.
الجسر إلى هذا الهدف يمتد مباشرة عبر هندسة التعلم الآلي (ML). هناك مفهوم خاطئ شائع يعتقد أن التعلم الآلي هو تقنية سابقة للذكاء الاصطناعي الحديث وأن النماذج الأساسية قد استبدلت بها. هذا يسيء فهم العلاقة. كمنهج أكاديمي، يشمل التعلم الآلي جميع جوانب تدريب النموذج، بما في ذلك تدريب النماذج الأساسية في مركز لحظة الذكاء الاصطناعي الحالية. ومع ذلك، هناك فرق معنوي في القياس و複雑ية البيانات.
النماذج التقليدية للتعلم الآلي يتم تدريبها عادة على مجموعات بيانات محددة بعناية، ومحددة المجال، تحتوي على آلاف أو ملايين الأمثلة. النماذج الأساسية، من ناحية أخرى، يتم تدريبها على آلاف مجموعات البيانات في نفس الوقت، مستمدة من مصادر مختلفة بشكل كبير مع تنسيقات وتنسيق و质量 غير متسقة. هذا الفرق في قياس البيانات وتنوعها هو причине أساسية لماذا يصبح إدارة البيانات أكثر صعوبة وأهمية مع نمو النماذج قوة.
ذلك يجعل فهم البيانات حجزًا مركزيًا في تحويل التطوير النمطي إلى آلي. نظام الذكاء الاصطناعي الذي يمكنه تفسير البيانات المتنوعة وتحسين الأنابيب المبنية حولها يمكن، في المبدأ، تحسين عملية تدريبه الخاصة ومساعدة بناء نماذج أفضل. مرة واحدة يمكن للذكاء الاصطناعي تحسين العملية التي يتم بها تدريبه، التطورات تتسارع إلى أسفل إلى كل مجال حيث يتم تطبيق الذكاء الاصطناعي.
ثلاثة عوائق تقف في الطريق
العائق الأول هو تجزئة السياق. في几乎 كل منظمة، الإشارات والتحريات وتصريفات الميزات والمعرفة المؤسسية المتعلقة بأي مشكلة نمذجة معينة تنتشر عبر مستودعات البيانات والكتب والأنابيب التي لم يتم تصميمها أبدًا للتواصل مع بعضها البعض. ضع في اعتبارك نظامًا صحيًا يبني نموذجًا لاكتشاف السهال. المعايير السريرية المهمة المتعلقة بهذه المشكلة، مثل عتبات الحيوية وقيم المختبرات ومعايير التوثيق، قد تعيش في وحدات منفصلة تمامًا من نظام السجل الصحي الإلكتروني.
العائق الثاني هو الغموض الدلالي. المعنى ليس متأصلًا في البيانات ولكن هو سياقي وتشغيلي. نفس اسم الحقل في قواعد بيانات مختلفتين قد يشير إلى أشياء مختلفة بشكل دقيق. المفاهيم مثل الإيرادات والمستخدم النشط والهجرة تملك عادةً تعريفات صالحة متعددة داخل شركة واحدة. حتى مفهوم يبدو واضحًا مثل “الإيرادات” يمكن أن يسبب مشاكل. قد يعرّف فريق المبيعات الإيرادات على أنها القيمة الإجمالية للعقود الموقعة في هذا الربع، بينما يعرّف فريق المالية الإيرادات على أنها النقد الفعلي المستلم. فريق المنتج لديه فهم آخر، حيث يعرّف المصطلح على أنه إيرادات معترف بها موزعة على فترة اشتراك. كل هذه الفرق تسحب من حقول تحمل اسم “الإيرادات” في أنظمتها الخاصة، ولكن تقريرًا متجاوزًا بين الفرق يخلط ثلاثة أرقام غير متوافقة بصمت.
العائق الثالث والأكثر شمولية هو غياب الذاكرة المؤسسية المocumented. تتبع الأصول، حل التناقضات، والحفاظ على إشارات الجودة عبر هذه المصادر هو مشكلة لم تحل حتى الآن للفرق البشرية. بدون ذاكرة مؤسسية لما تم تجربته وكيف نجحت هذه المناهج، أي آلية لتحويل النمذجة سوف تستمر في إعادة اكتشاف نفس النقاط الميتة، وتبديد الوقت والموارد.
ضع في اعتبارك فريقًا للعلوم البيانية في شركة تجارية يبني نموذجًا لتنبؤ بالطلب. على مدار ثلاث سنوات، اكتشف اثنا عشر محللًا بشكل مستقل أن البيانات الجوية الخام تدهور أداء النموذج خلال أسابيع العطلات، وأن تغذية مخزون مورد معين تحتوي على تأخير منهجي، وأن النهج القياسي لمعالجة الأحداث الترويجية يسبب تسرب الهدف. عندما انتقل المحللون الأصليون إلى فرق أخرى أو غادروا الشركة، ذهبت المعرفة معهم. بدون سجل مؤسسي لما تم تجربته، ما فشل ولماذا، آلية لتحويل النمذجة لا تستطيع بناء الخبرة المتراكمة. إنها ببساطة تبدأ من الصفر، مرة بعد مرة، وتبديد الوقت دون داعي.
ما يتطلبه حل حقيقي
تاريخ تلقين التعلم الآلي هو تاريخ للحلول الجزئية. AutoML تعاملت مع مشكلة ضيقة لضبط المعاملات Hyperparameter ولكنها لم تتمكن من التعامل مع عدم تطابق الأهداف أو التفكير في النية المؤسسية. MLOps جعلت أنابيب الإنتاج أكثر متانة وأسهل في المراقبة، ولكن أدوات MLOps تنفذ استراتيجية بدلاً من تعريفها. الوكلاء البرمجيون الأخيرون يمثلون خطوة حقيقية إلى الأمام، ولكنهم ورثوا نفس النقطة العمياء. إنهم يولّدون التعليمات البرمجية جيدًا بينما يعملون بدون سياق مؤسسي أو ذاكرة مؤسسية.
نظام قادر على هندسة التعلم الآلي المستقلة حقًا سوف يحتاج إلى قدرات لا توفرها أي أداة موجودة بالتركيبة. سوف يحتاج إلى 翻訳 الأهداف التجارية إلى أهداف نموذجية، وهو 翻訳 لا يمكن استخلاصه من البيانات وحدها. سوف يحتاج إلى اكتشاف البيانات ذات الصلة عبر الأنظمة المتناثرة ذات السلاسل غير المتسقة، مع الالتزام تلقائيًا بالامتثال والإدارة والأمان، بدلاً من الحاجة إلى إدارة هذه الموارد من قبل البشر كعملية منفصلة. سوف يحتاج إلى ذاكرة مؤسسية لرفع العمل الموجود، وفهم لماذا تم التخلي عن التجارب السابقة، وبناء على ما يعرفه الزملاء بالفعل.
مسارات التدقيق الصارمة التي تتبع الأصول عبر إصدارات البيانات وتصريفات الميزات والالتزامات بالتعليمات البرمجية سوف تحتاج إلى أن تكون آلية أساسية لترسيم النظام في ما حدث فعلاً. وأي نظام من هذا القبيل سوف يحتاج إلى تصميم تفاعلي بشري مدروس. ليس اختيارًا ثنائيًا بين التلقين الكامل والتحكم اليدوي الكامل، ولكن دعمًا لمستويات تفاعل مختلفة اعتمادًا على المهمة، والمخاطر، وثقة النظام عند كل نقطة قرار. التلقين الذي يتجاوز الحكم البشري في اللحظات الحاسمة ليس ميزة من ميزات الذكاء الاصطناعي المصمم جيدًا؛ بل هو وضع فشل.
ما لم يحله أي مختبر بعد هو كيفية إنشاء فهم دلالي للبيانات المؤسسية الذي يفهم ما تعنيه البيانات في سياق مؤسسي محدد. MCP يحل مشكلة الاتصال. إنه لا يحل مشكلة المعنى بعد. هذا لا يزال الجبهة البحثية المفتوحة.
ما يصبح ممكنًا
الآثار الاقتصادية لحل هذه المشاكل هي كبيرة. التطوير المخصص للتعلم الآلي اليوم يتطلب ممارسين متخصصين وأسبوعًا من التكرار، حتى لمشاكل محددة جيدًا. نظام يمكنه الملاحة في كامل تدفق العمل الآلي من تعريف المشكلة إلى اكتشاف البيانات وتنمية النموذج وتقييم النموذج سوف يغير هذه المعادلة بشكل كبير، ويضغط على الجداول الزمنية، ويفتح حالات استخدام قيمة عالية لا يمكن ملاحقتها حاليًا بسبب كونها مكلفة للغاية. المشاريع التي تتطلب فرقًا مع خبرة عميقة في التعلم الآلي تعمل لأسابيع يمكن الآن إكمالها في أيام دون الحاجة إلى استخدام الكثير من وقت خبراء التعلم الآلي النادرين.
التحديات المتعلقة بتجزئة السياق والغموض الدلالي وذاكرة المؤسسة المفقودة ليست فريدة من نوعها في التعلم الآلي المؤسسي. إنها تظهر تحت قيود مختلفة في بناء خطوط أنابيب تدريب النماذج الأساسية، حيث يجب تجميع آلاف مجموعات البيانات المتنوعة، وتصفيتها، وتنقيحها بشكل متكرر. بينما تختلف هذه الإعدادات في الهيكل والهدف، كلاهما محدود بنفس الحجز الأساسي: غياب الأنظمة القادرة على استعادة السياق بثبات، وتتبع الأصول، والبناء على العمل السابق عبر التكرارات. تلقين التطوير النمطي في المؤسسة هو因此 خطوة حاسمة على طريق الذكاء الاصطناعي القادر على تحسين نفسه.













