الذكاء الاصطناعي
من النية إلى التنفيذ: كيف تقوم مايكروسوفت بتحويل نماذج اللغة الكبيرة إلى ذكاء اصطناعي ذي توجيه إجرائي
لقد غيرت نماذج اللغة الكبيرة (LLMs) كيفية التعامل مع معالجة اللغة الطبيعية. يمكنها الإجابة على الأسئلة، وكتابة الشفرة، وإجراء المحادثات. ومع ذلك، فإنها تفتقر إلى القدرة على أداء المهام في العالم الحقيقي. على سبيل المثال، يمكن للنموذج اللغوي الكبير إرشادك خلال شراء سترة، ولكن لا يمكنه وضع الطلب من أجلك. هذا الفجوة بين التفكير والفعل هو 한 制限 رئيسي. الناس لا يحتاجون فقط إلى المعلومات، بل يريدون النتائج.
لجسر هذا الفجوة، تقوم مايكروسوفت بتحويل نماذج اللغة الكبيرة إلى وكلاء ذكاء اصطناعي ذي توجيه إجرائي. من خلال تمكينهم من التخطيط، وتفكيك المهام، والتفاعل مع البيئات الحقيقية، يتمكنون من إدارة المهام العملية بفعالية. لهذا التحول إمكانية إعادة تعريف ما يمكن أن تفعله نماذج اللغة الكبيرة، مما يجعلهم أدوات تautomate سير العمل المعقد وتبسط المهام اليومية. دعونا ننظر إلى ما هو مطلوب لجعل هذا يحدث وكيف تقوم مايكروسوفت بمواجهة المشكلة.
ما الذي تحتاجه نماذج اللغة الكبيرة للعمل
لنماذج اللغة الكبيرة لأداء المهام في العالم الحقيقي، تحتاج إلى أن تتجاوز فهم النص. يجب أن تتفاعل مع البيئات الرقمية والفيزيائية مع التكيف مع الظروف المتغيرة. هنا بعض القدرات التي تحتاجها:
-
فهم نية المستخدم
لأداء فعال، تحتاج نماذج اللغة الكبيرة إلى فهم طلبات المستخدم. المدخلات مثل الأوامر الصوتية أو النصية غالبًا ما تكون غامضة أو غير كاملة. يجب على النظام ملء الفجوات باستخدام معرفته وسياق الطلب. يمكن أن تساعد المحادثات متعددة الخطوات في تحسين هذه النيات، مما يضمن فهم الذكاء الاصطناعي قبل اتخاذ الإجراء.
-
تحويل النيات إلى إجراءات
بعد فهم المهمة، يجب على نماذج اللغة الكبيرة تحويلها إلى خطوات قابلة للتنفيذ. قد يتضمن هذا النقر على الأزرار، أو استدعاء واجهات برمجة التطبيقات، أو التحكم في الأجهزة الفيزيائية. تحتاج نماذج اللغة الكبيرة إلى تعديل إجراءاتها للمهمة المحددة، مع التكيف مع البيئة وحل التحديات التي تطرأ.
-
التكيف مع التغييرات
المهام في العالم الحقيقي لا تنجح دائمًا كما هو مخطط. تحتاج نماذج اللغة الكبيرة إلى توقع المشاكل، وتعديل الخطوات، والبحث عن بديلات عند حدوث مشاكل. على سبيل المثال، إذا لم تكن موردًا ضروريًا متاحًا، يجب على النظام أن يجد طريقة أخرى لإكمال المهمة. هذا المرونة يضمن استمرار العملية عند تغيير الأشياء.
-
التخصص في مهام محددة
في حين أن نماذج اللغة الكبيرة مصممة للاستخدام العام، فإن التخصص يجعلها أكثر كفاءة. من خلال التركيز على مهام محددة، يمكن لهذه الأنظمة تقديم نتائج أفضل باستخدام موارد أقل. هذا أمر مهم بشكل خاص للأجهزة التي تتمتع بقدرات حسابية محدودة، مثل الهواتف الذكية أو الأنظمة المدمجة.
من خلال تطوير هذه المهارات، يمكن لنماذج اللغة الكبيرة أن تتجاوز مجرد معالجة المعلومات. يمكنها اتخاذ إجراءات ذات معنى، مما يفتح الطريق لدمج الذكاء الاصطناعي بشكل متساو في سير العمل اليومي.
كيف تقوم مايكروسوفت بتحويل نماذج اللغة الكبيرة
تتبع مايكروسوفت نهجًا منظمًا لإنشاء وكلاء ذكاء اصطناعي ذي توجيه إجرائي. الهدف الرئيسي هو تمكين نماذج اللغة الكبيرة من فهم الأوامر، والتخطيط بفعالية، وتنفيذ الإجراءات. هنا كيف تقوم بذلك:
الخطوة 1: جمع البيانات وتهيئتها
في المرحلة الأولى، جمعت مايكروسوفت بيانات متعلقة بالحالات الخاصة بها: وكلاء UFO (الموصوفة أدناه). تتضمن البيانات استفسارات المستخدم، و细یات البيئة، وإجراءات المهمة. هناك نوعان من البيانات يتم جمعها في هذه المرحلة: أولًا، جمعت بيانات خطة المهمة التي تساعد نماذج اللغة الكبيرة على تحديد الخطوات العليا المطلوبة لإكمال المهمة. على سبيل المثال، “تغيير حجم الخط في وورد” قد يتضمن خطوات مثل تحديد النص وتعديل إعدادات الشريط.
ثانيًا، جمعت بيانات إجراء المهمة، مما يسمح لنماذج اللغة الكبيرة بترجمة هذه الخطوات إلى تعليمات دقيقة، مثل النقر على أزرار معينة أو استخدام اختصارات لوحة المفاتيح.
هذا الجمع بين البيانات يعطي النموذج صورة كبيرة وواضحة للخطوات التي يحتاجها لتنفيذ المهام بفعالية.
الخطوة 2: تدريب النموذج
بعد جمع البيانات، يتم تعدين نماذج اللغة الكبيرة من خلال جلسات تدريب متعددة. في الخطوة الأولى، يتم تدريب نماذج اللغة الكبيرة على التخطيط للمهام عن طريق تعليمها كيفية تقسيم طلبات المستخدم إلى خطوات قابلة للتنفيذ. ثم يتم استخدام بيانات خبيرة تمييزها لتعليمها كيفية ترجمة هذه الخطط إلى إجراءات محددة. لتعزيز قدراتها على حل المشاكل، يتم إشراك نماذج اللغة الكبيرة في عملية استكشاف ذاتية تعززها، مما يمكّنها من مواجهة مهام غير محلولة وتوليد أمثلة جديدة للتعلم المستمر. أخيرًا، يتم تطبيق التعلم التعزيزي، باستخدام反馈 من النجاحات والفشلات لتحسين اتخاذ القرارات.
الخطوة 3: الاختبار دون اتصال
بعد التدريب، يتم اختبار النموذج في بيئات محكومة لضمان الموثوقية. يتم استخدام مقاييس مثل معدل نجاح المهمة (TSR) ومعدل نجاح الخطوة (SSR) لقياس الأداء. على سبيل المثال، قد يتضمن اختبار وكلاء إدارة التقويم التحقق من قدرته على جدولة الاجتماعات وإرسال الدعوات دون أخطاء.
الخطوة 4: التكامل مع الأنظمة الحقيقية
بمجرد التحقق، يتم دمج النموذج في إطار وكلاء. هذا يسمح له بالتفاعل مع البيئات الحقيقية، مثل النقر على الأزرار أو التنقل في القوائم. أدوات مثل واجهة برمجة تطبيقات التutomatisation UI تساعد النظام على تحديد وتعديل عناصر واجهة المستخدم بشكل ديناميكي.
على سبيل المثال، إذا كُلف بتحديد النص في وورد، يتمكن الوكيل من تحديد زر التمييز، واختيار النص، وتطبيق التنسيق. يمكن لمكون الذاكرة أن يساعد نماذج اللغة الكبيرة على تتبع الإجراءات السابقة، مما يسمح لها بالتكيف مع سيناريوهات جديدة.
الخطوة 5: الاختبار في العالم الحقيقي
الخطوة النهائية هي التقييم عبر الإنترنت. هنا، يتم اختبار النظام في سيناريوهات العالم الحقيقي لضمان قدرته على التعامل مع التغييرات غير المتوقعة والأخطاء. على سبيل المثال، قد يوجه وكلاء دعم العملاء المستخدمين خلال إعادة تعيين كلمة المرور مع التكيف مع المدخلات الخاطئة أو المعلومات المفقودة. هذا الاختبار يضمن أن الذكاء الاصطناعي قوي وجاهز للاستخدام اليومي.
مثال عملي: وكلاء UFO
لإظهار كيف يعمل الذكاء الاصطناعي ذي التوجيه الإجرائي، قامت مايكروسوفت بتطوير وكلاء UFO. هذا النظام مصمم لتنفيذ مهام حقيقية في بيئات Windows، مما يتحول من طلبات المستخدم إلى إجراءات مكتملة.
في جوهره، يستخدم وكلاء UFO نموذج لغة كبير لفهم الطلبات وتخطيط الإجراءات. على سبيل المثال، إذا قال المستخدم “حدد كلمة ‘مهم’ في هذا المستند،” يتفاعل الوكيل مع وورد لإكمال المهمة. يجمع المعلومات السياقية، مثل مواقع عناصر التحكم في الواجهة، ويستخدمها لتخطيط الإجراءات.
التغلب على التحديات
في حين أن هذا تطور مثير، فإن إنشاء وكلاء ذكاء اصطناعي ذي توجيه إجرائي يأتي مع تحديات. التوسع هو مشكلة رئيسية. يتطلب تدريب وتنفيذ هذه النماذج عبر مهام متنوعة موارد كبيرة. من المهم أيضًا ضمان السلامة والموثوقية. يجب على النماذج أداء المهام دون عواقب غير مقصودة، خاصة في البيئات الحساسة. كما أن الحفاظ على المعايير الأخلاقية حول الخصوصية والأمان أمر بالغ الأهمية.
تركز خارطة طريق مايكروسوفت على تحسين الكفاءة، وتوسيع نطاق الحالات، والحفاظ على المعايير الأخلاقية. مع هذه التحسينات، يمكن لنماذج اللغة الكبيرة إعادة تعريف كيفية تفاعل الذكاء الاصطناعي مع العالم، مما يجعله أكثر عمليًا، والتكيف، وذو توجيه إجرائي.
مستقبل الذكاء الاصطناعي
يمكن أن يكون تحويل نماذج اللغة الكبيرة إلى وكلاء ذكاء اصطناعي ذي توجيه إجرائي تغييرًا كبيرًا. يمكن لهذه الأنظمة توفير المهام، وتبسيط سير العمل، وجعل التكنولوجيا أكثر سهولة. عمل مايكروسوفت على الذكاء الاصطناعي ذي التوجيه الإجرائي وأدوات مثل وكلاء UFO هو مجرد البداية. مع استمرار تطور الذكاء الاصطناعي، يمكننا توقع أنظمة أكثر ذكاء وقدرة على أداء المهام دون مجرد التفاعل معنا – بل إنجاز المهمات.












