قادة الفكر
دليل لفهم وإنشاء وتحسين وكلاء الاتصال بالواجهات البرمجية واجهة برمجة تطبيق قائمة المهام version: 1.0.0 paths: /tasks: post: summary: إضافة مهمة جديدة requestBody: required: true

يتطور دور الذكاء الاصطناعي في شركات التكنولوجيا بسرعة؛ وقد تطور استخدام الذكاء الاصطناعي من معالجة المعلومات السلبية إلى وكلاء نشطين يمكنهم تنفيذ مهام. وفقًا لمسح أجري في مارس 2025 حول اعتماد الذكاء الاصطناعي على المستوى العالمي من قبل Georgian و NewtonX، يُreported أن 91% من المديرين الفنيين في شركات النمو وشركات المؤسسات يستخدمون أو يخططون لاستخدام الذكاء الاصطناعي الوكيل.
وكلاء الاتصال بالواجهات البرمجية هم مثال رئيسي على هذا التحول إلى وكلاء. يستخدم وكلاء الاتصال بالواجهات البرمجية نماذج اللغة الكبيرة للتفاعل مع أنظمة البرمجيات من خلال واجهات البرمجة التطبيقية.
على سبيل المثال، من خلال ترجمة أوامر اللغة الطبيعية إلى مكالمات واجهة برمجة تطبيق دقيقة، يمكن للوكلاء استرداد البيانات في الوقت الفعلي، وتأتمتة المهام الروتينية، أو حتى التحكم في أنظمة برمجيات أخرى. هذه القدرة تحول وكلاء الذكاء الاصطناعي إلى وسطاء مفيدون بين النية البشرية ووظائف البرمجيات.
تستخدم الشركات حاليًا وكلاء الاتصال بالواجهات البرمجية في مجالات مختلفة بما في ذلك:
- تطبيقات المستهلك: تم تصميم المساعدين مثل سيري من آبل وأليكسا من أمازون لتسهيل المهام اليومية، مثل التحكم في أجهزة المنزل الذكية وملء الحجوزات.
- سير عمل المؤسسة: قامت المؤسسات بنشر وكلاء الواجهات البرمجية لتأتمتة المهام المتكررة مثل استرداد البيانات من أنظمة إدارة علاقات العملاء، وتوليد التقارير، أو توحيد المعلومات من الأنظمة الداخلية.
- استرجاع البيانات وتحليلها: تستخدم المؤسسات وكلاء الواجهات البرمجية لتسهيل الوصول إلى مجموعات البيانات المملوكة، والموارد المُشترك فيها، والواجهات البرمجية العامة من أجل توليد رؤى.
في هذا المقال، سأستخدم نهجًا هندسيًا مركّزًا على فهم وإنشاء وتحسين وكلاء الاتصال بالواجهات البرمجية. يعتمد المادة في هذا المقال جزئيًا على البحث والتطوير العملي الذي أجراه مختبر الذكاء الاصطناعي التابع لشركة Georgian.
الfrage الملهمة للعديد من أبحاث مختبر الذكاء الاصطناعي في مجال وكلاء الاتصال بالواجهات البرمجية كانت: “إذا كان لدى المنظمة واجهة برمجة تطبيق، فما هو أكثر الطرق فعالية لإنشاء وكيل يمكنه التفاعل مع تلك الواجهة البرمجية باستخدام اللغة الطبيعية؟”
سأوضح كيف تعمل وكلاء الاتصال بالواجهات البرمجية وكيفية هندسة تلك الوكلاء بنجاح من أجل الأداء. أخيرًا، سأقدم عملية عمل منهجية يمكن استخدامها بواسطة فرق الهندسة لتنفيذ وكلاء الاتصال بالواجهات البرمجية.
ال phần الأول: التعريفات الرئيسية:
- واجهة برمجة التطبيق أو API: مجموعة من القواعد والبروتوكولات التي تمكن تطبيقات البرمجيات المختلفة من التواصل وتبادل المعلومات.
- الوكيل: نظام ذكاء اصطناعي مصمم للاستفادة من بيئته واتخاذ القرارات وتنفيذ الإجراءات لتحقيق أهداف محددة.
- وكيل الاتصال بالواجهات البرمجية: وكيل ذكاء اصطناعي متخصص يترجم أوامر اللغة الطبيعية إلى مكالمات واجهة برمجة تطبيق دقيقة.
- وكيل إنشاء الشفرة: نظام ذكاء اصطناعي يساعد في تطوير البرمجيات من خلال كتابة وتنقيح الشفرة وتصحيح الأخطاء. على الرغم من العلاقة، فإن التركيز هنا ي集中 بشكل أساسي على الوكلاء الذين يدعون واجهات برمجة التطبيق، على الرغم من أن الذكاء الاصطناعي يمكن أن يساعد أيضًا في بناء تلك الوكلاء.
- بروتوكول سياق النموذج (MCP): بروتوكول، تم تطويره بشكل ملحوظ بواسطة Anthropic، لتحديد كيف يمكن للنماذج الكبيرة للغة الاتصال بال أدوات و مصادر البيانات الخارجية.
الجزء الثاني: المهمة الأساسية: ترجمة اللغة الطبيعية إلى إجراءات واجهة برمجة التطبيق
الوظيفة الأساسية لوكيل الاتصال بالواجهات البرمجية هي تفسير طلب اللغة الطبيعية للمستخدم وترجمته إلى مكالمة أو مكالمات واجهة برمجة تطبيق دقيقة. يتضمن هذا العملية عادة:
- تعرف النية: فهم هدف المستخدم، حتى لو تم التعبير عنه بشكل غامض.
- اختيار الأداة: تحديد نقطة نهاية واجهة برمجة التطبيق المناسبة (أو “الأدوات”) من مجموعة من الخيارات المتاحة التي يمكن أن ت满ي النية.
- استخراج المعاملات: تحديد واستخراج المعاملات الضرورية لمكالمات واجهة برمجة التطبيق من استفسار المستخدم.
- تنفيذ الاستجابة وتوليدها: إجراء مكالمات واجهة برمجة التطبيق، واستلام الاستجابة، ومن ثم تحويل هذه المعلومات إلى جواب متسق أو تنفيذ إجراء لاحق.
افترض طلبًا مثل “مرحبا سيري، ما هو الطقس اليوم؟” يجب على الوكيل تحديد الحاجة إلى الاتصال بواجهة برمجة تطبيق الطقس، و تحديد موقع المستخدم الحالي (أو السماح بتحديد موقع)، ومن ثم صياغة مكالمة واجهة برمجة التطبيق لاسترداد معلومات الطقس.
لمطلب “مرحبا سيري، ما هو الطقس اليوم؟”، قد تظهر مكالمة واجهة برمجة التطبيق كما يلي:
GET /v1/weather?location=New%20York&units=metric
التحديات الأولية هي متأصلة في عملية الترجمة هذه، بما في ذلك غموض اللغة الطبيعية والحاجة إلى الوكيل للاحتفاظ بالسياق عبر التفاعلات متعددة الخطوات.
على سبيل المثال، يجب على الوكيل في كثير من الأحيان “تذكر” أجزاء سابقة من المحادثة أو نتائج مكالمات واجهة برمجة التطبيق السابقة لتوجيه الإجراءات الحالية. يمكن أن يكون فقدان السياق وضعًا شائعًا للفشل إذا لم يتم إدارته بشكل صريح.
الجزء الثالث: هندسة الحل: المكونات والبروتوكولات الرئيسية
إن بناء وكلاء الاتصال بالواجهات البرمجية الفعالة يتطلب نهجًا هندسيًا منظمًا.
1. تعريف “الأدوات” للوكيل
للواجهة البرمجية أن تُستخدم بواسطة نموذج اللغة الكبيرة، يجب وصف إمكانياتها له بطريقة يمكنه فهمها. يتم تمثيل كل نقطة نهاية واجهة برمجة التطبيق أو وظيفة غالبًا على أنها “أداة”. يتضمن تعريف أداة قوي:
- وصف واضح باللغة الطبيعية لغرض الأداة ووظيفتها.
- مواصفات دقيقة لمعاملات الإدخال (الاسم، النوع، ما إذا كانت مطلوبة أو اختيارية، والوصف).
- وصف للبيانات الإخراج التي ترجعها الأداة.
2. دور بروتوكول سياق النموذج (MCP)
يعد بروتوكول سياق النموذج مُشغِّلًا حرجًا لاستخدام أدوات أكثر توحيدًا ومتانة بواسطة نماذج اللغة الكبيرة. يوفر تنسيقًا منظمًا لتحديد كيف يمكن للنماذج الاتصال بأدوات و مصادر بيانات خارجية.
التوحيد مع بروتوكول سياق النموذج مفيد لأنه يسمح بالتكامل السهل للأدوات المتنوعة، ويعزز إعادة استخدام تعريفات الأدوات عبر وكلاء أو نماذج مختلفة. بالإضافة إلى ذلك، يُعد من أفضل الممارسات لفريق الهندسة، بدءًا من مواصفات واجهة برمجة التطبيق المحددة جيدًا، مثل مواصفات OpenAPI. تُصمم أدوات مثل Stainless.ai لمساعدة تحويل هذه المواصفات إلى تكوينات بروتوكول سياق النموذج، مما يُسهل عملية جعل واجهات برمجة التطبيق “جاهزة للوكيل”.
3. إطارات الوكيل واختيارات التنفيذ
يمكن أن تساعد إطارات متعددة في بناء الوكيل نفسه. تشمل هذه الإطارات:
- Pydantic: على الرغم من عدم كونها إطارًا حصريًا للوكيل، فإن Pydantic مفيد لتعريف هياكل البيانات وضمان سلامة النوع لمدخلات ومخرجات الأدوات، وهو أمر مهم للثبات. يعتمد العديد من التطبيقات المخصصة على Pydantic لهذه الصلابة الهيكلية.
- مكتبة mcp_agent من LastMile: تم تصميم هذا الإطار خصيصًا للعمل مع بروتوكول سياق النموذج، ويوفر هيكلًا أكثر تحديدًا يتوافق مع الممارسات لإنشاء وكلاء فعالين كما هو موضح في الأبحاث من أماكن مثل Anthropic.
- إطار داخلي: من الشائع أيضًا استخدام وكلاء إنشاء الشفرة الذكية الاصطناعية (باستخدام أدوات مثل Cursor أو Cline) للمساعدة في كتابة شفرة الوكيل وأدواته وطريقة منطقية المحيطة. تظهر تجربة مختبر الذكاء الاصطناعي التابع لشركة Georgian مع الشركات على تطبيقات الوكيل أن هذا يمكن أن يكون رائعًا لإنشاء إطارات مخصصة دقيقة.
الجزء الرابع: الهندسة من أجل الموثوقية والأداء
يُتطلب من الوكيل لجعل مكالمات واجهة برمجة التطبيق بشكل موثوق وجيد الأداء جهد هندسي محدد. هناك طريقتان لفعل ذلك هما (1) إنشاء مجموعة بيانات واعتمادها و (2) هندسة الطلبات وتحسينها.
1. إنشاء مجموعة بيانات واعتمادها
يتطلب تدريب الوكيل (إذا كان ذلك مناسبًا)، واختباره، وتنقيحه مجموعة بيانات عالية الجودة. يجب أن تتكون هذه المجموعة من استفسارات اللغة الطبيعية الممثلة وتسلسلات مكالمات واجهة برمجة التطبيق أو النتائج المتوقعة.
- الإنشاء اليدوي: يضمن إنشاء مجموعة بيانات يدويًا دقة عالية وملاءمة، ولكن يمكن أن يكون شاقًا.
- التوليد الاصطناعي: يمكن أن ي_scale إنشاء البيانات بشكل برمجي أو باستخدام نماذج اللغة الكبيرة، ولكن هذا النهج يطرح تحديات كبيرة. وجد بحث مختبر الذكاء الاصطناعي التابع لشركة Georgian أن ضمان صحة و複雑ية مكالمات واجهة برمجة التطبيق و الاستفسارات المولدة اصطناعيًا هو أمرًا صعبًا للغاية. في كثير من الأحيان، كانت الأسئلة المولدة إما слишком琐碎ة أو معقدة بشكل لا يمكن تحمله، مما يجعل من الصعب قياس أداء الوكيل الدقيق. يُعد التحقق من صحة البيانات المولدة اصطناعيًا أمرًا بالغ الأهمية.
لم التقييم الحرج، غالبًا ما توفر مجموعة بيانات صغيرة، عالية الجودة، تم التحقق منها يدويًا رؤى أكثر موثوقية من مجموعة بيانات كبيرة ومضطربة مولدة اصطناعيًا.
2. هندسة الطلبات وتحسينها
تؤثر أداء وكيل نموذج اللغة الكبيرة بشكل كبير على الطلبات المستخدمة لتوجيه التفكير واختيار الأداة.
- تتضمن الطلبات الفعالة تعريف مهمة الوكيل بوضوح، وتوفير وصف للأدوات المتاحة، وهيكلة الطلب لتشجيع استخراج المعاملات الدقيق.
- يمكن أن يعزز التحسين المنهجي باستخدام إطارات مثل DSPy الأداء بشكل كبير. يسمح DSPy بتعريف مكونات الوكيل (على سبيل المثال، وحدات توليد الأفكار، واختيار الأدوات، وتنسيق المعاملات) ثم يستخدم نهجًا شبيهًا بالمترجم مع أمثلة قليلة من مجموعة البيانات لfinding تحسين الطلبات أو التكوينات لهذه المكونات.
الجزء الخامس: مسار موصى به لفعالية وكلاء واجهة برمجة التطبيق
تطوير وكلاء واجهة برمجة التطبيق الذكية هو تخصص هندسي تكراري. بناءً على نتائج بحث مختبر الذكاء الاصطناعي التابع لشركة Georgian، يمكن تحسين النتائج بشكل كبير باستخدام عملية عمل منهجية مثل التالية:
- ابداً بتعريفات واجهة برمجة التطبيق الواضحة: ابدأ بتعريفات واجهة برمجة التطبيق المنظمة جيدًا OpenAPI للواجهات التي سيتفاعل معها الوكيل.
- توحيد الوصول إلى الأداة: تحويل مواصفات OpenAPI إلى بروتوكول سياق النموذج. يمكن أن تساعد أدوات مثل Stainless.ai في ذلك، مما يخلق طريقة موحدة للوكيل لفهم واستخدام واجهات برمجة التطبيق.
- تنفيذ الوكيل: اختر إطارًا أو نهجًا مناسبًا. قد يتضمن ذلك استخدام Pydantic لنمذجة البيانات داخل هيكل وكيل مخصص أو الاستفادة من إطار مثل مكتبة mcp_agent من LastMile الذي يتمحور حول بروتوكول سياق النموذج.
- قبل القيام بذلك، فكر في ربط بروتوكول سياق النموذج بأداة مثل Claude Desktop أو Cline، واستخدم هذا الواجهة يدويًا للحصول على شعور جيد بكيفية استخدام الوكيل للأداة، وكيفية عدد التكرارات التي يحتاجها عادةً لاستخدام بروتوكول سياق النموذج بشكل صحيح، وأي تفاصيل أخرى قد توفر لك الوقت أثناء التنفيذ.
- تحضير مجموعة بيانات تقييمية عالية الجودة: أنشئ مجموعة بيانات يدويًا أو قم بتحقق صحة دقيقة منها. هذا أمر بالغ الأهمية لاختبار موثوق وتنقيح.
- تحسين طلبات الوكيل وطولوجيته: استخدم إطارات مثل DSPy لتعديل طلبات الوكيل وطولوجيته الداخلية، مستخدمًا مجموعة البيانات لتوجيه التحسينات في الدقة والموثوقية.
الجزء السادس: مثال توضيحي للعملية
هنا مثال مبسط يُظهر مسار العمل الموصى به لإنشاء وكيل واجهة برمجة التطبيق:
الخطوة الأولى: ابدأ بتعريفات واجهة برمجة التطبيق الواضحة
افترض واجهة برمجة تطبيق لإدارة قائمة المهام البسيطة، محددة في OpenAPI:
openapi: 3.0.0
info:
application/json:
schema:
type: object
properties:
description:
type: string
responses:
‘201’:
description: تم إنشاء المهمة بنجاح
get:
summary: الحصول على جميع المهام
responses:
‘200’:
description: قائمة المهام
الخطوة الثانية: توحيد الوصول إلى الأداة
تحويل تعريف واجهة برمجة التطبيق إلى تكوين بروتوكول سياق النموذج. باستخدام أداة مثل Stainless.ai، قد ينتج عن ذلك:
| اسم الأداة | الوصف | معاملات الإدخال | وصف الإخراج |
| إضافة مهمة | إضافة مهمة جديدة إلى قائمة المهام. | `description` (سلسلة، مطلوب): وصف المهمة. | تأكيد إنشاء المهمة. |
| الحصول على المهام | استرجاع جميع المهام من قائمة المهام. | لا شيء | قائمة المهام مع أوصافها. |
الخطوة الثالثة: تنفيذ الوكيل
باستخدام Pydantic لنمذجة البيانات، أنشئ دوالًا تتوافق مع أدوات بروتوكول سياق النموذج. ثم استخدم نموذج اللغة الكبيرة لتفسير استفسارات اللغة الطبيعية واختيار الأداة والمعاملات المناسبة.
الخطوة الرابعة: تحضير مجموعة بيانات تقييمية عالية الجودة
أنشئ مجموعة بيانات:
| الاستفسار | مكالمة واجهة برمجة التطبيق المتوقعة | النتيجة المتوقعة |
| “أضف ‘شراء البقالة’ إلى قائمتى.” | `إضافة مهمة` مع `description` = “شراء البقالة” | تأكيد إنشاء المهمة |
| “ماذا في قائمتى؟” | `الحصول على المهام` | قائمة المهام، بما في ذلك “شراء البقالة” |
الخطوة الخامسة: تحسين طلبات الوكيل وطولوجيته
استخدم DSPy لتعديل الطلبات، مع التركيز على التوجيه الواضح، واختيار الأداة، وتنسيق المعاملات باستخدام مجموعة البيانات المُحضرة للاختبار والتحسين.
من خلال دمج هذه الكتل البنائية – من التعريفات المنظمة لواجهة برمجة التطبيق والبروتوكولات الموحدة للأدوات إلى ممارسات البيانات الصارمة والتحسين المنهجي – يمكن لفرق الهندسة بناء وكلاء واجهة برمجة التطبيق أكثر قدرة وموثوقية وسهولة الصيانة.












