الذكاء الاصطناعي

نشر نماذج اللغة الكبيرة على كوبيرنيتس: دليل شامل LoadBalancer [/code] تُ暴ِع هذه الخدمة نشر gpt3 على منفذ 80 وتُنشئ خدمة LoadBalancer لجعل خادم الاستدلال متاحًا من خارج كلستر كوبيرنيتس. نشر إلى كوبيرنيتس: طبق مаниفستات كوبيرنيتس باستخدام أمر kubectl: مراقبة النشر: راقب تقدم النشر باستخدام الأوامر التالية: بمجرد أن يكون البود يعمل ويسجل أن النموذج محمل وجاهز، يمكنك الحصول على عنوان IP الخارجي لخدمة LoadBalancer: اختبار النشر: يمكنك الآن إرسال طلبات إلى خادم الاستدلال باستخدام عنوان IP الخارجي والمنفذ المُحصل عليه من الخطوة السابقة. على سبيل المثال، باستخدام curl: يتطلب هذا الأمر من خادم استدلال GPT-3 استمرار العبارة “The quick brown fox” لما يصل إلى 50 رمز إضافي. مواضيع متقدمة يجب أن تكون على دراية بها في حين أن المثال السابق يُظهر نشرًا أساسيًا لنماذج اللغة الكبيرة على كوبيرنيتس، هناك مواضيع متقدمة ومراعات يجب استكشافها: 1. التوسيع التلقائي يدعم كوبيرنيتس التوسيع التلقائي الأفقي والرأسي، مما يمكن أن يكون مفيدًا لنشر نماذج اللغة الكبيرة بسبب متطلباتها الحاسوبية المتغيرة. يسمح التوسيع التلقائي الأفقي بزيادة أو تقليل عدد النسخ (البودات) تلقائيًا بناءً على معايير مثل استخدام وحدة المعالجة المركزية أو الذاكرة. لتمكين التوسيع التلقائي، يمكنك استخدام موسع بود كوبيرنيتس التلقائي (HPA) وموسع بود كوبيرنيتس الرأسي (VPA). تراقب هذه المكونات نشرك وتوسع الموارد تلقائيًا بناءً على القواعد والحدود المحددة مسبقًا. 2. جدولة الرسومات ومشاركتها في السيناريوهات التي يتم فيها تشغيل نشرات متعددة لنماذج اللغة الكبيرة أو حمولات عمل حاسوبية كثيفة أخرى على نفس كلستر كوبيرنيتس، تصبح جدولة الرسومات ومشاركتها فعالة جدًا. يوفر كوبيرنيتس آليات متعددة لضمان استخدام الرسومات العادل والفعال، مثل ملحقات أجهزة الرسومات، واختياري العقد، وحدود الموارد. يمكنك أيضًا الاستفادة من تقنيات جدولة الرسومات المتقدمة مثل NVIDIA Multi-Instance GPU (MIG) أو AMD Memory Pool Remapping (MPR) لتحويل الرسومات ومشاركتها بين حمولات العمل. 3. موازاة النموذج وتنسيقه بعض نماذج اللغة الكبيرة، ولا سيما تلك التي تحتوي على مليارات أو تريليونات المعلمات، قد لا تتناسب تمامًا في ذاكرة رسومات واحدة أو حتى عقدة واحدة. في مثل هذه الحالات، يمكنك استخدام تقنيات موازاة النموذج وتنسيقه لتوزيع النموذج عبر رسومات متعددة أو عقد. تتضمن موازاة النموذج تقسيم هيكل النموذج إلى مكونات مختلفة (مثل المُкод، والفكودر). بينما يتضمن تنسيق النموذج تقسيم معلمات النموذج وتوزيعه عبر أجهزة أو عقد متعددة. يوفر كوبيرنيتس آليات مثل مجموعات الحالة وموارد التعريف المخصصة (CRDs) لإدارة وتوجيه نشرات نماذج اللغة الكبيرة الموزعة مع موازاة النموذج وتنسيقه. 4. التعدين الدقيق والتعلم المستمر في nhiều الحالات، قد تحتاج نماذج اللغة الكبيرة المُدربة مسبقًا إلى تعدين دقيق أو تدريب مستمر على بيانات محددة لتحسين أدائها لمهام أو مجالات معينة. يمكن أن يسهل كوبيرنيتس هذه العملية من خلال توفير منصة قابلة للتوسيع ومتينة لتشغيل حمولات التعدين أو التعلم. يمكنك الاستفادة من إطارات معالجة الدفعة في كوبيرنيتس مثل أباتشي سبارك أو كوبفلوا لتشغيل مهام تعدين أو تدريب موزعة على نماذج اللغة الكبيرة. بالإضافة إلى ذلك، يمكنك دمج نماذجك المعدلة أو المُدرَّبة بشكل مستمر مع نشرات الاستدلال باستخدام آليات كوبيرنيتس مثل التحديثات المتداولة أو نشرات الأزرق والأخضر. 5. المراقبة والرصد تعتبر المراقبة والرصد من الجوانب الحاسمة لأي نشر إنتاجي، بما في ذلك نشر نماذج اللغة الكبيرة على كوبيرنيتس. يوفر كوبيرنيتس حلول مراقبة مدمجة مثل بروميثيوس وتكاملات مع منصات رصد شعبية مثل غرافانا، إلاستيكسيرتش، وجايجر. يمكنك مراقبة معايير متعددة تتعلق بنشر نماذج اللغة الكبيرة، مثل استخدام وحدة المعالجة المركزية والذاكرة، واستخدام الرسومات، وتأخر الاستدلال، والنتاج. بالإضافة إلى ذلك، يمكنك جمع وتحليل سجلات التطبيق وتتبعها للحصول على رؤى حول سلوك وأداء نماذج اللغة الكبيرة. 6. الأمان والامتثال اعتمادًا على حالة استخدامك و敏感ية البيانات المُستخدمة، قد تحتاج إلى مراعاة جوانب الأمان والامتثال عند نشر نماذج اللغة الكبيرة على كوبيرنيتس. يوفر كوبيرنيتس ميزات وتكاملات لتعزيز الأمان، مثل سياسات الشبكة، ومراقبة الوصول القائم على الأدوار (RBAC)، وإدارة الأسرار، والتكامل مع حلول أمان خارجية مثل هاشي كورب فاولت أو مدير الأسرار من أمازون. إضافة إلى ذلك، إذا كنت تنشر نماذج اللغة الكبيرة في صناعات خاضعة للرقابة أو تتعامل مع بيانات حساسة، قد تحتاج إلى ضمان الامتثال للمعايير واللوائح ذات الصلة، مثل GDPR، وHIPAA، أو PCI-DSS. 7. النشر المتعدد السحابي والهجين في حين أن هذا المنشور يركز على نشر نماذج اللغة الكبيرة على كلستر كوبيرنيتس واحد، قد تحتاج إلى مراعاة نشرات متعددة السحابي أو الهجين في بعض السيناريوهات. يوفر كوبيرنيتس منصة متسقة لنشر وإدارة التطبيقات عبر مختلف مزودي السحابة وعلى الموقع. يمكنك الاستفادة من أدوات اتحاد كوبيرنيتس أو إدارة الكلستر المتعددة مثل كوبيفيد أو جيك هاب لإدارة وتوجيه نشرات نماذج اللغة الكبيرة عبر عدة كلسترات كوبيرنيتس تمتد عبر مختلف مزودي السحابة أو بيئات الهجين. تُبرز هذه المواضيع المتقدمة مرونة وقابلية توسيع كوبيرنيتس لنشر وإدارة نماذج اللغة الكبيرة. الختام ينشر نماذج اللغة الكبيرة (LLMs) على كوبيرنيتس العديد من الفوائد، بما في ذلك التوسيع، وإدارة الموارد، والتوافر العالي، والتنقل. من خلال اتباع الخطوات المحددة في هذا المنشور الفني، يمكنك تحويل تطبيق نماذج اللغة الكبيرة إلى حاويات، وتعريف الموارد اللازمة لكوبيرنيتس، ونشرها إلى كلستر كوبيرنيتس. 然而، ينشر نماذج اللغة الكبيرة على كوبيرنيتس هو فقط الخطوة الأولى.随ما يتطور تطبيقك ويتغير متطلباتك، قد تحتاج إلى استكشاف مواضيع متقدمة مثل التوسيع التلقائي، وتنظيم الرسومات، وموازاة النموذج، والتعدين الدقيق، والرصد، والأمان، والنشر المتعدد السحابي. يوفر كوبيرنيتس منصة قوية ومتوسعة لنشر وإدارة نماذج اللغة الكبيرة، مما يُمكِّنك من بناء تطبيقات موثوقة، قابلة للتوسيع، وأمنة.

Published June 20, 2024

Updated April 4, 2026

Aayush Mittal Mittal

Kubernetes and gpu Large Language Models: A Complete Guide

تعتبر نماذج اللغة الكبيرة (LLMs) قادرة على فهم وتوليد نصوص تشبه تلك المكتوبة باللغة البشرية، مما يجعلها لا تقدر بثمن لمجموعة واسعة من التطبيقات، مثل محادثات البوتات، وتوليد المحتوى، وترجمة اللغة.

然而، يمكن أن يكون نشر نماذج اللغة الكبيرة مهمة صعبة بسبب حجمها الهائل ومتطلباتها الحاسوبية. يوفر كوبيرنيتس، نظام أوركسترا الحاويات مفتوح المصدر، حلًا قويًا لنشر وإدارة نماذج اللغة الكبيرة بمقياس كبير. في هذا المنشور الفني، سنستكشف عملية نشر نماذج اللغة الكبيرة على كوبيرنيتس، مع تغطية جوانب مختلفة مثل حاويات، وتخصيص الموارد، والتنقل.

فهم نماذج اللغة الكبيرة

قبل الغوص في عملية النشر، دعنا نفهم بشكل简ف ما هي نماذج اللغة الكبيرة وأسباب الاهتمام الكبير بها.

نماذج اللغة الكبيرة (LLMs) هي نوع من نماذج الشبكات العصبية التي يتم تدريبها على كميات هائلة من بيانات النص. تعلم هذه النماذج فهم وتوليد لغة تشبه لغة البشر من خلال تحليل الأنماط والعلاقات داخل بيانات التدريب. تشمل الأمثلة الشهيرة على نماذج اللغة الكبيرة GPT (الترانسفورمر المُدرب مسبقًا لل توليد)، BERT (تمثيلات الترانسفورمر ثنائية الاتجاه)، وXLNet.

لقد حققت نماذج اللغة الكبيرة أداءً ممتازًا في مهام معالجة اللغة الطبيعية المختلفة، مثل توليد النص، وترجمة اللغة، وإجابة الأسئلة. ومع ذلك، فإن حجمها الهائل ومتطلباتها الحاسوبية تطرح تحديات كبيرة للنشر والاستدلال.

لماذا كوبيرنيتس لنشر نماذج اللغة الكبيرة؟

كوبيرنيتس هو منصة أوركسترا الحاويات مفتوحة المصدر التي تutomates نشر وتوسيع وإدارة التطبيقات المحتوية. يوفر العديد من الفوائد لنشر نماذج اللغة الكبيرة، بما في ذلك:

التنقل: يسمح لك كوبيرنيتس بتوسيع نشر نماذج اللغة الكبيرة بشكل أفقي عن طريق إضافة أو إزالة موارد الحوسبة حسب الحاجة، مما يضمن استخدام الموارد الأمثل والأداء.
إدارة الموارد: يتيح لك كوبيرنيتس تخصيص الموارد وتفريغها بفعالية، مما يضمن أن نشر نماذج اللغة الكبيرة لديك يمكنه الوصول إلى الموارد الحاسوبية والمعرفية والرسومات التي تريدها.
التوافر العالي: يوفر كوبيرنيتس آليات مدمجة للتعافي التلقائي والتركيبات التلقائية والتراجعات، مما يضمن أن نشر نماذج اللغة الكبيرة لديك يبقى متاحًا ومتينًا في وجه الفشل.
النقل: يمكن نقل نشر نماذج اللغة الكبيرة المحتوية بسهولة بين مختلف البيئات، مثل مراكز البيانات أو منصات السحابة، دون الحاجة إلى إعادة التهيئة الشاملة.
دعم النظام وال社区: يمتلك كوبيرنيتس مجتمعًا كبيرًا ونشطًا، مما يوفر ثروة من الأدوات والمكتبات والموارد لنشر وإدارة التطبيقات المعقدة مثل نماذج اللغة الكبيرة.

الاستعداد لنشر نماذج اللغة الكبيرة على كوبيرنيتس:

قبل نشر نماذج اللغة الكبيرة على كوبيرنيتس، هناك بعض الشروط المسبقة التي يجب مراعاتها:

كلستر كوبيرنيتس: ستحتاج إلى كلستر كوبيرنيتس معدة وتنفيذية، إما على الموقع أو على منصة سحابة مثل خدمة كوبيرنيتس المرنة من أمازون (EKS)، محرك كوبيرنيتس من جوجل (GKE)، أو خدمة كوبيرنيتس من أزور (AKS).
دعم الرسومات: تعتبر نماذج اللغة الكبيرة حاسوبية بشكل كبير وتحتاج غالبًا إلى تسريع الرسومات للاستدلال الفعال. تأكد من أن كلستر كوبيرنيتس لديك يمكنه الوصول إلى موارد الرسومات، إما من خلال وحدات الرسومات المادية أو مثيلات الرسومات السحابية.
سجل الحاويات: ستحتاج إلى سجل حاويات لتخزين صور حاويات نماذج اللغة الكبيرة. تشمل الخيارات الشهيرة دッカー هب، سجل حاويات مرن من أمازون (ECR)، سجل حاويات جوجل (GCR)، أو سجل حاويات أزور (ACR).
ملفات نموذج نماذج اللغة الكبيرة: احصل على ملفات نموذج نماذج اللغة الكبيرة المُدربة مسبقًا (الأوزان، التكوين، والtokenizer) من المصدر المعني أو تدرب نموذجك الخاص.
تحويل الحاويات: حوِّل تطبيق نماذج اللغة الكبيرة باستخدام دッカー أو وقت تشغيل حاوية مشابه. يتضمن ذلك إنشاء ملف دッカー يحتوي على رمز نماذج اللغة الكبيرة، والاعتماديات، وملفات النموذج في صورة حاوية دッカー.

نشر نماذج اللغة الكبيرة على كوبيرنيتس

بمجرد أن تكون الشروط المسبقة في مكانها، يمكنك المضي في نشر نماذج اللغة الكبيرة على كوبيرنيتس. يتضمن عملية النشر عادةً الخطوات التالية:

بناء صورة دッカー

ابنِ صورة دッカー لتطبيق نماذج اللغة الكبيرة باستخدام ملف دッカー المُقدم ودفعه إلى سجل الحاويات.

إنشاء موارد كوبيرنيتس

حدد موارد كوبيرنيتس المطلوبة لنشر نماذج اللغة الكبيرة، مثل النشرات، والخدمات، وخرائط التكوين، والأسرار. يتم تعريف هذه الموارد عادةً باستخدام مаниفستات YAML أو JSON.

تكوين متطلبات الموارد

حدد متطلبات الموارد لنشر نماذج اللغة الكبيرة، بما في ذلك الموارد الحاسوبية، والذاكرة، وموارد الرسومات. هذا يضمن أن نشرك يمكنه الوصول إلى الموارد الحاسوبية اللازمة للاستدلال الفعال.

نشر إلى كوبيرنيتس

استخدم أداة سطر الأوامر kubectl أو أداة إدارة كوبيرنيتس (مثل لوحة كوبيرنيتس، رنشر، أو لنز) لتطبيق مаниفستات كوبيرنيتس ونشر تطبيق نماذج اللغة الكبيرة.

مراقبة وتوسيع النطاق

راقب أداء واستهلاك مورد نشر نماذج اللغة الكبيرة باستخدام أدوات مراقبة كوبيرنيتس مثل بروميثيوس وغرافانا. عدل تخصيص الموارد أو توسيع نشرك حسب الحاجة لتلبية الطلب.

مثال على النشر

لنفترض أننا سننشر نموذج لغة GPT-3 على كوبيرنيتس باستخدام صورة دッカー مُسبقة من Hugging Face. سنفترض أن لديك كلستر كوبيرنيتس معدة ومُثبّتة مع دعم الرسومات.

جلب صورة دッカー:


docker pull huggingface/text-generation-inference:1.1.0

إنشاء نشر كوبيرنيتس:

انشئ ملفًا باسم gpt3-deployment.yaml مع المحتوى التالي:

– name: gpt3

Aayush Mittal

لقد قمت بإنفاق الخمس سنوات الماضية في غمرة العالم المثير للاهتمام من تعلم الآلة والتعلم العميق. وقد أدت شغفي وخبرتي إلى المساهمة في أكثر من 50 مشروعًا للهندسة البرمجية متنوعًا، مع التركيز بشكل خاص على الذكاء الاصطناعي / تعلم الآلة. كما أدت فضولي المستمر إلى جذبي نحو معالجة اللغة الطبيعية، وهو مجال أنا حريص على استكشافه بشكل أكبر.