Connect with us

نقل النماذج اللغوية الكبيرة (LLM) إلى تطبيقات الأعمال في العالم الحقيقي

قادة الفكر

نقل النماذج اللغوية الكبيرة (LLM) إلى تطبيقات الأعمال في العالم الحقيقي

mm

النماذج اللغوية الكبيرة موجودة في كل مكان. كل محادثة مع العملاء أو عرض تقديمي لشركة رأس المال الاستثماري يتضمن أسئلة حول جاهزية تقنية LLM وكيف ستدفع التطبيقات المستقبلية. غطيت بعض الأنماط على هذا في مشاركتي السابقة. هنا سأتحدث عن بعض الأنماط في العالم الحقيقي لتطبيق في صناعة الأدوية التي عملت عليها Persistent Systems.

النماذج اللغوية الكبيرة والقوة الأساسية

النماذج اللغوية الكبيرة جيدة في فهم اللغة، هذا هو قوتها. أكثر الأنماط شيوعًا التي نراها مع التطبيقات هو توليد محسّن بالاسترجاع (RAG)، حيث يتم تجميع المعرفة من مصادر البيانات وتقديمها في السياق كتلميح للنموذج اللغوي الكبير لتحريف الاستجابة. في هذه الحالة، آليات البحث السريعة مثل قواعد البيانات المتجهة وآلات Elasticsearch تعمل كخط أول للبحث. ثم يتم تجميع نتائج البحث في تلميح وإرساله إلى النموذج اللغوي الكبير معظمًا كدعوة API.

نمط آخر هو توليد استفسار على بيانات منظمات عن طريق تغذية النموذج اللغوي الكبير بنموذج البيانات كتلميح واستفسار مستخدم معين. يمكن استخدام هذا النمط لتطوير واجهة متقدمة “تحدث مع بياناتك” لقواعد البيانات مثل Snowflake، وكذلك قواعد البيانات الرسومية مثل Neo4j.

استخدام أنماط LLM للحصول على رؤى في العالم الحقيقي

قامت Persistent Systems مؤخرًا بفحص نمط لشركة Blast Motion، وهي شركة تيليمетري رياضية (تحليل السباق للبيسبول والجولف وغيرها)، حيث قمنا بتحليل بيانات السلاسل الزمنية لملخصات اللاعبين للحصول على توصيات.

لمناهج أكثر تعقيدًا، غالبًا ما نحتاج إلى ربط طلبات LLM مع المعالجة بين المكالمات. لشركة أدوية، قمنا بتطوير تطبيق ذكي للمسارات التي ترشح المرضى للمسارات السريرية بناءً على المعايير المستخرجة من وثائق التجارب السريرية. هنا استخدمنا نهجًا متسلسلاً لنموذج LLM. أولاً، قمنا بتطوير نموذج LLM لقراءة وثيقة تجربة PDF واستخدام نمط RAG لاستخراج معايير الإدراج والاستبعاد.

لهذا، تم استخدام نموذج LLM أقل تعقيدًا مثل GPT-3.5-Turbo (ChatGPT). ثم قمنا بدمج الكيانات المستخرجة مع نموذج بيانات قاعدة بيانات المرضى SQL في Snowflake، لإنشاء تلميح. هذا التلميح يتم تغذيته إلى نموذج LLM أكثر قوة مثل GPT4، مما يمنحنا استفسار SQL لترشيح المرضى، جاهز للتشغيل على Snowflake. منذ أن نستخدم سلسلة LLM، يمكننا استخدام نموذج LLM متعددة لكل خطوة في السلسلة، وبالتالي تمكنا من إدارة التكلفة.

حاليًا، قررنا الحفاظ على هذه السلسلة حتمية من أجل التحكم الأفضل. أي أننا قررنا وضع المزيد من الذكاء في السلاسل والحفاظ على التوجيه بسيطًا وقابلًا للتنبؤ. كل عنصر في السلسلة هو تطبيق معقد بذاته سيتطلب بضعة أشهر لتطويره في أيام ما قبل LLM.

تشغيل حالات استخدام أكثر تقدمًا

لم حالة أكثر تقدمًا، يمكننا استخدام وكلاء مثل ReAct لتحفيز نموذج LLM على إنشاء تعليمات خطوة بخطوة لمتابعة استفسار مستخدم معين. هذا بالطبع سيتطلب نموذج LLM عالي النهاية مثل GPT4 أو Cohere أو Claude 2. ومع ذلك، ثم هناك خطر أن يتخذ النموذج خطوة غير صحيحة سيتعين التحقق منها باستخدام حواجز أمان. هذا هو التبادل بين نقل الذكاء في روابط السلسلة القابلة للتحكم أو جعل السلسلة بأكملها ذاتية الحكم.

اليوم، مع اعتيادنا على عصر الذكاء الاصطناعي التوليدي للغة، بدأت الصناعة في تبني تطبيقات LLM مع سلاسل قابلة للتنبؤ. مع نمو هذا التحول، سنبدأ قريباً في تجربة المزيد من الاستقلالية لهذه السلاسل من خلال الوكلاء. هذا ما يدور حوله النقاش حول AGI، ونحن مهتمون بمعرفة كيف سيطور كل هذا مع مرور الوقت.

داتاراج راو، رئيس عالم البيانات في Persistent Systems، هو مؤلف كتاب “Keras to Kubernetes: The Journey of a Machine Learning Model to Production.” في Persistent Systems، يقود داتاراج مختبر الأبحاث الإصطناعية الذي يبحث في الخوارزميات الحديثة في رؤية الكمبيوتر، وفهم اللغة الطبيعية، وبرمجة الاحتمالية، وتعلم التعزيز، وشرح الذكاء الاصطناعي، وغيرها، ويتضح تطبيقها في مجالات الرعاية الصحية والخدمات المصرفية والصناعية. لدى داتاراج 11 براءة اختراع في تعلم الآلة ورؤية الكمبيوتر.