الذكاء الاصطناعي
POKELLMON: وسيط ذكاء بشري لمعارك بوكيمون باستخدام LLMs
أظهرت نماذج اللغة الكبيرة والذكاء الاصطناعي التوليدي نجاحًا غير مسبوق في مجموعة واسعة من مهام معالجة اللغة الطبيعية. بعد احتلال مجال معالجة اللغة الطبيعية، التحدي التالي للباحثين في مجال GenAI و LLMs هو استكشاف كيف يمكن للنماذج اللغوية الكبيرة أن تعمل بشكل مستقل في العالم الحقيقي مع فجوة توليد موسعة من النص إلى الإجراء، وبالتالي تمثل نمطًا هامًا في سعي الذكاء الاصطناعي العام. يُعتبر الألعاب عبر الإنترنت أساسًا مناسبًا لتطوير وكلاء نموذج لغة كبير يتفاعلون مع البيئة المرئية بطريقة تشبه الإنسان.
على سبيل المثال، في لعبة模拟 عبر الإنترنت شائعة مثل Minecraft، يمكن استخدام وكلاء اتخاذ القرارات لمساعدة اللاعبين في استكشاف العالم جنبًا إلى جنب مع تطوير المهارات لصنع الأدوات وحل المهام. مثال آخر لوكلاء LLM الذين يتفاعلون مع البيئة المرئية يمكن أن يكون في لعبة أخرى عبر الإنترنت، The Sims حيث أظهر الوكلاء نجاحًا ملحوظًا في التفاعلات الاجتماعية ويعرضون سلوكًا يشبه الإنسان. ومع ذلك، بالمقارنة مع الألعاب الحالية، قد تثبت ألعاب المعركة التكتيكية أنها خيار أفضل لتحديد قدرة نماذج اللغة الكبيرة على لعب الألعاب الافتراضية. السبب الرئيسي لماذا تعتبر الألعاب التكتيكية بمثابة معيار أفضل هو أن معدل الفوز يمكن قياسه مباشرة، ومتعاونو المعارضة بانتظام، بما في ذلك اللاعبين البشر ووكلاء الذكاء الاصطناعي، دائمًا متاحون.
بناءً على ذلك، يهدف POKELLMON إلى أن يكون أول وسيط جسدي في العالم يصل إلى أداء على مستوى الإنسان في الألعاب التكتيكية، مشابهًا لما شهده في معارك بوكيمون. في جوهره، يدمج إطار POKELLMON ثلاث استراتيجيات رئيسية.
- التعلم التعزيزي في السياق الذي يستهلك ملاحظات نصية متعلقة بالمعارك على الفور لتحسين السياسة بشكل متكرر.
- التوليد المعزز بالمعرفة الذي يسترجع المعرفة الخارجية لمواجهة الوهم، مما يسمح للوسيط بالتصرف بشكل صحيح ومتى كان ذلك ضروريًا.
- توليد الإجراءات المتسقة لتقليل حالة التبديل الهستيري عندما يواجه الوسيط لاعبًا قويًا ويريد تجنبه.
تهدف هذه المقالة إلى تغطية إطار POKELLMON بالعمق، ونستكشف الآلية والمنهجية وهيكل الإطار جنبًا إلى جنب مع مقارنته بالإطارات الحالية. سنناقش أيضًا كيف يظهر إطار POKELLMON استراتيجيات معارك شبيهة بالإنسان ويتخذ قرارات في الوقت المناسب، ويحقق معدل فوز محترمًا يصل إلى 50٪ تقريبًا. لذا دعونا نبدأ.
POKELLMON: وسيط ذكاء بشري مع LLM لمعارك بوكيمون
كان نمو قدرات نماذج اللغة الكبيرة وإطارات الذكاء الاصطناعي التوليدي في السنوات القليلة الماضية رائعًا، خاصة في مهام معالجة اللغة الطبيعية. مؤخرًا، عمل المطورون والباحثون في مجال الذكاء الاصطناعي على طرق جعل الذكاء الاصطناعي التوليدي و LLMs أكثر بروزًا في السيناريوهات الحقيقية بالعالم مع القدرة على التصرف بشكل مستقل في العالم المادي. لتطوير الأداء المستقل في المواقف المادية والعالم الحقيقي، يعتبر الباحثون والمطورون الألعاب خيارًا مناسبًا لتطوير وكلاء جسدية من LLMs الذين يمكنهم التفاعل مع البيئة الافتراضية بطريقة تشبه سلوك الإنسان.
… (rest of the translation remains the same, following the exact structure and format as the original)












