الذكاء الاصطناعي

يكشف البحث أن النماذج اللغوية الكبيرة تعتمد على التفكير البسيط عند زيادة التعقيد

Published November 25, 2025

Updated April 1, 2026

Alex McFarland

نشر فريق من الباحثين دراسة شاملة في 20 نوفمبر تحليل أكثر من 192000 مسار تفكير من النماذج اللغوية الكبيرة (LLMs) ، وكشف أن أنظمة الذكاء الاصطناعي تعتمد على استراتيجيات خطية سطحية بدلاً من العمليات الإدراكية الهيكلية التي يستخدمها البشر بشكل طبيعي.

فريق البحث قام بفحص 18 نموذجًا مختلفًا عبر مهام التفكير اللغوي والبصري والصوتي ، ومقارنة نهجهم بنهج 54 مسار تفكير بشري تم جمعها خصيصًا للدراسة. أسس التحليل تصنيفًا من 28 عنصر إدراكي يشمل القيود الحسابية والضوابط المتعاقبة وتمثيلات المعرفة وعمليات التحويل – مما يوفر إطارًا لتقييم ليس فقط ما إذا كانت النماذج تنتج إجابات صحيحة ، ولكن كيفية وصولها إلى تلك الاستنتاجات.

الاختلافات الأساسية في الهيكل الإدراكي

يظهر التفكير البشري باستمرار التغني الهيكلي والمراقبة المتعاقبة – القدرة على التفكير في تنظيم التفكير الخاص به. ينظم البشر المعلومات بسهولة في هياكل متداخلة بينما يقومون بتعقب تقدمهم عبر مشاكل معقدة.

تستخدم النماذج اللغوية الكبيرة في الغالب السلاسل الأمامية السطحية ، حيث تتحرك خطوة خطوة عبر المشاكل دون تنظيم هيكلي أو مراقبة خودي التي تميز الإدراك البشري. تصبح هذه الانحراف أكثر وضوحًا عند وجود مهام غير منظمات أو غامضة ، حيث يتفوق المرونة البشرية بشكل كبير على نهج الذكاء الاصطناعي.

وجدت الدراسة أن النماذج اللغوية تتمتع بالمركبات السلوكية المرتبطة بالتفكير الناجح ولكنها غالبًا ما تفشل في نشرها بشكل تلقائي. يتنوع الأداء بشكل كبير حسب نوع المشكلة: أظهرت معالجة المأزق أعلى تباين ، حيث كافحت النماذج الصغيرة بشكل كبير ، بينما أظهرت المعالجة المنطقية أداءً معتدلاً ، حيث تفوقت النماذج الأكبر بشكل عام على النماذج الصغيرة. تظهر النماذج نقاط ضعف غير متوقعة ، حيث تنجح في مهام معقدة وتفشل في نسخ أقل تعقيدًا.

تحسين الأداء من خلال التفكير الموجه

طور فريق البحث توجيهًا للتفكير في وقت الاختبار الذي يؤطر تلقائيًا الهياكل الإدراكية الناجحة ، مما يظهر تحسينات في الأداء تصل إلى 66.7٪ في المشاكل المعقدة عندما يتم حث النماذج على اتباع نهج تفكير أكثر تشابهًا بالبشر. يشير هذا الاكتشاف إلى أن النماذج اللغوية الكبيرة تتمتع بالقدرات الكامنة للتفكير الأكثر تعقيدًا ولكنها تحتاج إلى توجيه صريح لاستخدامها بشكل فعال.

يتسع الفجوة بين التفكير البشري والتفكير الاصطناعي随ًا لزيادة تعقيد المهمة. بينما يمكن للنماذج التعامل مع المشاكل البسيطة من خلال السلاسل الأمامية السطحية فقط ، فإنها تكافح مع استراتيجيات التكرار والمراقبة الذاتية التي ينشرها البشر بشكل طبيعي عند مواجهة تحديات غامضة أو متعددة الطبقات.

يوفر مجموعة البيانات المتاحة للجمهور قاعدة أساسية للبحوث المستقبلية التي ت比較 بين الذكاء الاصطناعي والبشري. من خلال رسم 28 عنصر إدراكي متميز ، يتيح الإطار للباحثين تحديد مكان تحديد دقيق لماذا ينهار التفكير الاصطناعي بدلاً من قياس مجرد درجات الدقة.

الآثار على تطوير الذكاء الاصطناعي

تسلط النتائج الضوء على 한 محدودية أساسية في أنظمة الذكاء الاصطناعي الحالية: الفجوة بين القدرة الحسابية والتنكير الحقيقي. يمكن للنماذج التي تم تدريبها على مجموعات بيانات ضخمة أن تتوافق مع الأنماط بطريقة إلى الإجابات الصحيحة في العديد من المهام ، لكنها تفتقر إلى التفكير التأملي والهيكلي الذي يتميز به حل المشاكل البشرية.

يبني هذا البحث على المخاوف المتزايدة حول محدوديات التفكير الاصطناعي التي تم تحديدها عبر مجالات متعددة. يشير تحسين الأداء من التفكير الموجه إلى أن استراتيجيات التوجيه الأفضل وتعديلات الهيكل يمكن أن تساعد النماذج على الوصول إلى قدرات التفكير الكامنة بشكل أكثر فعالية.

قد يكون أكبر مساهمة في الدراسة هو التصنيف التفصيلي للعناصر الإدراكية ، مما يوفر للباحثين والمطورين أهدافًا محددة للتحسين. بدلاً من معاملة التفكير على أنه قدرة أحادية ، يفرق الإطار بين مكونات قابلة للقياس يمكن معالجتها بشكل فردي من خلال تعديلات التدريب أو تقنيات هندسة التوجيه.