الذكاء الاصطناعي
وهم التفكير الاصطناعي: دراسة شركة آبل والمناقشة حول قدرات التفكير الاصطناعي

أصبح الذكاء الاصطناعي (AI) جزءًا من الحياة اليومية. إنه يقوم بتشغيل مساعدي الصوت وتشغيل محادثات الروبوت ومساعدة اتخاذ القرارات الحاسمة في الصناعات مثل الرعاية الصحية والخدمات المصرفية والأعمال. والنظم المتقدمة مثل GPT-4 من OpenAI وGemini من جوجل غالبًا ما يُعتبر أنها قادرة على تقديم استجابات ذكية تشبه الإنسان. ويعتقد العديد من الناس أن هذه النماذج قادرة على التفكير والreason مثل البشر.
然而، دراسة شركة آبل لعام 2025 ت挑ى هذا الاعتقاد. وتساءل بحثهم عما إذا كانت نماذج التفكير الكبيرة (LRMs) قادرة حقًا على التفكير. وتخلصت الدراسة إلى أن هذه النماذج الذكية قد لا تستخدم التفكير الحقيقي ولكنها تعتمد على مطابقة الأنماط. تعرف النماذج على الأنماط وتكررها من بيانات التدريب بدلاً من إنشاء منطق جديد أو فهم.
أجرت شركة آبل اختبارات على عدة نماذج ذكية رائدة باستخدام ألعاب منطقية كلاسيكية. وكانت النتائج غير متوقعة. في المهام البسيطة، أحيانًا أدت النماذج القياسية بشكل أفضل من نماذج التفكير المتقدمة. في الألغاز المتوسطة الصعوبة، أظهرت نماذج LRM بعض المزايا. ولكن عندما أصبحت الألغاز أكثر تعقيدًا، فشلت كلا النوعين من النماذج. حتى عندما تم تقديم الحل الصحيح خطوة بخطوة، لم تتمكن النماذج من اتباعه بشكل موثوق.
أطلقت نتائج شركة آبل مناقشة داخل مجتمع الذكاء الاصطناعي. وافق بعض الخبراء على شركة آبل، قائلين إن هذه النماذج توفر فقط وهم التفكير. ويجادل آخرون بأن الاختبارات قد لا تكتشف تمامًا قدرات الذكاء الاصطناعي وأن هناك حاجة إلى أساليب أكثر فعالية. السؤال الرئيسي الآن هو: هل يمكن للذكاء الاصطناعي التفكير حقًا، أو هو مجرد مطابقة أنماط متقدمة؟
هذا السؤال مهم للجميع. مع تصاعد استخدام الذكاء الاصطناعي، من المهم فهم ما يمكن أن تفعله هذه الأنظمة وما لا يمكنها فعله.
ما هي نماذج التفكير الكبيرة (LRMs)?
نماذج LRM هي أنظمة ذكية مصممة لحل المشكلات عن طريق إظهار التفكير خطوة بخطوة. على عكس نماذج اللغة القياسية، التي تولد الإجابات بناءً على توقع الكلمة التالية، تهدف نماذج LRM إلى تقديم تفسيرات منطقية. هذا يجعلها مفيدة للمهام التي تحتاج إلى عدة خطوات من التفكير والتفكير المجرد.
نماذج LRM مدربة على مجموعات بيانات كبيرة تتضمن كتبًا ومقالات ومواقع إلكترونية ومحتوى نصي آخر. يتيح هذا التدريب للنماذج فهم أنماط اللغة والهياكل المنطقية الشائعة في التفكير البشري. من خلال إظهار كيفية الوصول إلى استنتاجاتها، من المتوقع أن تقدم نماذج LRM نتائج أوضح وأكثر موثوقية.
تعد هذه النماذج واعدة لأنها يمكنها التعامل مع مهام معقدة عبر مجالات متعددة. الهدف هو تعزيز الشفافية في اتخاذ القرارات، خاصة في المجالات الحاسمة التي تعتمد على استنتاجات دقيقة ومنطقية.
然而، هناك قلق بشأن ما إذا كانت نماذج LRM تفكر حقًا. يعتقد بعضهم أن هذه النماذج بدلاً من التفكير بطريقة تشبه الإنسان، قد تستخدم مطابقة الأنماط. هذا يثير تساؤلات حول الحدود الفعلية لأنظمة الذكاء الاصطناعي وما إذا كانت تقلد التفكير فقط.
دراسة شركة آبل: اختبار التفكير الاصطناعي ووهم التفكير
لإجابة على السؤال عما إذا كانت نماذج LRM تفكر أو مجرد مطابقة أنماط متقدمة، صممت فريق البحث في شركة آبل مجموعة من التجارب باستخدام ألغاز منطقية كلاسيكية. وشملت هذه الألغاز برج هانوي وعبر النهر وعالم الكتلة، والتي استخدمت منذ فترة طويلة لاختبار التفكير المنطقي البشري. اختار الفريق هذه الألغاز لأن تعقيدها يمكن تعديله. هذا مكنهم من تقييم نماذج اللغة القياسية ونماذج LRM في مستويات مختلفة من الصعوبة.
تختلف подход شركة آبل لاختبار الreasoning الاصطناعي عن البenchmarks التقليدية، التي تركز غالبًا على المهام الرياضية أو البرمجة. يمكن أن تتأثر هذه الاختبارات بتعرض النماذج لبيانات مماثلة خلال التدريب. بدلاً من ذلك، استخدم فريق شركة آبل ألغازًا سمحت لهم بالسيطرة على التعقيد مع الحفاظ على هياكل منطقية متسقة. سمح هذا التصميم لهم بمراقبة ليس فقط الإجابات النهائية ولكن أيضًا خطوات التفكير التي اتخذتها النماذج.
كشفت الدراسة عن ثلاثة مستويات أداء متميزة:
المهام البسيطة
في المشكلات الأساسية، أدت نماذج اللغة القياسية أحيانًا بشكل أفضل من نماذج التفكير المتقدمة. كانت هذه المهام بسيطة بما يكفي لتمكين النماذج الأبسط من توليد إجابات صحيحة بشكل أكثر كفاءة.
المهام المتوسطة الصعوبة
随ما زادت تعقيد الألغاز، أظهرت نماذج LRM، التي صممت لتوفير تفكير منظم مع تفسيرات خطوة بخطوة، بعض المزايا. كانت هذه النماذج قادرة على اتباع عملية التفكير وتقديم حلول أكثر دقة من النماذج القياسية.
المهام المعقدة للغاية
عندما واجهت الألغاز الأكثر تعقيدًا، فشلت كلا النوعين من النماذج تمامًا. على الرغم من أن النماذج لديها موارد حاسوبية كافية، لم تتمكن من حل المهام. انخفضت دقتها إلى الصفر، مما يشير إلى أنهم لم يتمكنوا من التعامل مع مستوى التعقيد المطلوب لهذه المشكلات.
مطابقة الأنماط أو التفكير الحقيقي؟
عند التحليل الأعمق، وجد الباحثون المزيد من القلق بشأن تفكير النماذج. اعتمدت الإجابات التي قدمتها النماذج بشكل كبير على كيفية تقديم المشكلات. يمكن أن تؤدي التغييرات الصغيرة، مثل تغيير الأرقام أو أسماء المتغيرات، إلى إجابات مختلفة تمامًا. يشير هذا التناقض إلى أن النماذج تعتمد على الأنماط المكتسبة من بيانات التدريب بدلاً من تطبيق التفكير المنطقي.
أظهرت الدراسة أن حتى عندما تم تقديم الخوارزميات أو الإرشادات خطوة بخطوة، فشلت النماذج في استخدامها بشكل صحيح عند زيادة تعقيد الألغاز. كشفت مسارات التفكير الخاصة بهم أن النماذج لم تتبع القواعد أو المنطق بشكل متسق. بدلاً من ذلك، تباينت حلولهم بناءً على التغييرات السطحية في الإدخال بدلاً من هيكل المشكلة الفعلي.
وخلصت فريق شركة آبل إلى أن ما يبدو كتفكير هو في الواقع مطابقة أنماط متقدمة. على الرغم من أن هذه النماذج يمكنها تقليд التفكير من خلال التعرف على الأنماط المألوفة، إلا أنها لا تفهم حقًا المهام ولا تطبق المنطق بطريقة تشبه الإنسان.
المناقشة الجارية: هل يمكن للذكاء الاصطناعي التفكير حقًا أو مجرد تقليد التفكير؟
أدت دراسة شركة آبل إلى مناقشة في مجتمع الذكاء الاصطناعي حول ما إذا كانت نماذج LRM قادرة حقًا على التفكير. يدعم العديد من الخبراء الآن نتائج شركة آبل، بحجة أن هذه النماذج تخلق وهم التفكير. لقد رأوا أن عند مواجهة مهام معقدة أو جديدة، كلا النماذج القياسية ونماذج LRM يعانون، حتى عند تقديم الإرشادات أو الخوارزميات الصحيحة. يشير هذا إلى أن التفكير غالبًا ما يكون مجرد القدرة على التعرف على الأنماط وتكرارها من بيانات التدريب بدلاً من الفهم الحقيقي.
من ناحية أخرى، تشير شركات مثل OpenAI وبعض الباحثين إلى أن نماذجهم يمكنها التفكير. يشيرون إلى الأداء العالي في الاختبارات المعيارية، مثل LSAT وامتحانات الرياضيات الصعبة. على سبيل المثال، سجل GPT-4 من OpenAI في Percentile 88 بين متقدمي LSAT. يفسر بعضهم هذا الأداء القوي على أنه دليل على القدرة على التفكير. يؤكد مؤيدو هذا الرأي أن مثل هذه النتائج تظهر أن نماذج الذكاء الاصطناعي يمكنها التفكير، على الأقل في بعض الحالات.
然而، تساءلت دراسة شركة آبل عن هذا الرأي. يجادل الباحثون بأن الدرجات العالية في الاختبارات المعيارية لا تشير بالضرورة إلى فهم دقيق أو تفكير. قد لا تكتشف البenchmarks الحالية تمامًا مهارات التفكير ويمكن أن تتأثر ببيانات التدريب. في العديد من الحالات، قد تكرر النماذج فقط الأنماط من بيانات التدريب بدلاً من التفكير حقًا من خلال مشكلات جديدة.
تتمتع هذه المناقشة بالعواقب العملية. إذا لم تكن نماذج الذكاء الاصطناعي تفكر حقًا، قد لا تكون موثوقة في المهام التي تتطلب اتخاذ القرارات المنطقية. هذا مهم بشكل خاص في مجالات مثل الرعاية الصحية والتمويل والقانون، حيث يمكن أن يكون الأخطاء لها عواقب وخيمة. على سبيل المثال، إذا لم تتمكن نموذج الذكاء الاصطناعي من تطبيق المنطق على حالات طبية جديدة أو معقدة، فإن الأخطاء أكثر احتمالًا. بشكل مماثل، قد تؤدي أنظمة الذكاء الاصطناعي في التمويل التي تفتقر إلى القدرة على التفكير إلى اتخاذ قرارات استثمارية سيئة أو سوء تقدير المخاطر.
كما تحذر نتائج شركة آبل من أن نماذج الذكاء الاصطناعي، على الرغم من فائدتها في المهام مثل توليد المحتوى وتحليل البيانات، يجب استخدامها بحذر في المجالات التي تتطلب فهمًا عميقًا أو تفكيرًا نقديًا. يرى بعض الخبراء أن عدم التفكير المناسب هو تحديدًا كبيرًا، في حين يعتقد الآخرون أن مطابقة الأنماط وحدها يمكن أن تكون قيمة ل许多 تطبيقات عملية.
ماذا بعد للتفكير الاصطناعي؟
مازال مستقبل التفكير الاصطناعي غير مؤكد. يعتقد بعض الباحثين أن مع مزيدًا من التدريب وبيانات أفضل وموارد أفضل، سيتطور الذكاء الاصطناعي لتحقيق قدرات تفكير حقيقية. يعتقد آخرون أنهم أكثر شكوكية ويعتقدون أن نماذج الذكاء الاصطناعي الحالية قد تكون دائمًا مقيدة بمطابقة الأنماط، أبدًا لا تشارك في التفكير البشري.
يطور الباحثون حاليًا أساليب تقييم جديدة لتقييم قدرة نماذج الذكاء الاصطناعي على التعامل مع مشكلات لم تواجهها من قبل. تهدف هذه الاختبارات إلى تقييم ما إذا كان الذكاء الاصطناعي يمكنه التفكير بشكل نقدي وشرح تفكيره بطريقة تفهمها البشر. إذا نجحت، يمكن أن توفر هذه الاختبارات فهمًا أكثر دقة لمدى قدرة الذكاء الاصطناعي على التفكير ومساعدة الباحثين على تطوير نماذج أفضل.
هناك أيضًا اهتمام متزايد بتطوير نماذج هجينة تجمع بين قوة مطابقة الأنماط والتفكير. ستستخدم هذه النماذج الشبكات العصبية لمطابقة الأنماط وأنظمة التفكير الرمزي للمهام الأكثر تعقيدًا. وتقارير تفيد بأن شركة آبل وNVIDIA يبحثان في هذه المناهج الهجينة، مما قد يؤدي إلى أنظمة ذكية قادرة على التفكير الحقيقي.
النقطة الأساسية
أثارت دراسة شركة آبل لعام 2025 أسئلة هامة حول الطبيعة الحقيقية لقدرات التفكير الاصطناعي. على الرغم من أن نماذج الذكاء الاصطناعي مثل LRM تظهر وعدًا كبيرًا في مختلف المجالات، تحذر الدراسة من أن هذه النماذج قد لا تمتلك فهمًا حقيقيًا أو تفكيرًا يشبه الإنسان. بدلاً من ذلك، تعتمد على مطابقة الأنماط، مما يحد من فعاليتها في المهام التي تتطلب عمليات إدراكية أكثر تعقيدًا.
يستمر الذكاء الاصطناعي في تشكيل المستقبل، مما يجعله ضروريًا الاعتراف بتقنياته القوية ومحدودياته. من خلال تحسين أساليب الاختبار وإدارة توقعاتنا، يمكننا استخدام الذكاء الاصطناعي بشكل مسؤول. هذا سيضمن أن الذكاء الاصطناعي يكمّل اتخاذ القرارات البشرية بدلاً من استبدالها.












