اتصل بنا للحصول على مزيد من المعلومات

هل يستطيع حاملو شهادات الماجستير في القانون حل المشكلات المعقدة بذكاء؟

قاده التفكير

هل يستطيع حاملو شهادات الماجستير في القانون حل المشكلات المعقدة بذكاء؟

mm

مقدمة وتطور الذكاء الاصطناعي التوليدي لقد كانت التغييرات المفاجئة والشديدة التي أحدثتها هذه التكنولوجيا في حياتنا صعبة للغاية لدرجة أنه من الصعب تقدير مدى تأثير هذه التكنولوجيا على حياتنا.

قبل ثلاث سنوات فقط، كان الذكاء الاصطناعي يزداد انتشارًا، نظريًا على الأقل. أصبح عدد أكبر من الناس يعرفون بعضًا مما يمكنه فعله، مع أن سوء فهم كبير حول قدراته ظل قائمًا. لسبب ما، لم تُمنح هذه التقنية التقدير الكافي، بل مُنحت تقديرًا مبالغًا فيه، لما يمكنها تحقيقه بالفعل. ومع ذلك، كان بإمكان الشخص العادي الإشارة إلى مجال أو مجالين على الأقل يعمل فيهما الذكاء الاصطناعي، حيث يؤدي مهامًا عالية التخصص. جيد الى حد مافي بيئات خاضعة لرقابة شديدة. أي شيء يتجاوز ذلك كان إما لا يزال في مختبر أبحاث، أو ببساطة لم يكن موجودًا.

قارن ذلك باليوم. مع انعدام أي مهارات سوى القدرة على كتابة جملة أو طرح سؤال، أصبح العالم في متناول أيدينا. يمكننا إنتاج صور وموسيقى وحتى أفلام فريدة ومذهلة حقًا، ولديها القدرة على إحداث ثورة في صناعات بأكملها. يمكننا تعزيز عملية البحث لدينا، بطرح سؤال بسيط، إذا صاغناه بشكل صحيح، يمكنه توليد صفحات من المحتوى المخصص بجودة عالية تكفي لاجتياز اختبار جامعي... أو حتى طالب متوسط ​​في الصف الثالث الابتدائي إذا حددنا وجهة النظر. مع أنها أصبحت شائعة في غضون عام أو عامين فقط، إلا أن هذه القدرات كانت تُعتبر مستحيلة تمامًا قبل بضع سنوات فقط. كان مجال الذكاء الاصطناعي التوليدي موجودًا ولكنه لم ينطلق بأي شكل من الأشكال.

اليوم، جرّب الكثيرون الذكاء الاصطناعي المُولّد، مثل ChatGPT وMidjourney، وغيرها من الأدوات. وقد أدرجها آخرون بالفعل في حياتهم اليومية. إنّ سرعة تطور هذه التقنيات مذهلة لدرجة تُثير القلق تقريبًا. وبالنظر إلى التطورات التي شهدناها خلال الأشهر الستة الماضية، فلا شك أننا سنُذهل مرارًا وتكرارًا خلال السنوات القليلة القادمة.

من الأدوات المحددة المستخدمة في الذكاء الاصطناعي التوليدي أداء أنظمة التوليد المعزز بالاسترجاع (RAG)، وقدرتها على التفكير في استفسارات معقدة للغاية. وقد أدى طرح FRAMES مجموعة البيانات، موضحة بالتفصيل في البند يوضح هذا التقرير، الذي يتناول كيفية عمل مجموعة بيانات التقييم، أحدث التطورات في هذا المجال، ومسارها المستقبلي. حتى منذ إطلاق FRAMES أواخر عام ٢٠٢٤، حطمت العديد من المنصات أرقامًا قياسية جديدة في قدرتها على حل الاستفسارات الصعبة والمعقدة.

دعونا نتعمق في تقييم FRAMES ومدى جودة أداء نماذج الذكاء الاصطناعي التوليدي المختلفة. يمكننا أن نرى كيف أن كلاً من منصات اللامركزية والمنصات مفتوحة المصدر لا تحافظ على مكانتها فحسب (ولا سيما الدردشة الواعية), فهي تسمح للمستخدمين بالحصول على لمحة واضحة عن التفكير المذهل الذي تستطيع بعض نماذج الذكاء الاصطناعي تحقيقه.

الإطارات كنافذة على دماغ GenAI

تُركز مجموعة بيانات FRAMES وعملية تقييمها على 824 سؤالاً "متعدد القفزات" مُصممة لتتطلب الاستدلال، والربط المنطقي، واستخدام مصادر متعددة لاسترجاع المعلومات الأساسية، والقدرة على تجميعها منطقياً للإجابة على السؤال. تتطلب الأسئلة ما بين مستندين و15 مستنداً للإجابة عليها بشكل صحيح، كما تتضمن بشكل مقصود قيوداً وحسابات واستنتاجات رياضية، بالإضافة إلى القدرة على معالجة المنطق القائم على الوقت. بعبارة أخرى، هذه الأسئلة صعبة للغاية وتمثل في الواقع مهام بحث واقعية للغاية قد يقوم بها الإنسان على الإنترنت. نتعامل مع هذه التحديات طوال الوقت، ويجب علينا البحث عن المعلومات الأساسية المتناثرة في بحر من مصادر الإنترنت، وتجميع المعلومات بناءً على مواقع مختلفة، وإنشاء معلومات جديدة عن طريق الحساب والاستنتاج، وفهم كيفية دمج هذه الحقائق في إجابة صحيحة للسؤال.

ما وجده الباحثون عندما تم إصدار مجموعة البيانات واختبارها لأول مرة هو أن الجزء العلوي نماذج جيناي كان بإمكانهم تحقيق دقة نسبية (حوالي 40%) عند استخدام أساليب الخطوة الواحدة، لكنهم استطاعوا تحقيق دقة 73% إذا جمعوا جميع المستندات اللازمة للإجابة على السؤال. صحيح أن نسبة 73% قد لا تبدو ثورة، لكن إذا فهمت بدقة ما يجب الإجابة عليه، يصبح الرقم أكثر إثارة للإعجاب.

على سبيل المثال، أحد الأسئلة المطروحة هو: "في أي عام وُلد قائد الفرقة الذي غنى الأغنية التي استُخدمت في أغنية كاني ويست "باور"؟" كيف يُمكن لأي شخص حل هذه المشكلة؟ قد يرى الشخص أنه بحاجة إلى جمع معلومات مُختلفة، مثل كلمات أغنية كاني ويست "باور"، ثم يُمكِنه مراجعة الكلمات وتحديد النقطة في الأغنية التي استُخدمت فيها أغنية أخرى. يُمكننا نحن البشر الاستماع إلى الأغنية (حتى لو لم نكن نعرفها) ونتمكن من تمييز متى استُخدمت أغنية أخرى.

لكن فكّر في الأمر: ما الذي يجب على الذكاء الاصطناعي تحقيقه لاكتشاف أغنية غير الأصلية أثناء "الاستماع" إليها؟ هنا يصبح السؤال الأساسي اختبارًا ممتازًا للذكاء الاصطناعي الحقيقي. إذا تمكنّا من العثور على الأغنية والاستماع إليها وتحديد كلماتها المُستخدَمة، فهذه هي الخطوة الأولى فقط. ما زلنا بحاجة إلى معرفة اسم الأغنية، والفرقة الموسيقية، ومن هو قائدها، ثم سنة ميلاده.

يُظهر برنامج FRAMES أن الإجابة على أسئلة واقعية تتطلب قدرًا هائلًا من التفكير. يتبادر إلى الذهن هنا أمران.

أولا القدرة على اللامركزية إن قدرة نماذج GenAI على المنافسة، بل وربما الهيمنة على النتائج، أمرٌ مذهل. يتزايد عدد الشركات التي تستخدم الأسلوب اللامركزي لتوسيع قدراتها على المعالجة مع ضمان ملكية مجتمع كبير للبرنامج، وليس صندوقًا أسود مركزيًا لا يشارك تطوراته. تقود شركات مثل Perplexity وSentient هذا التوجه، حيث تتمتع كل منها بنماذج مذهلة تفوق دقة أدائها القياسي عند إصدار FRAMES.

العنصر الثاني هو أن عددًا أقل من نماذج الذكاء الاصطناعي هذه ليس لامركزيًا فحسب، بل مفتوح المصدر أيضًا. على سبيل المثال، يُعد Sentient Chat كلا الأمرين، وتُظهر الاختبارات المبكرة مدى تعقيد منطقه، بفضل إمكانية الوصول إليه عبر مصدر مفتوح لا يُقدر بثمن. تتم الإجابة على سؤال FRAMES أعلاه باستخدام نفس عملية التفكير التي يستخدمها الإنسان تقريبًا، مع توفر تفاصيل المنطق للمراجعة. ولعل الأمر الأكثر إثارة للاهتمام هو أن منصتهم مُهيكلة كعدد من النماذج التي يمكنها ضبط منظور وأداء مُعينين بدقة، على الرغم من أن عملية الضبط الدقيق في بعض نماذج GenAI تؤدي إلى انخفاض الدقة. في حالة Sentient Chat، طُورت العديد من النماذج المختلفة. على سبيل المثال، نموذج حديث يُسمى "Dobby 8B" قادر على التفوق على معيار FRAMES، ولكنه أيضًا قادر على تطوير موقف متميز مؤيد للعملات المشفرة والحرية، مما يؤثر على منظور النموذج أثناء معالجته للمعلومات وتطوير إجابة.

في الأفق

مفتاح كل هذه الابتكارات المذهلة يكمن في السرعة الفائقة التي أوصلتنا إلى هنا. علينا أن ندرك أنه بقدر سرعة تطور هذه التكنولوجيا، فإنها ستتطور أسرع في المستقبل القريب. سنتمكن، وخاصةً مع نماذج GenAI اللامركزية ومفتوحة المصدر، من رؤية تلك العتبة الحاسمة التي يبدأ عندها ذكاء النظام بالتفوق على ذكاءنا أكثر فأكثر، وما يعنيه ذلك للمستقبل.

ديفيد بالابان هو باحث في أمن الكمبيوتر يتمتع بخبرة تزيد عن 17 عامًا في تحليل البرامج الضارة وتقييم برامج مكافحة الفيروسات. ديفيد يدير MacSecurity.net و الخصوصية-PC.com المشاريع التي تقدم آراء الخبراء حول مسائل أمن المعلومات المعاصرة ، بما في ذلك الهندسة الاجتماعية ، والبرمجيات الخبيثة ، واختبار الاختراق ، وذكاء التهديدات ، والخصوصية عبر الإنترنت ، والقرصنة. يتمتع David بخلفية قوية لاستكشاف الأخطاء وإصلاحها للبرامج الضارة ، مع التركيز مؤخرًا على الإجراءات المضادة لبرامج الفدية.