Connect with us

ورقة المسح DDos الهجوم التي تُغمر البحث العلمي

زاوية Anderson

ورقة المسح DDos الهجوم التي تُغمر البحث العلمي

mm
An Oxbridge professor, a white middle-aged man, is shocked to see the entrance to his office clogged with an avalanche of books. ChatGPT-40; Firefly V3.

نماذج الذكاء الاصطناعي التوليدي مثل ChatGPT تفيض الآن منصات النشر الأكاديمي بأوراق مسح توليدت بواسطة الذكاء الاصطناعي بمستويات تجعل نسبة الإشارة إلى الضوضاء حرجة. وتدعي دراسة جديدة أن هذا الطوفان يُغمر الباحثين ، ويُ歪س الإشارات ، ويُهدد الثقة في السجل العلمي ، مشيرة إلى أن فيض الأوراق المدعومة بالذكاء الاصطناعي يشبه “هجوم DDoS” على العلم نفسه.

 

(جزئيًا) رأي في الأسبوع الماضي ، لأول مرة في سبع سنوات من مواكبة التيار العلمي المتعلق بالذكاء الاصطناعي ، اضطررت إلى الاستسلام والاعتراف بأنني ، على الأقل في أوقات الذروة ، يجب أن أختار بين البقاء على اطلاع دائم بالمنشورات الجديدة الأساسية أو وجود أي وقت متبقي لكتابة بعضها.

كان العدد الإجمالي للمدخلات في عدد قليل من الفئات ذات الصلة (رؤية الكمبيوتر ، تعلم الآلة ، نماذج اللغة ، وعدد قليل من الأقسام الأقل اشتراكًا) يبلغ أكثر من ألف – لمدخلات يوم واحد فقط.

في مثل هذا الحجم ، حتى مجرد تصفح جميع العناوين الجديدة و偶ами التمتع ببعض ملخصات الخلاصة سيجعل من يوم غير منتج.

كان هذا يوم الثلاثاء 7 أكتوبر. من ناحية أخرى ، في فئة تعلم الآلة ، قدم هذا الثلاثاء الماضي (14 أكتوبر) حجمًا منشورًا أقل حدة من 400 مدخل تقريبًا لليوم الثلاثاء من الأسبوع السابق ؛ كان لديها 354 مدخلا فقط :

354 منشورًا لفئة تعلم الآلة في يوم واحد. مصدر: https://arxiv.org/

354 منشورًا لفئة تعلم الآلة في يوم واحد. مصدر: https://arxiv.org/

يجب أن تكون قد قرأت Arxiv كل يوم ، لبعض سنوات ، لتحقيق مدى جنون هذه الأرقام.

الاعتراف بأن يوم الثلاثاء هو “ساعة الذروة” لمنشورات Arxiv ، ربما لأنها أول يوم عمل يحدث بعيدًا عن أي عطلات نهاية الأسبوع يتمتع بها الأشخاص المؤثرين الذين يأمل الباحثون في الوصول إليهم ؛ وفئة تعلم الآلة هي قسم “مجموع” مع عدد أقل من الأوراق الفريدة (الأوراق التي لا تنشر بشكل متزامن في قنوات أكثر تخصصًا) من معظم الفئات الأخرى.

ومع ذلك ، فإن ارتفاع مدخلات الأوراق هو بالفعل ظاهرة ملحوظة في الأكاديمية ووسائل الإعلام.

ربما يكون الجانب الأكثر إثارة للصدمة من هذا التوسع هو كيف أن جميع الفئات المجاورة أكثر أو أقل تغييرًا في تواترها على مدار ثلاث سنوات ، بينما كانت فئة علوم الحاسوب (انظر إذا كنت تستطيع العثور عليها في الإحصاءات الرسمية لشركة Arxiv أدناه) على مسار صاعد حاد :

ارتفاع أوراق علوم الحاسوب على مدار ثلاث سنوات الماضية. مصدر: https://info.arxiv.org/about/reports/submission_category_by_year.html

ارتفاع أوراق علوم الحاسوب على مدار ثلاث سنوات الماضية. مصدر: https://info.arxiv.org/about/reports/submission_category_by_year.html

منذ ثلاث سنوات فقط ، كان من المتوقع أن تكون مخرجات منشورات الذكاء الاصطناعي في Arxiv تضاعف كل بضع سنوات ؛ وسيكون من المثير قراءة هضم Arxiv السنوي للاتجاهات في نهاية عام 2025.

الحجم عند 11

يوجد سببان واضحان لماذا يحدث هذا : أ) التزام مالي غير مسبوق بالذكاء الاصطناعي التوليدي ي جذب مستويات هائلة من استثمار البحث في القطاعين الخاص والاكاديمي ، والتي غالبًا ما تتعاون ؛ وب) حقيقة أن أنظمة نماذج اللغة مثل ChatGPT تجعل منشورات الأبحاث (بما في ذلك الأوراق عن الذكاء الاصطناعي) عملية شبه صناعية.

ومع ذلك ، فإن جودة مدخلات البحث لا ترتفع بالتزامن مع الحجم (على الرغم من أن خرج الذكاء الاصطناعي المعيب يعتبر أكثر إثارة لل标题 في القطاع القانوني أكثر من الأكاديمي ، لا سيما بسبب أن العواقب أكثر وضوحًا هناك).

سياسة الصفر لا تسامح صعبة التنفيذ في هذه الحالة ، حتى لو كانت التعرف على المحتوى التوليدي للذكاء الاصطناعي أسهل ؛ بالإضافة إلى حقيقة أن الذكاء الاصطناعي في حد ذاته هو نعمة واضحة للبحث العلمي بشكل عام ، فإن استخدامه في مدخلات أوراق البحث قد حسّن بشكل عام وضوح العمل من قبل العديد من المُرسلين غير الناطقين باللغة الإنجليزية – الأفراد والفرق الذين عملوا حتى الآن بضعف.

ولكن مشكلة خفض حاجز اللغة بهذه الطريقة هي أنها ترتفع أيضًا العدد الإجمالي للمُرسلين العالميين ، دون رفع مستوى الإشراف البشري الذي يعطي قيمة لهذه الأعمال.

إذا استمرت مستويات التسليم في الارتفاع بشكل أسيمطوتي ، فإن نسبة الإشارة إلى الضوضاء ستصبح غير قابلة للتحكم ، وستكون قادرة فقط على التنقل في الفيضانات والروافد الجديدة من الأوراق التوليدية للذكاء الاصطناعي ؛ مهمة ليست أكثر ملاءمة للقيام بها من إثبات مخرجاتها الخاصة. ومن المفارقات أن البحث العلمي هو مشروع بشري مكثف بشري.

هجوم على البحث

سبب هذه الانعكاسات هو تعاون جديد مثير من الصين بعنوان ايقاف الهجوم DDoS على مجتمع البحث بأوراق المسح التوليدية للذكاء الاصطناعي.

يركز الورق الجديد بشكل خاص على مدخلات المسح – ملخصات شاملة لخيوط معينة في البحث ، والتي قامت تقليديًا بترتيب وسياق ، وتفسير الاتجاهات ، وصنع تنبؤات مدروسة :

جزء بسيط من الجسم الهائل والمتنامي دائمًا للمسوح المتاحة في أقسام متعلقة بالتعلم الآلي والذكاء الاصطناعي ، في arxiv.org

جزء بسيط من الجسم الهائل والمتنامي دائمًا للمسوح المتاحة في أقسام متعلقة بالتعلم الآلي والذكاء الاصطناعي ، في arxiv.org

منذ أن قامت المسوح بترتيب بدلاً من إنشاء ، فهي سهلة التأتمت بفضل الذكاء الاصطناعي ، ويصف مؤلفو العمل الجديد انتشار المسوح منخفضة الجهد في مصطلحات تهديد أمني للقطاع البحثي :

‘[الارتفاع الحديث في المسوح التوليدية للذكاء الاصطناعي ، خاصة تلك التي تمكّنت بواسطة نماذج اللغة الكبيرة (LLMs) ، حولت هذا النوع التقليدية شديدة الجهد إلى إنتاج عالي الحجم وقليل الجهد. في حين أن مثل هذا التأتمت يخفض حاجز الدخول ، فإنه يُ導ي أيضًا إلى تهديد حرج : ظاهرة نسميها “هجوم ورقة المسح DDoS” على مجتمع البحث.

‘هذا يشير إلى الانتشار غير الخاضع للرقابة للمanuscripts المسح الشامل ولكنها غالبًا ما تكون سطحية أو منخفضة الجودة أو حتى مخادعة ، والتي تفيض منصات المنشورات المسبقة ، وتُغمر الباحثين ، وتُهدد الثقة في السجل العلمي.

‘[نحن] نجادل بأن يجب علينا أن نوقف تحميل كميات هائلة من أوراق المسح التوليدية للذكاء الاصطناعي (أي هجوم ورقة المسح DDoS) إلى مجتمع البحث ، من خلال وضع قواعد صارمة لكتابة المراجعة بمساعدة الذكاء الاصطناعي.’

يؤكد المؤلفون أن هذا التوسع غير المقيد في إنتاج المسح يهدد بالغمرة النظام البيئي البحثي بالتقارير المبتكرة التي تفتقر إلى العمق النقدي ، والتي من المحتمل أن تنتشر الأخطاء الواقعية و / أو المخادعة والاستشهادات.

ينبه الورق إلى أن بدون قواعد أو إشراف أفضل ، قد تتحول المسوح التوليدية للذكاء الاصطناعي إلى نسخ سطحية تُخفي التحليلات المهمة ، وتجعل مراجعات الأدب أقل موثوقية :

‘الآثار على جودة البحث والثقة عميقة. أولاً ، قد تُخفي التطورات الحقيقية بواسطة إعادة كتابة خوارزمية للمسوح الحالية.

‘قد يجد المبتدئون والباحثون التأثيريون صعوبة في العثور على نظرات موثوقة في الضوضاء. بالإضافة إلى ذلك ، يمكن أن تنتشر الأخطاء أو الانحيازات التي أدخلها الصياغة التلقائية دون رقابة ، مما يؤدي إلى زرع البحث اللاحق بمسببات معيبة.

‘باختصار ، فيض المسوح غير الخاضعة لمراجعة الأقران التوليدية للذكاء الاصطناعي يهدد كل من صرامة مراجعات الأدب وموثوقية السجل العلمي.’

‘مؤلفون غير عاديون’

يقدم الباحثون في الورق الجديد بعض التحليلات المثيرة للاهتمام حول تطور مدخلات المسح :

اليسار : العدد السنوي لأوراق المسح في علوم الحاسوب من 2020 إلى 2024. الوسط : متوسط درجات توليد الذكاء الاصطناعي لهذه الأوراق خلال نفس الفترة. اليمين : عدد المؤلفين الذين تم وضع علامة عليهم على أنهم غير عاديين (أولئك الذين لديهم إنتاج مسح غير عادي ، وتنوع محدود في التعاون ، ونمط مؤسسي متكرر) كل عام. جميع هذه الاتجاهات تظهر ارتفاعًا حادًا بدءًا من 2023 ، مما ي совпадает مع إصدار ChatGPT و نماذج اللغة الكبيرة الأخرى.

اليسار : العدد السنوي لأوراق المسح في علوم الحاسوب من 2020 إلى 2024. الوسط : متوسط درجات توليد الذكاء الاصطناعي لهذه الأوراق خلال نفس الفترة. اليمين : عدد المؤلفين الذين تم وضع علامة عليهم على أنهم غير عاديين (أولئك الذين لديهم إنتاج مسح غير عادي ، وتنوع محدود في التعاون ، ونمط مؤسسي متكرر) كل عام. جميع هذه الاتجاهات تظهر ارتفاعًا حادًا بدءًا من 2023 ، مما ي совпадает مع إصدار ChatGPT و نماذج اللغة الكبيرة الأخرى.

في العمود الأول نرى اتجاهات النمو : المنحنى يبدأ في الانحدار حول 2022 ، عندما ظهر ChatGPT وبدأت نماذج اللغة الكبيرة في الانتشار ، وستستمر نماذج متابعة مثل Claude ، PaLM ، و Gemini في الحفاظ على هذا الزخم على مدار 2023.

يُظهر الرسم البياني الأوسط ارتفاعًا حادًا في التسليم بعد 2022 ، مما ي совпادает مع إطلاق ChatGPT. وجد فريق بحثي وجد أنه بحلول 2024 ، تم تشغيل أكثر من 10٪ من الملخصات العلمية عبر نموذج اللغة الكبيرة. ووجد تقرير منفصل من شركة كشف الذكاء الاصطناعي أن القفزة بعد ChatGPT كانت 72٪ للأوراق على arXiv التي قد تم كتابةها بمساعدة الذكاء الاصطناعي. كما تضاعف عدد الأوراق ذات درجات توليد الذكاء الاصطناعي العالية في غضون عام ، من 3.6٪ إلى 6.2٪.

الرسم البياني الثالث ، الأيمن ، يُظهر ارتفاعًا مستمرًا في عدد أنماط المؤلفين “غير العاديين” (الباحثين الذين يقدمون ثلاثة مسوح أو أكثر في غضون شهر بينما يعملون مع أقل من两个 منظمين) ، مع ارتفاع حاد بدءًا من 2022.

يؤكد المؤلفون أن العديد من هذه أوراق المسح قد تم صياغتها بواسطة الذكاء الاصطناعي ، لأسباب متنوعة ؛ بعضها مكتوب بواسطة مؤلفين منفردين أو مجموعات صغيرة يقدمون عدة مسوح في وقت قصير ؛ العديد منهم يغطون مواضيع غير متعلقة ؛ وفي بعض الحالات ، لا يمتلك المؤلفون أي سجل سابق في المجالات التي يقدمونها.

بالإضافة إلى ذلك ، بعضها ينشر تحت مجموعات مجهولة الهوية بدون أي صلات مؤسسية واضحة – أنماط تشير إلى فيض منسق للميدان بمسوح سريعة ، ربما لتحقيق الاستشهادات أو تحسين الملفات الأكاديمية ، بدلاً من تقديم أي مساهمة حقيقية في الأدب.

قضايا

على الرغم من أننا لا نستطيع تغطية جميع ادعاءات الورق الجديد ، يجب علينا النظر في بعض أكثر الملاحظات شهرة ، بالإضافة إلى النظر بشكل نقدي إلى الحلول المقترحة للمؤلفين لهذه القضايا.

الجودة والأصالة

المشكلة ليست فقط الحجم : العديد من مسوح الذكاء الاصطناعي تتخطى ما يجعل مسحًا جيدًا مفيدًا : هيكل واضح ، تحليل عميق ، رصيد صحيح ومدروس ، وفرق حقيقي. بدلاً من ذلك ، يشير الورق إلى أن مسوح الذكاء الاصطناعي المكتوبة غالبًا ما تفتقر إلى الهيكل ، ولكنها ببساطة تسرد الأوراق بدون اتجاه واضح ، وتخطى أقسامًا رئيسية ، ويفشل في إنشاء سياق.

يلاحظ المؤلفون ، بالإضافة إلى ذلك ، أن مسوح الذكاء الاصطناعي المكتوبة غالبًا ما تفتقر إلى الهيكل ، ولكنها بدلاً من ذلك تسرد الأوراق بدون اتجاه واضح ، وتخطى أقسامًا رئيسية ، ويفشل في إنشاء سياق. مسوح مكتوبة باليد ، من ناحية أخرى ، تميل إلى إنشاء فئات مناسبة ، وتروي قصة أكثر تماسكًا.

كما يلاحظون أن العديد من مسوح الذكاء الاصطناعي المحتملة تظهر ببساطة نسخة من تقسيمات الموضوع الحالية ، أحيانًا مباشرة من ويكيبيديا. على سبيل المثال ، يشير الورق إلى أن العديد من مسوح Vision Transformers تحتوي على عناوين أقسام شائعة وهيكل ، مما يُظهر خرج القوالب التوليدية للذكاء الاصطناعي :

‘على العكس من ذلك ، قد يقدم مسح مكتوب باليد هيكلاً جديدًا ، على سبيل المثال ، تصنيف ViT حسب استراتيجيات الكفاءة. نقص هيكل أصلي في العديد من مسوح المسبقة الحديثة يثير مخاوف من أنها قد تم توليدها بواسطة الذكاء الاصطناعي مع رؤية بشرية محدودة.’

لا تُقتبسني على ذلك

ربما الأكثر إثارة للخجل علنًا ، مسوح الذكاء الاصطناعي المكتوبة غالبًا ما تُخطئ الاستشهادات ، وتهمل الأوراق الرئيسية ، بما في ذلك الأوراق غير ذات الصلة ، وأحيانًا حتى قائمة أوراق غير موجودة – أخطاء تشير إلى أن المراجع تنشأ من مطابقة الأنماط السطحية ، بدلاً من الخبرة الحقيقية.

يُشير المؤلفون أيضًا إلى أن بعض مسوح الأبحاث الحديثة ، غالبًا من فرق متعددة ، تشترك في ما يصل إلى 70٪ من قوائم المراجع – مستوى تكرار इतन高 أنه يشير ، حسب زعمهم ، إلى الاعتماد المشترك على نماذج اللغة الكبيرة ، والتي تستمد من نفس مجموعة مصادر ضيقة.

في الواقع ، المستخدمون العاديون لبرنامج ChatGPT يعرفون أن الموضوعات الأقل شيوعًا ، يكون عدد المصادر المتنوعة أقل للنموذج لتحليلها ؛ غالبًا ما يكون العثور على مصادر النموذج الخاصة على الويب أكثر فائدة من محاولة التفاعل مع تلك المعلومات عبر الذكاء الاصطناعي الذي لم يكن لديه بيانات كافية في مجال معين.

نمط متجانس ي出现

يُلاحظ المؤلفون أيضًا أن العديد من مسوح الذكاء الاصطناعي على نفس الموضوع تظهر وتبدو متشابهة جدًا ، حيث يعيد نماذج اللغة الكبيرة الصياغة والهيكل ، خاصة للمواضيع الشائعة ، مما يؤدي إلى فيض من أوراق تقريبا متطابقة تُضيف قيمة قليلة ، وتُضيف ضوضاء كبيرة إلى الباحثين الذين يبحثون عن إجابات مجال * :

‘عندما يطلب العديد من المؤلفين من نموذج اللغة الكبيرة “كتابة مراجعة الأدب حول X” ، ينتج النموذج غالبًا استجابات متشابهة جدًا ، خاصة لتعريفات أو حقائق شائعة. أظهرت الأبحاث الحديثة ارتفاعًا حادًا في استخدام أنماط الكتابة المرتبطة بنماذج اللغة الكبيرة ، مما يشير إلى أن العديد من الأوراق تشترك في نفس الأسلوب.’

يظهر ChatGPT الخاص بك

يُلاحظ الورق أن طريقة سريعة لتحديد مسوح مكتوبة بواسطة الذكاء الاصطناعي هي من خلال وجود عبارات مثل ‘كنموذج لغة الذكاء الاصطناعي’ أو ‘نقطة قاطعية معارفي’ ، مما يشير إلى عدم وجود تحرير أو صيانة للخرج من نماذج اللغة قبل تقديم الأوراق (على الرغم من أن البحث المستهدف في وقت الكتابة لم يكن يظهر أي من هذه العلامات في بحث جوجل).

يُشير الورق إلى أن العديد من “مسوح مشبوهة” تُظهر تنوعًا كلمة أقل ، وترديد الصياغة ، على سبيل المثال ، من خلال بدء العديد من الفقرات بـ علاوة على ذلك. هذا النمط ، حسب زعم المؤلفين ، هو نموذجي للكتابة بنمط GPT ، ويمكن أن يكون علمًا مفيدًا لتحديد النص التلقائي.

(تعليقي الشخصي على هذا هو أن قيود الصحافة عبر الإنترنت غالبًا ما تتطلب من الكاتب سرد العديد من العناصر في شكل نصي غير مصنف. لذلك ، من المرجح أن يتعلم ChatGPT وأقرانه عادة سيئة من الكتّاب البشر الذين واجهوا عددًا محدودًا من البدائل اللغوية. بالإضافة إلى ذلك ، يُظهر تخمين المؤلفين أنهم يغوصون في مبادئ كشف المحتوى التوليدي للذكاء الاصطناعي ، وهو مجال معقد ومستمر ، مع قليل من الثوابت من النوع الذي يشير إليه المؤلفون)

على الرغم من أن الباحثين يطورون بعد ذلك خطابًا مثيرًا حول التأثير السلبي للمسوح التوليدية للذكاء الاصطناعي على ثقافة البحث والثقة ، يجب أن نُحيل القارئ إلى الورق الأصلي للحصول على عمق أكبر حول هذا الموضوع.

حلول؟

حل الورق هو مثير ومبتكر وفي الوقت نفسه غير أصلي : أن يُستبدل فائدة مسوح الأوراق ب مسح حي ديناميكي – بالتفسير ، نوع من الهجين بين ويكي وصفحة جيثب ، يتم تغذيها باستمرار ببيانات جديدة من نماذج اللغة الكبيرة وأجهزة الذكاء الاصطناعي الأخرى ، ولكن مع التزامات يتم إجراؤها فقط بواسطة البشر ، بحيث لا يمكن للذكاء الاصطناعي “نشر تحديثات تلقائيًا”.

سيتم مشاركة النظام المقترح VERSIONING وفرع جيثب ، بشكل أساسي تحويل مورد المعلومات إلى قائمة محدثة باستمرار مشابهة ل قوائم “رائع” المحددة في جيثب :

‘في إطار هذا الإطار ، يُحدد عضو المجتمع أولاً موضوع مسح ويكي عن طريق تحديد النطاق والأسئلة البحثية الرئيسية والمراجع الرائدة ، مما يُحدد بذلك حدودًا مواضيعية واضحة وهيكلًا أوليًا.

‘بعد ذلك ، يعمل وكيل استهلاك نموذج اللغة الكبيرة بشكل مستمر لمراقبة أرشيفات المنشورات المسبقة ، ومحاضر المؤتمرات ، ولوحات القيادة. يقوم تلقائيًا باستخراج الملخصات والرسومات والمقاييس الرئيسية للأداء ؛ يُحضر ملخصات موجزة للنتائج الجديدة ؛ ويُحدّث الرسم البياني للاستشهاد ليعكس العلاقات بين الأوراق ؛ ويُحذر من اتجاهات البحث الناشئة للمراجعة الإضافية.

‘من خلال التصميم ، تحدث هذه التحديثات التلقائية في غضون ساعات من النشر ، مما يضمن أن يبقى المستودع في طليعة التطورات.’

‘ثم يتدخل المساهمون البشر لتقديم العمق التفسيري الذي لا يمكن للأجهزة تقديمه وحدها. يُحسنون التصنيفات المتطورة لتقاط الفروق المنهجية الدقيقة ، ويتوافقون مع التفسيرات المتضاربة لابتكارات الخوارزمية عبر فروع فرعية مختلفة ، ويقدمون مقارنات نقدية أعمق للوثيقة.’

كتاب التغييرات

يُفصّل المؤلفون ب热情 وطول في هذا الاقتراح ، ويفسرونه أساسًا بشيء ما هو صحيح جدًا : مسوح عالية الجهد مكتوبة باليد حول مواضيع متقلبة حول الذكاء الاصطناعي تتقدم بسرعة جدًا بحيث لا تستحق الكتابة ؛ ويُلاحظ الورق أن دوران ثلاثة أشهر على ورقة مسح جديدة سيجعلها بالتأكيد قديمة (أو حتى قديمة جدًا ) في وقت يوم النشر المحدد :

‘سنة بعد سنة ، يتم فيض المجتمعات بمسوح متكررة أو سطحية تفقد صلاحيتها بسرعة ، تاركة الممارسين والمبتدئين على حد سواء يصعب عليهم التمييز بين الإشارة والضوضاء. دورة النشر التقليدية (أي ، مشروع ، تقديم ، مراجعة ، ونشر) يمكن أن تستمر لعدة أشهر ، من خلالها قد يكون التطورات الحاسمة قد غيرت بالفعل المناظر.

‘علاوة على ذلك ، يزيد عدد المسوح الثابتة من الحمل الإدراكي ، حيث يجب على القراء فرز العديد من الوثائق المتداخلة للعثور على رؤى جوهرية.’

لسوء الحظ ، يُشارك حل الورق العديد من أسوأ وأكثر السمات المثيرة للجدل ل Discord : الأكثر لفتًا للنظر هو أنه سيكون موردًا متغيرًا ومتغيرًا دائمًا.

من المستحيل استخدام مسح حي ديناميكي كمصدر موثوق به ومستقر ، باستثناء الرابط إلى “التعديل السابق” ، بنفس الطريقة التي توفرها مواقع الأرشيف مثل archive.is و Wayback Machine ، من بين مواقع أرشيف أخرى ، صورة قابلة للرابط لمحتوى صفحة الويب ، مجمدة في وقت معين. ولكن ما هي الموارد التي سيتطلبها مثل هذا التعديل ، ويمكن الوثوق بها للبقاء نشطة مع مرور الوقت؟

بالإضافة إلى ذلك ، من الصعب فهرسة منصة / ويكي مع محتوى متغير باستمرار ، إما بواسطة محركات البحث التقليدية أو نماذج اللغة الكبيرة.

ربما الجزء الأضعف في النظام المقترح هو فكرة أن البشر الحقيقيين يجب أن يُشرّفوا من التزامات وكلاء الذكاء الاصطناعي ؛ كما هو الحال دائمًا ، البشر الحقيقيون باهظون. ما يتم اقتراحه هو شيء بين متحف ومكتبة – كلاهما سيحتاجان إلى تزويد اللحوم المتوافق مع حجم البيانات وعدد المواضيع المغطاة.

إذا كان “استخدام أشخاص حقيقيين” هو الإجابة الوحيدة على مشكلة تطوير الذكاء الاصطناعي ، فمن العادل القول إن المشكلة لا تزال مفتوحة وغير محلولة.

الخلاصة

في الوقت الحالي ، فإن عمر مسح الورق قصير جدًا ؛ إذا استمر الاتجاه الحالي نحو الكتابة التلقائية والمنشورات بالحجم الكبير ، فإن نسبة الإشارة إلى الضوضاء ستصبح مزمنة ، وستصبح الأدبيات غير قابلة للتحكم.

في مثل هذه الحالة ، سيكون من الصعب على أصوات غير FAANG الصغيرة أن تُسمع في العاصفة من المنشورات ، وستكتسب قادة السوق الكبار بصدورهم أهمية أكبر.

بالإضافة إلى مسوح حية ، يقترح الورق الجديد أن لا يتم حث المؤلفين فقط على الإفصاح عن استخدام الذكاء الاصطناعي في أي جزء من الورقة ، ولكن أيضًا يجب وضع علامات واضحة على أقسام الذكاء الاصطناعي المساعدة في الورقة (ربما مع ملف JSON جانبي … ?).

منذ أن هذا هو تصور مرهق ، يُقترح الورق بديلاً ما أستطيع وصفها فقط باسم “getto الذكاء الاصطناعي” – قسم متميز في الورقة يُخصص لمساهمات الذكاء الاصطناعي.

باختصار ، لا يُقدم العمل الجديد أي حلول واقعية لتقديمها ؛ ومع ذلك ، قد أدى المؤلفون خدمة مفيدة في إطار التحديات التي تلوح في الأفق.

 

يمكن العثور على ورقة ايقاف الهجوم DDoS على مجتمع البحث بأوراق المسح التوليدية للذكاء الاصطناعي في https://arxiv.org/abs/2510.09686 ، وهي من تأليف ستة مؤلفين عبر أقسام في جامعة شنغهاي جيا تونغ.

___________________________________

* ليس الجميع يشعر أن هذا هو الحال.

تأكيد المؤلف ، وليس لي. بالإضافة إلى ذلك ، حيثما كان ذلك مناسبًا ، تحويل الاستشهادات السطرية للمؤلف إلى روابط.

نُشر لأول مرة يوم الجمعة ، 17 أكتوبر 2025

كاتب في تعلم الآلة، متخصص في مجال 합성 الصور البشرية. السابق رئيس محتوى البحث في Metaphysic.ai.
الsite الشخصي: martinanderson.ai
التواصل: [email protected]
تويتر: @manders_ai