Connect with us

وجهة نظر شخصية حول اتجاهات الأدب في رؤية الكمبيوتر في 2025

زاوية Anderson

وجهة نظر شخصية حول اتجاهات الأدب في رؤية الكمبيوتر في 2025

mm
AI-generated image, by gpt-image-1 via ChatGPT-5.2, featuring a stylized isometric illustration of white-coated scientists in a computer laboratory.

الاعترافات الأخلاقية و Gaussian Splatting في انخفاض، في حين أن حجم الأوراق المقدمة يمثل مشكلة جديدة للذكاء الاصطناعي لمواجهتها في 2026.

 

رأي لقد اتبعت أبحاث رؤية الكمبيوتر وتركيب الصور على arXiv ومنصات أخرى لما يقرب من سبع سنوات، عبر مختلف القنوات – đủ لتمييز الأنماط المتكررة والتحولات في الاتجاهات. ولكن هذه الملاحظات هي ملاحظات SUBJECTIVE. أتمنى أن أجد الوقت لاستغلال المجموعات الكبيرة من البيانات التي تمثلها تدفق المنشورات على Arxiv ، والتي من المؤكد أنها غنية بالرؤى الخفية، باستخدام تحليل التعلم الآلي. كما أنني أتمنى أن أتمكن من تقديم تقرير أكثر رسمية عما جاء في الانتباه منذ آخر مرة اعتبرت هذه القضية.

حجم في 11

许多 الاتجاهات في أبحاث تقديم الأوراق في 2024 أصبحت ثابتة في 2025؛ ليس أقلها هو الارتفاع المستمر في حجم من الأوراق المتعلقة بالذكاء الاصطناعي، والذي يتم تغذيته بالذكاء الاصطناعي، إلى حد الأزمة المتصورة:

إيداعات شهرية لعلوم الحاسوب على Arxiv، أكتوبر 2023-نوفمبر 2025، مع متوسط متحرك لمدة ثلاثة أشهر.

إيداعات شهرية لعلوم الحاسوب على Arxiv، أكتوبر 2023-نوفمبر 2025، مع متوسط متحرك لمدة ثلاثة أشهر. المصدر

هذا معدل النمو تم وصفها بأنها مضاعفة تصاعدية في حجم تقديم الأوراق، منذ عدة سنوات، وأنه قد أصبح أكثر حدة مع ظهور هوس الاستثمار في الذكاء الاصطناعي الذي رفع المخاطر، وكذلك مقدار التمويل المتاح لأبحاث الذكاء الاصطناعي.

البيانات الكاملة ل 2025 ليست متاحة بعد، والإحصاءات المجمعة الموضحة أعلاه تمثل الأرقام العامة التي تزداد عبر جميع الفئات. فيما يلي يمكننا أن نرى أن علوم الحاسوب لا تزال تتمتع باتجاه مهيمن، بشكل كبير فوق زملائها:

ارتفاع إيداعات علوم الحاسوب 2022-2025.

ارتفاع إيداعات علوم الحاسوب 2022-2025. المصدر

فرز الشعير

في أكتوبر، بداية موسم المؤتمرات، الذي يأتي دائمًا مع فيضان من الأبحاث الجديدة، جاءت بدلاً من ذلك هجوم DOS-attack على حجم الإيداعات، مما أضفى زخمًا وضرورة إلى سلك البحث الذي كان منخفضًا حتى الآن، وهو تحليل اتجاهات البحث؛ بمعنى آخر، الأوراق والمستودعات تظهر بشكل متزايد التي تسعى إلى التغلب على نسبة الإشارة إلى الضوضاء في المشهد البحثي.

الأحدث جاء فقط الأسبوع الماضي، في شكل NoveltyRank، ورقة و مستودع GitHub الذي يضبط LLMs مثل Qwen3-4B-Instruct-2507 و SciBERT بحيث يمكنهم أداء التصنيف الثنائي للأوراق المقدمة (توقع ‘الجدة’ من الإيداعات السابقة)، أو مقارنة الجدة الزوجية (مقارنة الإيداعات الحالية للجدة):

نظام NoveltyRank يقارن عنوان وملخص الإدخال مع أوراق سابقة مشابهة، ويقوم بتلخيص الفروق باستخدام LLM، ويمررها إلى نموذج Qwen3-4B المضبوط الذي يقرر ما إذا كان العمل يعتبر 'جديدًا مفهوميًا'.

نظام NoveltyRank يقارن عنوان وملخص الإدخال مع أوراق سابقة مشابهة، ويقوم بتلخيص الفروق باستخدام LLM، ويمررها إلى نموذج Qwen3-4B المضبوط الذي يقرر ما إذا كان العمل يعتبر ‘جديدًا مفهوميًا’. المصدر

المشكلة مع هذه المناهج ‘الفرز’ هي تحدي تعريف المتغيرات ذات المعنى. يعتمد подход NoveltyRank على قبول الورقة في المؤتمر كمؤشر على الجدة، و – ربما بشكل مستهين – يستخدم نشر Arxiv كمؤشر ل ‘الجدة السلبية’.

هذا يفترض两个 افتراض خاطئ: أولاً، أن جميع الأوراق المقبولة في المؤتمر هي جديدة أو مهمة، وهو أمر واضح أنه ليس كذلك؛ وثانيًا، أن الجدة نفسها لها قيمة غير مشروطة. أي شخص قضى نصف ساعة على بعض الأوراق المرسلة – ربما – فقط للحفاظ على ‘حصص النشر أو الفساد’، سيعرف أن الجدة غالبًا ما تكون تافها، والعمل المتقدم غالبًا ما يكون مهمًا.

فهم قيمة ورقة جديدة يتضمن مجالًا حيث الذكاء الاصطناعي حاليًا ضعيف جدًا – السياق على المدى الطويل. بسبب الطريقة الغالبًا ما تكون غير صادقة التي تكتب بها الأوراق، الأوراق التي تظهر وكأنها كسر الأرض يمكن أن تظهر في كثير من الأحيان كتقدم صغير على العمل الحالي؛ ومع ذلك، لن يكون النظام التلقائي قادرًا على تطوير ‘الحدس’ لهذه الحالات، دون إطلاق إيجابيات كاذبة متعددة، ودون الاعتماد على صدق المؤلفين المرسلين.

الانخفاض الأخلاقي

كما لاحظت من قبل، منصات مثل Arxiv مقاومة للغاية ل ‘الأسواق الحرة’، والبيانات التي توفرها غالبًا ما تفتقر إلى التفاصيل الدقيقة.

لذلك، حتى لو كان لديّ الموارد والوقت لتنزيل واستخراج الميزات من جزء ممثل بشكل كافٍ من أوراق علوم الحاسوب، فإن العديد من الاتجاهات الأكثر دقة لن يتم استهدافها أو تحليلها.

واحدة من هذه هي وجود أو عدم وجود شروط الإفصاح الأخلاقي؛ لفترة طويلة كانت شروط إلزامية للعلوم البيولوجية التي تلمس التجارب على الحيوانات، 2024 شهدت ذروة الاتجاه نحو التوصيف الأخلاقي للعمل المقترح، في نهاية الأوراق المقدمة في فئة علوم الحاسوب.

أنا أقول بشكل موضوعي أن هذه الممارسة قد انخفضت بشكل حاد في 2025. خمسيني هو أن الجهود الحثيثة لإلغاء التنظيم الحالي للحكومة الأمريكية، فيما يتعلق بتطوير الذكاء الاصطناعي، قد أعطت المجتمع البحثي في الولايات المتحدة وخارجها رخصة وsense محسّنًا من الحماية القانونية.

على الرغم من دعمه لتنظيم مكافحة ال deepfake، فإن الإدارة الحالية الأمريكية أعادت بشكل فعال الكثير من موقف ‘الغرب المتوحش’ الذي كان سمة الفترة 2021-23 – على الرغم من أن السياق البحثي النقي الذي حددته قد تطور منذ ذلك الحين إلى مستويات histórica من الاستثمار.

أوراق الفيديو التوليدية ك ‘سيل الذكاء الاصطناعي’

مع إطلاق Hunyuan Video و WAN سلسلة الفيديو التوليدية خلال الشتاء الماضي، تم تحويل الفيديو الذكي بشكل كامل في 2025. العوائق القديمة مثل صعوبة صنع التماثيل الكاملة، أو الحصول على مناظير مقنعة لشخص، تم إزالتها على ما يبدو خلال ليلة واحدة.

الإصدارات الواسعة التي تحتوي على أوزان من هذا النوع من الصين قد جعلت، على الأرجح، معايير الإصدارات التوليدية للفيديو هذا العام، وهي ضغط مضاد على趨势 western الذكاء الاصطناعي للفيديو لتكون أكثر رقابة، وتجارية، وتنظيمية.

حمى الشبكة تتراجع

لاحظت العام الماضي أن المشهد كان يختبر زيادة ملحوظة في الأوراق التي تروج لأنظمة تستخدم تقنيات CGI التقليدية (أي تمثيلات الشبكة من النوع الذي يعود إلى السبعينيات)، أو تدمجها في الإطارات العصبية. لقد لاحظت انخفاضًا كبيرًا في الزخم نحو حلول الشبكة، خاصة في النصف الثاني من العام، في 2025.

许多 من الحلول التي تدمج CGI في موجة الأوراق السابقة، خاصة تلك التي تتعامل مع أشكال تحكم بарамترية للبشر مثل نماذج قابلة للتشكيل ثلاثية الأبعاد، قد تم استبدالها بالقدرات الجديدة للإطارات التوليدية القائمة على الاندماج مثل Veo و Kling و Hunyuan و WAN، من بين العديد من الآخرين.

انخفاض في إيداعات أمان الذكاء الاصطناعي

ملاحظتي النهائية ل 2025 هي أن فئة ‘الأمان’ في قسم علوم الحاسوب على Arxiv قد شهدت انخفاضًا ملحوظًا في التكرار والجودة في 2025، ومن الصعب تخمين السبب.

ما يمكن توقعَه في 2026

على الرغم من أن وسائل الإعلام تتحدث دائمًا عن انفجار الذكاء الاصطناعي كتكرار للانفجار dot.com في أوائل العقد الأول من القرن الحادي والعشرين (مع بعض الخلاف)، هذا يبدو أنه يمثل نوعًا من الأمان الكاذب. من حيث البنية التحتية والاستثمار والثقافة و البحث، لم يكن هناك وقت مثل هذا في تاريخ البشرية.

لذلك من الصعب رؤية اتجاه المشهد البحثي في 2026، إلا أن عددًا من الجهود على المدى الطويل ستنتهي بين الآن وأبريل، مع بصمة معينة من اهتمامات و اتجاهات 2025 التي تميزها.

تطوير واحد قد يساعد أزمة حجم الإيداع على Arxiv ومنصات أخرى، هو حظر أو فحص الأوراق التي تم إنشاؤها بمساعدة الذكاء الاصطناعي، كما فعلت Arxiv مؤخرًا للورقات المراجعة – ومع ذلك، قد يثبت أن مقدار مساهمة الذكاء الاصطناعي في أي ورقة معينة يصعب تحديده، لأن الذكاء الاصطناعي penetrated البحث الثقافيالمراجعة من الأقران) كما فعل في المجالات الأخرى – مثل قطرة ‘حبر’ تؤثر على كل كأس الماء (الموجود)، بدلاً من تغيير الوسط بشكل جذري.

 

نشر لأول مرة يوم الإثنين، 22 ديسمبر 2025

كاتب في تعلم الآلة، متخصص في مجال 합성 الصور البشرية. السابق رئيس محتوى البحث في Metaphysic.ai.
الsite الشخصي: martinanderson.ai
التواصل: [email protected]
تويتر: @manders_ai