اتصل بنا للحصول على مزيد من المعلومات

نظرة شخصية على اتجاهات أدبيات الرؤية الحاسوبية في عام 2025

زاوية أندرسون

نظرة شخصية على اتجاهات أدبيات الرؤية الحاسوبية في عام 2025

mm
صورة مولدة بالذكاء الاصطناعي، بواسطة gpt-image-1 عبر ChatGPT-5.2، تعرض رسمًا توضيحيًا متساوي القياس منمقًا لعلماء يرتدون معاطف بيضاء في مختبر حاسوب.

تتراجع الإفصاحات الأخلاقية وتقنية التوزيع الغاوسي، في حين أن الحجم الهائل للأوراق المقدمة يمثل مشكلة جديدة يتعين على الذكاء الاصطناعي معالجتها في عام 2026.

 

مراجعة لقد تابعتُ أبحاث رؤية الحاسوب وتوليف الصور على موقع arXiv والمنصات المشابهة لما يقارب سبع سنوات، عبر منافذ نشر متنوعة، وهي مدة كافية لتمييز الأنماط المتكررة والتحولات في الاتجاهات. لكن هذه الملاحظات تبقى مجرد سردٍ قصصي. أتمنى حقًا لو كان لديّ الوقت الكافي لاستغلال الكم الهائل من البيانات المتنامية باستمرار التي يمثلها تدفق منشورات arXiv وحده، والذي يزخر بلا شك برؤى خفية، باستخدام تحليل التعلم الآلي. في الوقت الراهن، لا يسعني إلا أن أروي بشكل غير رسمي ما لفت انتباهي. منذ آخر مرة فكرت فيها في هذا الأمر.

الحجم عند 11

العديد من الاتجاهات في تقديم أوراق البحث في مجال الذكاء الاصطناعي التي لاحظتها في عام 2024 أصبحت سمات ثابتة في عام 2025؛ ومن أبرزها الارتفاع المطرد والمستمر في حجم من الأوراق البحثية المتعلقة بالذكاء الاصطناعي، والتي تغذيها في حد ذاتها تقنيات الذكاء الاصطناعي، إلى درجة أزمة متصورة:

بيانات النشر الشهري في مجال علوم الحاسوب على موقع Arxiv، من أكتوبر 2023 إلى نوفمبر 2025، مع عرض متوسط ​​متحرك لثلاثة أشهر. المصدر: https://arxiv.org/stats/monthly_submissions

بيانات شهرية عن الأبحاث المنشورة في موقع Arxiv في مجال علوم الحاسوب، من أكتوبر 2023 إلى نوفمبر 2025، مع متوسط ​​متحرك لمدة 3 أشهر.. مصدر

وقد تميز معدل النمو هذا بتضاعف هائل في حجم الأوراق البحثية المقدمة في مجال الذكاء الاصطناعي، قبل عدة سنواتوقد ازدادت هذه الظاهرة رسوخاً مع ظهور... هوس الاستثمار في الذكاء الاصطناعي وقد أدى ذلك إلى زيادة المخاطر، فضلاً عن زيادة حجم التمويل المتاح للأبحاث المتعلقة بالذكاء الاصطناعي.

لم تتوفر الإحصائيات الكاملة لعام 2025 بعد، وتمثل الإحصائيات الإجمالية الموضحة أعلاه الأرقام العامة المتزايدة في جميع الفئات. نلاحظ أدناه أن علوم الحاسوب لا تزال تشهد اتجاهاً سائداً، متفوقةً بشكل ملحوظ على المجالات الأخرى ذات الصلة.

ارتفاع في عدد الأبحاث المقدمة في مجال علوم الحاسوب خلال الفترة 2022-2025. المصدر: https://info.arxiv.org/about/reports/submission_category_by_year.html

ارتفاع في عدد طلبات الالتحاق ببرامج علوم الحاسوب خلال الفترة من 2022 إلى 2025. مصدر

فرز القش

في أكتوبر، جلب بدء موسم مؤتمرات الخريف، الذي يجلب عادةً سيلًا من الأبحاث الجديدة، بدلاً من ذلك حجم الطلبات المقدمة بمستوى هجوم حجب الخدمةمما أعطى زخماً وإلحاحاً إضافيين لمسار البحث الذي لم يحظَ حتى الآن بالإقبال الكافي. تحليل اتجاهات البحثبمعنى آخر، تظهر بشكل متزايد أوراق ومستودعات تسعى في حد ذاتها إلى اختراق نسبة الإشارة إلى الضوضاء المتدهورة في المشهد البحثي.

آخرها جاء الأسبوع الماضي فقط، على شكل تصنيف الجدةأو المعلم ورقة و مستودع جيثب والتي تعمل على تحسين نماذج التعلم الآلي مثل Qwen3-4B-Instruct-2507 و سيبيرت حتى يتمكنوا من إجراء تصنيف ثنائي للأوراق المقدمة (التنبؤ بـ "الجدة" من الطلبات السابقة)، أو مقارنة الجدة الثنائية (مقارنة الطلبات الحالية من حيث "الجدة"):

يقارن نظام NoveltyRank عنوان وملخص البحث المقدم بأبحاث سابقة مماثلة، ويلخص الاختلافات باستخدام نموذج LLM، ثم يُمرر هذه المعلومات إلى نموذج Qwen3-4B مُحسَّن لتحديد ما إذا كان العمل يُعتبر "جديدًا من الناحية المفاهيمية". المصدر: https://arxiv.org/pdf/2512.14738

يقوم نظام NoveltyRank بمقارنة عنوان وملخص البحث المقدم مع أوراق بحثية سابقة مماثلة، ويلخص الاختلافات باستخدام نموذج LLM، ويمرر هذا إلى نموذج Qwen3-4B مضبوط بدقة والذي يقرر ما إذا كان العمل يعتبر "جديدًا من الناحية المفاهيمية". مصدر

تكمن مشكلة أساليب "الفرز" هذه في تحدي تحديد المتغيرات ذات الدلالةتعتمد منهجية NoveltyRank على قبول ورقة بحثية في مؤتمر كمؤشر على حداثتها، وتستخدم - ربما بشكل استخفافي نوعًا ما - النشر على موقع Arxiv كمؤشر أساسي لـ سلبي بدعة.

يفترض هذا فرضيتين خاطئتين: أولاً، أن جميع الأبحاث المقبولة في المؤتمر جديدة أو ذات أهمية، وهو ما ليس صحيحاً قطعاً؛ وثانياً، أن الحداثة بحد ذاتها قيمة مطلقة. كل من أضاع نصف ساعة على بعض الأوراق البحثية الزائفة، بل والمضحكة، التي قُدّمت - ربما - لمجرد الحفاظ على حصص "انشر أو اندثر"سيدركون أن الابتكار غالباً ما يكون تافهاً، وأن العمل التدريجي غالباً ما يكون مهماً.

إن فهم قيمة ورقة بحثية جديدة ينطوي على مجال تتواجد فيه تقنيات الذكاء الاصطناعي حاليًا ضعيف جدا – على المدى الطويل سياق الكلامبسبب الطريقة المخادعة التي تُكتب بها الأوراق البحثية في كثير من الأحيان، يمكن الكشف في كثير من الأحيان عن الأوراق التي تبدو رائدة على أنها مجرد تطورات طفيفة على الأعمال الحالية؛ ومع ذلك، سيتعين على الأنظمة الآلية تطوير "حدس" لمثل هذه الحالات، دون الإشارة إلى العديد من النتائج الإيجابية الخاطئة، ودون الاعتماد على صدق المؤلفين الذين يقدمون الأوراق.

غطسة أخلاقية

كما فعلت لوحظ من قبلتُعتبر بوابات مثل Arxiv مقاومة إلى حد كبير لـ عدم التدخل مبدأ في الإقتصاد عمليات استخراج البيانات، وغالباً ما تفتقر البيانات التي توفرها إلى التفاصيل الدقيقة.

لذلك، حتى لو كانت لدي الموارد والوقت لتنزيل واستخراج الميزات من مجموعة تمثيلية كافية من أوراق علوم الكمبيوتر، فإن العديد من الاتجاهات الأكثر دقة لن يتم استهدافها أو تحليلها.

أحد هذه الأمور هو وجود أو عدم وجود ملاحق البيان الأخلاقي; طويل إدراج إلزامي بالنسبة للعلوم البيولوجية التي تتناول التجارب على الحيوانات، شهد عام 2024 ذروة الاتجاه نحو التوصيف الأخلاقي للعمل المقترح، في نهاية الأوراق المقدمة في فئة علوم الحاسوب.

من واقع التجربة، أقول إن هذه الممارسة قد تراجعت بشكل حاد طوال عام 2025. أعتقد أن جهود إلغاء القيود التي تبذلها الحكومة الأمريكية الحالية، فيما يتعلق بتطوير الذكاء الاصطناعي، قد منحت مجتمع البحث العلمي في الولايات المتحدة وخارجها، رخصة متزايدة وشعوراً ضمنياً بالحماية من المساءلة القانونية.

على الرغم من تقنية فيما يتعلق بتنظيم مكافحة التزييف العميق، أعادت الإدارة الأمريكية الحالية فعلياً الكثير من موقف "الغرب المتوحش" الذي ميز حقبة 2021-23 - على الرغم من أن سياق البحث العلمي البحت الذي حدده قد تطور منذ ذلك الحين إلى مستويات استثمار حماسية، بل وتاريخية.

أوراق الفيديو التوليدية باعتبارها "هراء الذكاء الاصطناعي"

مع إطلاق فيديو Hunyuan وشبكة WAN بعد سلسلة فيديوهات توليدية خلال الشتاء الماضي، شهد فيديو الذكاء الاصطناعي تحولاً جذرياً بحلول عام 2025. وتجاوزت العقبات القديمة مثل صعوبة صنع صور رمزية كاملة للجسمأو من الحصول على مشاهدات ملف تعريف مقنعة شخص ما، جرفته الأمواج على ما يبدو بين عشية وضحاها.

إن الإصدارات الوفيرة من هذا النوع من الصين، والتي تتضمن أوزاناً كبيرة، يمكن القول، وقد حددت هذه التقنيات وتيرة إصدارات الفيديو التوليدية هذا العام، وهي على الأقل تشكل ضغطاً معاكساً على ميل بنى الفيديو الغربية القائمة على الذكاء الاصطناعي إلى أن تكون أكثر خضوعاً للرقابة والتسويق المسبق والتقييد.

أكثر من غياب الخندق في هذا المشهد الديمقراطي ظاهريًا بقيادة الاتحاد السوفيتي، ظهرت مئات، إن لم تكن آلاف، الشركات التي تسعى لاستغلال السوق الناشئة للاستدلال من خلال تقديم بوابات سهلة الاستخدام، مع لاعبين متنوعين مثل civit.ai و RunPod الاستفادة من الإجراءات والتقنيات التي يمكن تشغيلها في كثير من الحالات على أجهزة الكمبيوتر المنزلية.

بشكل عام، تعتبر هذه المبادرات بمثابة عمليات استغلال نقدي قصيرة الأجل تتوقع أن يتم الاستيلاء عليها من خلال توحيد السوق في نهاية المطاف (على الرغم من أن مؤسسيها، بلا شك، لن يعترضوا على الاستحواذ عن طريق الصدفة على حصة سوقية مهيمنة، إذا حدث ذلك).

وقد طالت هذه الرتابة والتكرار نفسها مجال الفيديو التوليدي في منشورات موقع Arxiv عام 2025. كما أنا لوحظ الأسبوع الماضيلقد وصلت نسبة الإشارة إلى الضوضاء لهذه الفئة إلى ذروة مذهلة، حيث يتنافس الباحثون علنًا على المبالغ الهائلة من التمويل المحتمل الذي أتاحته بلا شك إنجازات هذا العام.

مع ذلك، فإن الغالبية العظمى من هذه المشاركات لا تعدو كونها تحسينات طفيفة، في أحسن الأحوال. لم تبرز المشاكل الأساسية المتبقية في الذكاء الاصطناعي التوليدي بشكل كبير هذا العام: الحاجة إلى الحفاظ على الهوية, على غرار LoRA، طوال تصوير الشخصية؛ الحاجة إلى أوقات تشغيل أطول لمقاطع الفيديو الناتجة، مع الحفاظ على الاتساق العام (أي البيئات والمواضيع، وما إلى ذلك، وليس فقط الهوية البصرية)؛ ولتحسين توليد الصوت والتلاعب ضمن بنى الفيديو التوليدي وتحرير الفيديو؛ من بين أمور أخرى.

شبكة تخفف الحمى

لاحظتُ العام الماضي أن هذا المجال يشهد زيادة ملحوظة في عدد الأوراق البحثية التي تروج لأنظمة تستفيد من تقنية الصور المولدة بالحاسوب التقليدية (أي، تمثيلات قائمة على الشبكة (من النوع الذي يعود تاريخه إلى سبعينيات القرن العشرين)، أو دمجها في الأطر العصبيةلقد لاحظت انخفاضاً ملحوظاً في الزخم نحو الحلول القائمة على الشبكات، لا سيما في النصف الثاني من العام، على مدى عام 2025.

العديد من الحلول المدمجة بتقنية الصور المولدة بالحاسوب (CGI) في تلك الموجة السابقة من الأوراق البحثية، وخاصة تلك التي تتناول شخصيات "التحكم" البشرية البارامترية مثل نماذج ثلاثية الأبعاد قابلة للتشكيلربما تم استبدالها بالقدرات الجديدة للأطر التوليدية القائمة على الانتشار مثل Veo و Kling و Hunyuan و WAN، من بين العديد من الأدوات الأخرى.

وفي الوقت نفسه، تتناول الأوراق البحثية موضوع توزيع غاوسي ويبدو أن الأساليب قد تأثرت أيضاً إما بالركود التنموي، أو من خلال تجاوزها بواسطة أنظمة الذكاء الاصطناعي الجيني القائمة على الانتشار في عام 2025؛ أو كليهما.

قبل عام لاحظت أن الحماس الأولي للعبة GSplat، والذي جعل انطباع ملحوظ في أواخر عام 2023انحصرت الأبحاث السابقة في مجالات أضيق. أما هذا العام، فأرى سيلًا من الأوراق البحثية التي تهدف إلى معالجة متطلبات الموارد الكبيرة لهذا النهج، إلى جانب مشاكل أخرى.

على الرغم من أنني أصف تقنية Gaussian Splatting بأنها "متوقفة حاليًا"، إلا أنه يجب أن نتذكر أن هذه التقنية تعود إلى أوائل التسعينيات، وهي تقنية قديمة بطبيعتها.

أحد الاستثناءات لهذا التراجع العام عن الأساليب القائمة على الشبكات هو الزيادة الواضحة في الاهتمام بدمج الذكاء الاصطناعي في الأطر التي تهدف إلى الطباعة ثلاثية الأبعاد.

انخفاض في طلبات أمن الذكاء الاصطناعي

ملاحظتي الأخيرة لعام 2025 هي أن فئة "الأمن" في قسم علوم الحاسوب في موقع Arxiv قد شهدت انخفاضًا ملحوظًا في التكرار والجودة في عام 2025، وليس من السهل تخمين السبب.

أكثر من التشفير والأمان يمكن القول إن الأرشيف كان دائمًا مكانًا من الدرجة الثانية لنشر الأوراق البحثية، نظرًا لأن هذا الفرع من البحث يهيمن عليه بشكل غير مفاجئ الملكية الفكرية الخاصة بالقطاع الخاص - والتي لا يظهر منها إلا القليل في المجلات الأكاديمية، ولا يظهر منها أي شيء تقريبًا في المنصات المجانية مثل Arxiv.

بالإضافة إلى ذلك، تحتوي الأبحاث المنشورة في هذه الفئة على موقع Arxiv على عدد أكبر من المتوسط ​​من "الثغرات الخفية" - وهي اعترافات غير مُعلنة، غالباً ما تكون مدفونة في أماكن غير متوقعة، تُقلل أو تُضعف القيمة الظاهرية للورقة البحثية وجدّتها. ومن الأمثلة على ذلك، أسلوب اختراق أمني يبدو مثيراً، ولكنه في الواقع يعتمد على جانب "الصندوق الأبيض" - أي الوصول المميز إلى نوع من البيانات أو الإجراءات، وهو أمر يصعب على المهاجم الحصول عليه.

ماذا تتوقع في 2026

على الرغم من أن وسائل الإعلام العزف المنفرد باستمرار حول طفرة الذكاء الاصطناعي من الجيل الجديد باعتبارها تكرارًا لكارثة طفرة وانهيار شركات الإنترنت في أوائل العقد الأول من القرن الحادي والعشرين (مع بعض المعارضةيبدو أن هذا يمثل في الواقع نوعاً من الأمن الزائف. من حيث البنية التحتية والاستثمار والثقافة و تشير الأبحاث إلى أنه ربما لم يكن هناك وقت كهذا في تاريخ البشرية.

لذلك من الصعب تحديد الاتجاه الذي سيسلكه المشهد البحثي في ​​عام 2026، باستثناء أنه - كالعادة - سيبلغ عدد من الجهود طويلة الأجل ذروتها بين الآن وشهر أبريل، مع وجود "بصمة" معينة من هواجس واتجاهات عام 2025 تميزها.

من التطورات التي قد تساعد في حل أزمة حجم الأبحاث المقدمة إلى موقع Arxiv وغيره من المواقع الإلكترونية، حظر أو مراقبة الأبحاث التي يتم إنشاؤها أو الاستعانة بالذكاء الاصطناعي، سنّت منصة Arxiv مؤخراً قانوناً خاصاً بأوراق المراجعة - مع ذلك، قد يكون من الصعب تحديد مدى مشاركة الذكاء الاصطناعي في أي ورقة بحثية على حدة، لأن الذكاء الاصطناعي ثقافة البحث المتغلغلةاستعراض الأقران) بقدر ما تعدت على مجالات أخرى - كقطرة من "الحبر" التي تؤثر على كأس الماء (الموجود) بأكمله، بدلاً من تغيير الوسط بشكل جذري.

 

نُشرت لأول مرة يوم الاثنين 22 ديسمبر 2025

كاتب في مجال التعلم الآلي، متخصص في مجال تركيب الصور البشرية. رئيس سابق لمحتوى الأبحاث في Metaphysic.ai.
الموقع الشخصي: martinanderson.ai
اتصال: [البريد الإلكتروني محمي]
تويتر:manders_ai