Sudut Anderson

Pandangan Pribadi tentang Tren Literatur Penglihatan Komputer di 2025

Published December 22, 2025

Updated April 25, 2026

Martin Anderson

AI-generated image, by gpt-image-1 via ChatGPT-5.2, featuring a stylized isometric illustration of white-coated scientists in a computer laboratory.

Pengungkapan etis dan Gaussian Splatting sedang menurun, sementara volume besar makalah yang dikirimkan mewakili masalah baru bagi AI untuk diatasi di 2026.

Opini Saya telah mengikuti penelitian penglihatan komputer dan sintesis gambar di arXiv dan tempat lain selama sekitar tujuh tahun, melalui berbagai saluran – cukup lama untuk membedakan pola berulang dan pergeseran tren. Tetapi pengamatan ini bersifat anekdot. Saya secara jujur berharap saya memiliki waktu untuk mengeksploitasi korpus data yang sangat besar yang diwakili oleh aliran publikasi Arxiv saja, yang pasti kaya akan wawasan tersembunyi, menggunakan analisis pembelajaran mesin. Seperti yang ada, saya hanya dapat melaporkan lebih santai apa yang menarik perhatian saya sejak saya terakhir mempertimbangkannya.

Volume di 11

Banyak tren dalam pengiriman makalah penelitian AI yang saya amati di 2024 telah memantapkan diri sebagai fitur di 2025; tidak kurang dari ini adalah kenaikan tak terhentikan dan terus-menerus dalam volume makalah terkait AI, yang dipicu oleh AI, sampai pada titik krisis yang dirasakan:

Pengajuan Arxiv ilmu komputer bulanan, Oktober 2023-November 2025, dengan rata-rata bergulir tiga bulan yang ditumpuk. Sumber

Laju pertumbuhan ini digambarkan sebagai penggandaan eksponensial dalam volume pengiriman makalah AI, beberapa tahun yang lalu, dan telah mengambil pegangan yang lebih dalam sejak munculnya mania investasi AI telah meningkatkan taruhan, serta jumlah dana yang tersedia untuk penelitian terkait AI.

Statistik lengkap untuk 2025 belum tersedia, dan statistik agregat yang ditampilkan di atas mewakili angka umum yang meningkat di semua kategori. Di bawah ini kita dapat melihat bahwa ilmu komputer terus mengendarai tren dominan, jauh di atas rekan-rekannya:

Peningkatan pengajuan CS 2022-2025. Sumber

Menghilangkan Jerami

Pada Oktober, awal musim konferensi gugur, yang selalu membawa banjir penelitian baru, membawa malah volume pengiriman yang luar biasa, memberikan dorongan dan urgensi pada penelitian analisis tren penelitian; dengan kata lain, makalah dan repositori yang semakin muncul yang, pada dirinya sendiri, mencari untuk memotong melalui rasio sinyal-ke-bisingan yang memburuk dalam adegan penelitian.

Yang terbaru datang hanya minggu lalu, dalam bentuk NoveltyRank, sebuah makalah dan repositori GitHub yang menghaluskan LLM seperti Qwen3-4B-Instruct-2507 dan SciBERT sehingga mereka dapat melakukan klasifikasi biner makalah yang dikirimkan (memprediksi ‘kebaruan’ dari pengiriman sebelumnya), atau membandingkan kebaruan berpasangan (membandingkan pengiriman saat ini untuk ‘kebaruan’):

Sistem NoveltyRank membandingkan judul dan abstrak pengiriman dengan makalah serupa sebelumnya, meringkas perbedaannya menggunakan LLM, dan melewatinya ke model Qwen3-4B yang dihaluskan yang memutuskan apakah pekerjaan tersebut dianggap ‘konseptual baru’. Sumber

Masalah dengan pendekatan ‘penyaringan’ seperti ini adalah tantangan mendefinisikan variabel bermakna. Pendekatan NoveltyRank menggunakan penerimaan makalah ke konferensi sebagai indeks kebaruan, dan – mungkin agak meremehkan – menggunakan publikasi Arxiv sebagai indeks negatif kebaruan.

Ini menganggap dua premis palsu: pertama, bahwa semua makalah yang diterima konferensi adalah baru, atau memiliki konsekuensi, yang jelas tidak demikian; dan kedua, bahwa kebaruan itu sendiri memiliki nilai yang tidak terbatas. Siapa pun yang telah membuang setengah jam pada beberapa makalah yang spekulatif, bahkan lucu, yang dikirim – mungkin – hanya untuk mempertahankan ‘kuota terbitkan atau binasa’, akan tahu bahwa kebaruan sering kali sepele, dan pekerjaan inkremental sering kali signifikan.

Memahami nilai makalah baru melibatkan area di mana AI saat ini sangat lemah – konteks jangka panjang. Karena makalah yang sering ditulis dengan tidak jujur, makalah yang tampaknya memecahkan tanah dapat sangat sering diungkapkan sebagai kemajuan kecil pada pekerjaan yang ada; namun, sistem otomatis harus mengembangkan ‘intuisi’ untuk kasus seperti itu, tanpa menandai banyak positif palsu, dan tanpa mengandalkan kejujuran penulis pengiriman.

Etika Menurun

Seperti yang saya amati sebelumnya, portal seperti Arxiv cukup resisten terhadap laissez faire pengikisan, dan dump data yang mereka sediakan sering kali kekurangan detail granular.

Oleh karena itu, bahkan jika saya memiliki sumber daya dan waktu untuk mengunduh dan mengekstrak fitur dari potongan yang cukup representatif makalah ilmu komputer, banyak tren yang lebih halus tidak akan menjadi target atau dianalisis.

Salah satunya adalah kehadiran atau ketiadaan kodicil pernyataan etis; lama wajib inklusi untuk ilmu biologi yang menyentuh eksperimen hewan, 2024 melihat puncak tren menuju karakterisasi etis dari pekerjaan yang diusulkan, di akhir makalah yang dikirim dalam kategori Ilmu Komputer.

Secara anekdot, saya mengatakan bahwa praktik ini telah jatuh dari tebing sepanjang 2025. Teka-teki saya adalah bahwa upaya deregulasi yang gigih dari pemerintah AS saat ini, dalam kaitannya dengan pengembangan AI, telah memberikan komunitas penelitian baik di AS maupun di luar negeri, lisensi yang ditingkatkan dan rasa perlindungan hukum yang implicit.

Meskipun dukungan untuk peraturan anti-deepfake, administrasi AS saat ini secara efektif telah memulihkan banyak ‘wild west’ yang mengkarakterisasi era 2021-23 – meskipun konteks penelitian ilmiah murni yang mendefinisikannya telah berkembang menjadi investasi AI yang gigih, bahkan sejarah.

Video Generatif sebagai ‘AI Slop’

Dengan peluncuran Hunyuan Video dan WAN generatif video series pada musim dingin lalu, AI video telah sepenuhnya diubah pada 2025. Hambatan lama seperti kesulitan membuat avatar fisik lengkap, atau mendapatkan tampilan profil yang meyakinkan dari seorang manusia, disapu bersih secara tiba-tiba.

Pelepasan berat yang melimpah dari jenis ini dari Cina telah, secara argumentatif, menetapkan irama untuk pelepasan video generatif ini tahun, dan setidaknya merupakan tekanan kontra pada kecenderungan arsitektur video AI Barat untuk lebih disensor, dipasarkan, dan diresepkan.

Ketiadaan parit dalam adegan ini yang secara ironis dipimpin CCCP telah menyebabkan ratusan, jika tidak ribuan perusahaan, mencari untuk mengeksploitasi pasar yang baru muncul untuk inferensi dengan menawarkan portal ramah pengguna, dengan pemain yang beragam seperti civit.ai dan RunPod memperoleh keuntungan dari prosedur dan teknologi yang, dalam banyak kasus, dapat dijalankan pada komputer domestik.

Secara umum, inisiatif ini adalah penjarahan jangka pendek yang mengharapkan untuk diambil alih oleh konsolidasi pasar yang akhirnya (meskipun, tanpa ragu, pendiri mereka tidak akan keberatan jika mereka secara tidak sengaja menemukan pangsa pasar yang dominan, jika itu terjadi).

Kebanalisan ini dan pengulangan telah mengenai strand video generatif di pengiriman Arxiv pada 2025. Seperti yang saya amati minggu lalu, rasio sinyal-ke-bisingan untuk kategori ini telah mencapai puncak yang mematikan, karena peneliti bersaing secara terbuka untuk jumlah dana potensial yang besar yang telah dirilis oleh terobosan tahun ini.

Namun, sebagian besar pengiriman jenis ini hanyalah kemajuan inkremental, pada yang terbaik. Masalah inti yang tersisa dalam AI generatif belum muncul banyak tahun ini: kebutuhan untuk mempertahankan identitas, gaya LoRA, sepanjang penggambaran karakter; kebutuhan untuk waktu jalankan yang lebih lama untuk video output, dengan konsistensi keseluruhan (yaitu, lingkungan dan tema, dll., bukan hanya ID) dipertahankan; dan untuk perbaikan generasi audio dan manipulasi dalam arsitektur video generatif dan pengeditan video; di antara lainnya.

Demam Mesh Mereda

Saya mengamati tahun lalu bahwa adegan tersebut mengalami peningkatan yang cukup besar dalam makalah yang mempromosikan sistem yang menggunakan CGI tradisional (yaitu, representasi berbasis mesh yang berasal dari 1970-an), atau mengintegrasikannya ke dalam kerangka neural. Saya telah mengamati penurunan dorongan yang signifikan terhadap solusi berbasis mesh, terutama pada paruh kedua tahun, lebih dari 2025.

Banyak solusi CGI yang terintegrasi dalam gelombang makalah sebelumnya, terutama yang menangani ‘figur kontrol’ manusia parametri seperti model morfabel 3D, mungkin telah digantikan oleh kemampuan baru dari kerangka generatif difusi seperti Veo, Kling, Hunyuan, dan WAN, di antara lainnya.

Pada saat yang sama, makalah yang menangani pendekatan Gaussian Splat juga tampaknya telah terpengaruh oleh stagnasi perkembangan, atau karena telah digantikan oleh sistem AI generatif berbasis difusi pada 2025; atau keduanya.

Setahun yang lalu saya mencatat bahwa kegembiraan awal Gaussian Splat, yang membuat kesan yang cukup pada akhir 2023, telah mereda menjadi garis penelitian yang lebih sempit. Tahun ini, saya melihat arus makalah yang ditujukan untuk menangani tuntutan sumber daya yang signifikan dari pendekatan ini, di antara masalah lainnya.

Meskipun saya akan menggambarkan Gaussian Splatting sebagai ‘saat ini terhenti’, kita harus ingat bahwa teknologi ini berasal dari awal 1990-an, dan bersifat revenan.

Satu pengecualian untuk penarikan umum dari pendekatan berbasis mesh adalah peningkatan minat yang jelas dalam mengintegrasikan AI ke dalam kerangka yang ditujukan untuk pencetakan 3D.

Penurunan Pengiriman Keamanan AI

Pengamatan terakhir saya untuk 2025 adalah bahwa kategori ‘Keamanan’ pengiriman di bagian Ilmu Komputer di Arxiv telah menunjukkan penurunan yang cukup besar dalam frekuensi dan kualitas di 2025, dan tidak mudah untuk menebak mengapa.

Arsip Kriptografi dan Keamanan secara argumentatif selalu menjadi tempat kedua untuk memposting makalah, karena strand penelitian ini secara tidak terduga didominasi oleh IP milik swasta – sedikit dari yang muncul di jurnal akademis, dan hampir tidak ada yang terlihat di platform gratis seperti Arxiv.

Selain itu, pengiriman ke kategori ini di Arxiv memiliki jumlah ‘gotcha’ yang lebih tinggi dari rata-rata – pengakuan yang tidak dipublikasikan, sering kali dikubur di tempat yang tidak terduga, yang menyangkal atau mengurangi nilai dan kebaruan makalah yang tampak. Salah satu contoh adalah metode pelanggaran keamanan yang tampaknya sensasional yang sebenarnya bergantung pada beberapa aspek ‘white box’ – yaitu, akses istimewa ke data atau prosedur, seperti yang tidak mungkin diperoleh oleh penyerang.

Apa yang Dapat Diharapkan di 2026

Meskipun media menggambarkan secara terus-menerus ledakan AI sebagai pengulangan buble dot-com dan kegagalan pada awal tahun 2000-an (dengan beberapa perselisihan), ini sebenarnya tampaknya mewakili jenis keamanan palsu. Dalam hal infrastruktur, investasi, budaya dan penelitian, tidak pernah ada waktu seperti ini dalam sejarah manusia.

Oleh karena itu, sulit untuk melihat ke mana adegan penelitian akan berkembang di 2026, kecuali bahwa – seperti biasa – sejumlah upaya jangka panjang akan mencapai puncaknya antara sekarang dan April, dengan ‘stempel’ tren dan obsesi 2025 yang membedakan mereka.

Satu perkembangan yang mungkin membantu krisis volume pengiriman di Arxiv dan portal lainnya adalah larangan atau pemeriksaan makalah yang dihasilkan/dibantu AI, seperti Arxiv baru-baru ini mengenakan untuk makalah tinjauan – namun, sejauh mana keterlibatan AI dalam makalah tertentu mungkin terbukti sulit untuk diukur, karena AI telah menembus budaya penelitian (dan tinjauan sejawat) sama seperti yang telah menembus domain lain – seperti tetes ‘tinta’ yang mempengaruhi seluruh (yang ada) gelas air, bukan mengubah medium secara radikal.

Dipublikasikan pertama kali pada hari Senin, 22 Desember 2025

Related Topics:AI and deep research Automated Research