Connect with us

Bilgisayar Görme Edebiyatı Eğilimlerine Kişisel Bir Bakış 2025

Anderson’un Açısı

Bilgisayar Görme Edebiyatı Eğilimlerine Kişisel Bir Bakış 2025

mm
AI-generated image, by gpt-image-1 via ChatGPT-5.2, featuring a stylized isometric illustration of white-coated scientists in a computer laboratory.

Etik jika açıklamaları ve Gauss Splatting azalmakta, ancak gönderilen makalelerin muazzam hacmi, 2026’da AI’ın ele alması gereken yeni bir sorun teşkil etmektedir.

 

Opinion Bilgisayar görme ve görüntü sentezleme araştırmalarını yaklaşık yedi yıl boyunca arXiv ve ilgili mecralarda takip ettim – çeşitli kanallardan – tekrar eden kalıpları ve eğilimlerdeki değişiklikleri ayırt etmeye yetecek kadar uzun. Ancak bu gözlemler anlatımsaldır. Arxiv yayın akışının temsil ettiği sürekli büyüyen verilerin muazzam corporasını, ki bu kesinlikle gizli bilgilerle doludur, makine öğrenimi analizi kullanarak değerlendirmek için zamanım olsaydı içten içe isterdim. Şimdilik sadece daha casual bir şekilde, son olarak bu konuyu ele aldığım zaman neler geldiğine dikkat çekebilirim.

Hacim 11’de

2024’te gözlemlediğim AI araştırma makale gönderme eğilimlerinin çoğu, 2025’te kendilerini kalıcı olarak kurdu; bunların en azı AI ile güçlendirilen AI ile ilgili makalelerin hacminin sürekli ve kaçınılmaz yükselişi – bu, algılanan bir kriz noktasına ulaştı:

Aylık bilgisayar bilimi Arxiv gönderileri, Ekim 2023-Kasım 2025, üzerine 3 aylık hareketli ortalama. Kaynak: https://arxiv.org/stats/monthly_submissions

Aylık bilgisayar bilimi Arxiv gönderileri, Ekim 2023-Kasım 2025, üzerine 3 aylık hareketli ortalama. Kaynak

Bu büyüme oranı, AI makale gönderilerinin hacminin birkaç yıl önce üslü bir şekilde iki katına çıkması olarak karakterize edildi ve AI yatırım manisinin recent adventı ile birlikte bahsi geçen paylar ve AI ile ilgili araştırmalar için mevcut fon miktarı arttıkça daha da derinleşti.

2025 için tam istatistikler henüz mevcut değil ve yukarıdaki gösterilen toplu istatistikler genel olarak tüm kategorilerdeki artışı temsil etmektedir. Aşağıda bilgisayar biliminin diğerlerinden daha dominant bir eğilim izlediğini görebiliriz:

2022-2025 bilgisayar bilimi gönderileri artışı. Kaynak - https://info.arxiv.org/about/reports/submission_category_by_year.html

2022-2025 bilgisayar bilimi gönderileri artışı. Kaynak

Samana Ayırma

Ekim ayında, her zaman yeni araştırmaların sel gibi geldiği sonbahar konferans sezonunun başlangıcında, bir DOS-saldırı düzeyinde bir gönderi hacmi vardı, bu da araştırmaların daha önce az ilgi gören bir dalı olan araştırma eğilimi analizi için daha da büyük bir aciliyet ve önem kazandırdı; diğer bir deyişle, kendileri zaten araştırma sahnesindeki kötüleşen sinyal-gürültü oranını kesmek için ortaya çıkan ve geliştirilen makaleler ve depolar artmaktadır.

En sonuncusu, sadece geçen hafta, NoveltyRank adlı bir makale ve GitHub deposu şeklinde geldi; bu, LLM’leri (Ör. Qwen3-4B-Instruct-2507 ve SciBERT) gönderilen makalelerin ikili sınıflandırmasını gerçekleştirebilmeleri için (önceki gönderilerden ‘yeniği’ tahmin etme) veya çift yönlü yeniği karşılaştırması (gönderilerin ‘yeniğini’ karşılaştırma) için fine-tune etmektedir:

NoveltyRank sistemi, bir gönderinin başlığını ve özetini benzer geçmiş makalelerle karşılaştırır, farklılıkları bir LLM kullanarak özetler ve bunu bir fine-tune Qwen3-4B modeline geçirir ve bu, çalışmanın 'kavramsal olarak yeni' olup olmadığını kararlaştırır. Kaynak - https://arxiv.org/pdf/2512.14738

NoveltyRank sistemi, bir gönderinin başlığını ve özetini benzer geçmiş makalelerle karşılaştırır, farklılıkları bir LLM kullanarak özetler ve bunu bir fine-tune Qwen3-4B modeline geçirir ve bu, çalışmanın ‘kavramsal olarak yeni’ olup olmadığını kararlaştırır. Kaynak

Bu tür ‘eleme’ yaklaşımlarının sorunu, anlamlı değişkenleri tanımlama zorluğudur. NoveltyRank yaklaşımı, bir makalenin konferansa kabul edilmesini yeniğin bir göstergesi olarak kullanır ve – belki de biraz küçümseyerek – Arxiv yayını, olumsuz yeniğin bir arka plan göstergesi olarak kullanır.

Bu, iki yanlış öncülü varsayar: önce, tüm konferans kabul edilen gönderilerin yeni veya önemli olduğu; ikincisi, yeniğin kendisinin sınırsız bir değeri olduğu. Bazı gönderileri – belki de sadece ‘yayın ya da yok ol’ kotalarını ‘koruma amacıyla – gönderenlerin saçma, hatta komik bulacağı kimseler, yeniğin genellikle önemsiz ve artımsal çalışma genellikle önemli olduğunu bilir.

Bir yeni makalenin değerini anlamak, AI’ın şu anda çok zayıf olduğu bir alana girer – uzun vadeli bağlam. Makaleler souvent-dishonest bir şekilde yazıldığından, zemin kıran gibi görünenler aslında mevcut çalışmalarda küçük ilerlemeler olabilir; ancak, otomatik sistemler, bu durumlarda bir ‘sezgi’ geliştirmelidir, çoklu yanlış pozitifleri işaretlemeksizin ve gönderen yazarların dürüstlüğüne güvenmeksizin.

Etik Plunge

Önce de gözlemlediğim gibi, arXiv gibi portallar laissez faire kazıma karşı oldukça dirençlidir ve sağladıkları veri dökümleri genellikle ince ayrıntı içermemektedir.

Dolayısıyla, yeterli kaynak ve zamanım olsaydı, bilgisayar bilimi makalelerinin yeterli bir temsilini indirip özelliklerini çıkarсам da, birçok daha ince eğilim hedeflenmemiş veya analiz edilmemiş olacaktır.

Bunlardan biri, etik beyan ekleri varlığı veya yokluğudur; uzun bir süre biyolojik bilimler için zorunlu bir içerik olan hayvan deneysel çalışmaları içeren, 2024’te Bilgisayar Bilimi kategorisindeki gönderilerde önerilen bir çalışmanın etik karakterizasyonuna doğru bir eğilim görüldü.

Anlatımsal olarak, bu uygulamanın 2025 boyunca bir uçurumdan düştüğünü söyleyebilirim. Tahminim, AI geliştirme ile ilgili current ABD hükümetinin deregülasyon çabalarının, araştırma topluluğuna hem ABD’de hem de yurtdışında, yasal sorumluluktan implicit bir koruma ve artan bir lisans vermiş olabileceği yönündedir.

AI sahtecilik düzenlemesi karşıtı desteğine rağmen, current ABD yönetimi, 2021-23 döneminde karakterize edilen ‘vahşi batı’ tavrının çoğunu etkili bir şekilde restore etti -尽管 bu, saf bilimsel araştırma bağlamından, şimdi tarihi düzeyde AI yatırımlarına evrilmiştir.

Generative Video Papers as ‘AI Slop’

Geçen kış, Hunyuan Video ve WAN generatif video serisinin lansmanıyla birlikte, AI video 2025’te tamamen değişti. Tam vücut avatarlarının yapımındaki zorluk veya bir kişinin inandırıcı profil görüntülerini elde etme gibi eski engeller, apparent olarak bir gecede ortadan kaldırıldı.

Bu tür ağırlıklı yayınların Çin’den gelen bolluğu, iddia edildiği gibi, bu yılki generatif video yayınları için bir karşı baskı oluşturdu ve batı AI video mimarilerinin daha sansürlü, ticari önceliği olan ve reçeteli olmasına karşı bir baskı oluşturdu.

Bu sahnedeki hiçbir engel olmaması, yüzlerce, hatta binlerce şirketin, kullanıcı dostu portallar sunarak, AI video çıkarımı için gelişen pazarı sömürmeye çalışmasına neden oldu; bu şirketler arasında civit.ai ve RunPod gibi çeşitli oyuncular yer alıyor.

Genel olarak, bu girişimler, kısa vadeli nakit kazanma amaçlıdır ve eventual bir piyasa konsolidasyonu tarafından yerlerinden edileceklerini beklemektedirler (ancak, şüphesiz, onların kurucuları, yanlışlıkla dominant bir piyasa payına rastlarsa, buna itiraz etmeyeceklerdir).

Bu aynı sıradanlık ve tekrarlanma, 2025’te Arxiv’in gönderilerindeki generatif video dalına da ulaştı. Geçen hafta gözlemlediğim gibi, bu kategori için sinyal-gürültü oranı, araştırmacıların bu yılın đột phálarından muhtemelen serbest bırakılan muazzam miktarlardaki potansiyel fon için yarışırken, bir uyuşukluğa ulaştı.

Bununla birlikte, bu tür gönderilerin çoğu, en iyimser halde, yalnızca artımsal ilerlemelerdir. Generatif AI’da kalan temel sorunlar, bu yıl fazla yüzeye çıkmadı: bir karakter betimlemesinde, kimliği koruma, LoRA-stil olarak; daha uzun çalışma zamanları için çıktı videoları, tutarlılık (yani, çevre ve tema gibi) korunurken; ve generatif video ve video düzenleme mimarilerindeki ses oluşturma ve manipülasyonu gibi.

Mesh Ateşi Azalıyor

Geçen yıl, sahnenin geleneksel CGI (yani, 1970’lerden kalma mesh tabanlı temsil) kullanan veya bunları nöral frameworklere entegre eden sistemleri tanıtan makalelerde önemli bir artış yaşandığını gözlemledim. 2025’in ikinci yarısında, özellikle mesh tabanlı çözümlere doğru bir ivme kaybı gözlemledim.

Bu önceki dalgadaki birçok CGI entegre çözümü, özellikle 3D morphable modeller gibi parametrik insan ‘kontrol’ figürleriyle ilgili olanlar, muhtemelen Veo, Kling, Hunyuan ve WAN gibi difüzyon tabanlı generatif frameworklerin yeni yetenekleri tarafından bertaraf edildi veya geride bırakıldı.

Gaussian Splat yaklaşımı ile ilgili makaleler de, gelişimsel durgunluk veya 2025’in difüzyon tabanlı gen AI sistemleri tarafından geride bırakılma nedeniyle etkilenmiş gibi görünüyor.

Gaussian Splatting’i ‘şu anda durmuş’ olarak karakterize edeceğim, ancak bu teknolojinin 1990’ların başlarına dayandığını ve doğası gereği tekrar ortaya çıkan bir teknoloji olduğunu unutmamalıyız.

Mesh tabanlı yaklaşımlardan geri çekilmenin genel bir istisnası, 3D yazıcıya yönelik frameworklere AI entegrasyonuna ilgi artışıdır.

AI Güvenlik Gönderilerinde Azalma

2025 için son gözlemim, Bilgisayar Bilimi bölümündeki ‘Güvenlik’ gönderileri kategorisinin Arxiv’de sıklık ve kalite açısından önemli bir düşüş gösterdi ve nedenini tahmin etmek kolay değil.

Kriptografi ve Güvenlik arşivi, bu araştırma dalının özel sektör tarafından sahip olunan fikri mülkiyet tarafından domine edildiği için, doğal olarak, akademik dergilerde ortaya çıkan ve ücretsiz platformlarda görünenlerin çok azı için her zaman ikinci sınıf bir yer oldu.

Ek olarak, bu kategoriye yapılan gönderiler, Arxiv’deki diğerlerine göre daha yüksek bir ‘gotcha’ sayısına sahiptir – genellikle beklenmedik yerlerde gizlenen, makalenin apparent değerini ve yeniğini azaltan veya negatif olan itirafname.

2026’da Neler Bekleyebilirsiniz

Medya, AI boom’unu sürekli riffing olarak early noughties’in dot-com boom-and-bust felaketinin bir tekrarı olarak görse de (bazı itiraz ile), bu aslında bir tür yanlış güvenlik gibi görünüyor. Altyapı, yatırım, kültür ve araştırma açısından, insanlık tarihinde böyle bir zaman hiç olmadı.

Dolayısıyla, 2026’da araştırma sahnesinin hangi yöne gideceğini görmek zor, ancak -usual olarak- uzun vadeli birçok çaba, 2025’in obsesyonları ve eğilimlerinin belirli bir ‘damgasını’ taşıyarak, şimdi ve Nisan arasında sonuçlanacak.

Arxiv ve diğer portallardaki gönderi hacmi krizine yardımcı olabilecek bir gelişme, AI tarafından üretilen veya destekli makalelere karşı bir yasak veya kontrol olabilir, Arxiv’in inceleme makaleleri içinrecent olarak yürürlüğe koyduğu gibi; ancak herhangi bir makaledeki AI’ın katılımının kapsamını ölçmek zor olabilir, çünkü AI, araştırma kültürüne (ve hakem değerlendirmesine) nüfuz etti – diğer alanlara olduğu gibi.

 

İlk olarak 22 Aralık 2025 Pazartesi günü yayımlandı

Makine öğrenimi üzerine yazar, insan görüntü sentezinde alan uzmanı. Metaphysic.ai'de eski araştırma içeriği başkanı.
Kişisel site: martinanderson.ai
İletişim: [email protected]