Anslut dig till vÄrt nÀtverk!

Andersons vinkel

Ett personligt perspektiv pÄ datorvisionslitteraturtrender 2025

mm
AI-genererad bild, av gpt-image-1 via ChatGPT-5.2, med en stiliserad isometrisk illustration av vitklÀdda forskare i ett datalaboratorium.

Etiska upplysningar och Gaussisk splatting minskar, medan den stora volymen av inlÀmnade artiklar representerar ett nytt problem för AI att ta itu med Är 2026.

 

Yttrande Jag har följt forskning om datorseende och bildsyntes pĂ„ arXiv och relaterade forum i ungefĂ€r sju Ă„r, pĂ„ olika sĂ€tt – tillrĂ€ckligt lĂ€nge för att kunna urskilja Ă„terkommande mönster och trendförĂ€ndringar. Men dessa observationer Ă€r anekdotiska. Jag önskar Ă€rligt talat att jag hade tid att utnyttja den stora mĂ€ngden stĂ€ndigt vĂ€xande data som representeras av Arxiv-publikationsflödet ensamt, vilket sĂ€kerligen Ă€r rikt pĂ„ dolda insikter, med hjĂ€lp av maskininlĂ€rningsanalys. Som det ser ut nu kan jag bara rapportera mer nonchalant vad som kom till min kĂ€nnedom. sedan jag senast övervĂ€gde saken.

Volym vid 11

MÄnga av de trender i AI-forskningsrapporter som jag observerade under 2024 etablerade sig som ingÄngar under 2025; inte minst av dessa Àr den obevekliga och fortsatta ökningen av volym av AI-relaterade artiklar, i sig drivna av AI, till den grad att en upplevd kris:

MĂ„natliga inlĂ€mningar till Arxiv-rapporten om datavetenskap, oktober 2023–november 2025, med 3-mĂ„naders rullande medelvĂ€rde överlagrat. KĂ€lla: https://arxiv.org/stats/monthly_submissions

MĂ„natliga inlĂ€mningar till datavetenskapliga Arxiv-rapporter, oktober 2023–november 2025, med 3-mĂ„naders rullande medelvĂ€rde överlagrat. KĂ€lla

Denna tillvÀxttakt karakteriserades som en exponentiell fördubbling av volymen av AI-rapporter, mÄnga Är sedan, och det har bara fÄtt ett djupare fÀste i takt med den senaste tidens tillkomst av AI-investeringsmani har ökat insatserna, liksom mÀngden tillgÀnglig finansiering för AI-relaterad forskning.

FullstÀndig statistik för 2025 Àr Ànnu inte tillgÀnglig, och den aggregerade statistiken som visas ovan representerar de generella siffrorna som ökar inom alla kategorier. Nedan kan vi se att datavetenskap fortsÀtter att dominera trenden, betydligt högre Àn sina stallkamrater:

Ökning av inskickade data frĂ„n CS under 2022–2025. KĂ€lla – https://info.arxiv.org/about/reports/submission_category_by_year.html

Ökning av inskickade databasstudier 2022-2025. KĂ€lla

Sortera agnarna

I oktober, starten av höstens konferenssÀsong, som alltid för med sig en flod av ny forskning, förde istÀllet en DOS-attacknivÄvolym av inskickade bidragvilket ger ytterligare drivkraft och brÄdska Ät den hittills undertecknade forskningsdelen av analys av forskningstrenderMed andra ord dyker det alltmer upp artiklar och databaser som i sig sjÀlva försöker minska det försÀmrade signal-brus-förhÄllandet inom forskningsscenen.

Det senaste kom sÄ sent som förra veckan, i form av Nyhetsrankning, en papper och GitHub repository som finjusterar LLM:er som Qwen3-4B-Instruktion-2507 och SciBERT sÄ att de kan utföra binÀr klassificering av inskickade artiklar (förutsÀga "nyhet" utifrÄn tidigare bidrag), eller parvis jÀmförelse av nyhet (jÀmföra nuvarande bidrag för "nyhet"):

NoveltyRank-systemet jÀmför titel och sammanfattning av en inlÀmning med liknande tidigare uppsatser, sammanfattar skillnaderna med hjÀlp av en LLM och skickar detta till en finjusterad Qwen3-4B-modell som avgör om arbetet rÀknas som "konceptuellt nytt". KÀlla - https://arxiv.org/pdf/2512.14738

NoveltyRank-systemet jÀmför titel och sammanfattning av en inlÀmning med liknande tidigare uppsatser, sammanfattar skillnaderna med hjÀlp av en LLM och skickar detta till en finjusterad Qwen3-4B-modell som avgör om arbetet rÀknas som "konceptuellt nytt". KÀlla

Problemet med sĂ„dana "sĂ„llningsmetoder" Ă€r utmaningen med definiera meningsfulla variablerNoveltyRank-metoden anvĂ€nder en artikels acceptans för konferenser som ett index för nyhet, och – kanske ganska avfĂ€rdande – anvĂ€nder Arxiv-publicering som ett bakgrundsindex för negativ nyhet.

Detta förutsĂ€tter tvĂ„ felaktiga premisser: för det första att alla konferensgodkĂ€nda bidrag Ă€r nya, eller av betydelse, vilket uppenbarligen inte Ă€r fallet; och för det andra att nyheten i sig Ă€r av ovillkorligt vĂ€rde. Den som har slösat en halvtimme pĂ„ nĂ„gra av de tveksamma, till och med löjliga, artiklar som lĂ€mnats in – kanske – enbart för att vidhĂ„lla "Publicera eller förgĂ„s"-kvoter, kommer att veta att nyhet ofta Ă€r trivial och inkrementellt arbete ofta betydelsefullt.

Att förstĂ„ vĂ€rdet av en ny artikel involverar ett omrĂ„de dĂ€r AI för nĂ€rvarande anvĂ€nds vĂ€ldigt svag – lĂ„ngsiktig sammanhangPĂ„ grund av det ofta oĂ€rliga sĂ€ttet de skrivs pĂ„ kan artiklar som verkar banbrytande ofta avslöjas som mindre framsteg i befintligt arbete; automatiserade system mĂ„ste dock utveckla en "intuition" för sĂ„dana fall, utan att flagga flera falska positiva resultat och utan att förlita sig pĂ„ de inskickade författarnas Ă€rlighet.

Etiskt dyk

Som jag har observerat tidigare, portaler som Arxiv Àr ganska motstÄndskraftiga mot laissez faire skrapning, och de datadumpar de tillhandahÄller saknar ofta detaljerad information.

DÀrför, Àven om jag hade haft resurser och tid att ladda ner och extrahera funktioner frÄn ett tillrÀckligt representativt tvÀrsnitt av datavetenskapliga artiklar, kommer mÄnga av de mer subtila trenderna inte att ha blivit inriktade pÄ eller analyserade.

En av dessa Àr nÀrvaron eller frÄnvaron av etiska uttalandenlÄng en obligatorisk inkludering Inom biologiska vetenskaper som berör djurförsök nÄddes kulmen 2024 för trenden mot etisk karakterisering av ett föreslaget arbete, i slutet av antalet inlÀmnade artiklar i kategorin datavetenskap.

Anekdotiskt sÀger jag att denna praxis har fallit utför under 2025. Min gissning Àr att den nuvarande amerikanska regeringens ivriga avregleringsanstrÀngningar, i relation till AI-utveckling, har gett forskarsamhÀllet bÄde i USA och utomlands, en viss ökad licens och en kÀnsla av implicit skydd frÄn rÀttslig exponering.

Trots dess stödja NĂ€r det gĂ€ller reglering mot deepfakes har den nuvarande amerikanska administrationen effektivt Ă„terstĂ€llt mycket av den "vilda vĂ€stern"-hĂ„llning som kĂ€nnetecknade eran 2021-23 – Ă€ven om det sammanhang av ren vetenskaplig forskning som definierade den sedan dess har utvecklats till innerliga, till och med historiska, investeringsnivĂ„er.

Generativa videorapporter som 'AI-slöj'

Med lanseringen av Hunyuan Video och WAN generativa videoserier under förra vintern, AI-video har helt förÀndrats Är 2025. Gamla vÀgspÀrrar som svÄrigheten att skapa avatarer med komplett fysik, eller av fÄ övertygande profilvisningar av en person, sveptes bort till synes över en natt.

De rikliga viktinkluderade utgÄvorna av detta slag frÄn Kina har, det kan argumenteras att, satte takten för generativa videoslÀpp i Är, och Àr Ätminstone ett motverkande tryck pÄ tendensen hos vÀsterlÀndska AI-videoarkitekturer att vara betydligt mer censurerade, förkommersialiserade och föreskrivna.

Ocuco-landskapet avsaknad av vallgrav i denna ironiskt nog demokratiska CCCP-ledda scen har lett till hundratals, om inte tusentals, företag som försöker utnyttja den gryende marknaden för slutledningar genom att erbjuda anvÀndarvÀnliga portaler, med aktörer sÄ olika som civit.ai och RunPod att dra nytta av procedurer och tekniker som i mÄnga fall skulle kunna köras pÄ inhemska datorer.

I allmÀnhet Àr dessa initiativ kortsiktiga kapitalinsatser som förvÀntas uppvÀgas av eventuell marknadskonsolidering (Àven om deras grundare utan tvekan inte skulle ha nÄgot emot att av misstag snubbla över en dominerande marknadsandel, om det skulle intrÀffa).

Samma vardaglighet och replikering har drabbat den generativa videostrÀngen i Arxivs bidrag Är 2025. Som jag observerades förra veckan, signal-brusförhÄllandet för denna kategori har nÄtt en bedövande topp, dÄ forskare tÀvlar offentligt om de enorma mÀngder potentiell finansiering som Ärets genombrott utan tvekan har frigjort.

Med det sagt Àr den stora majoriteten av den hÀr typen av bidrag i bÀsta fall bara stegvisa framsteg. De kÀrnproblem som kvarstÄr inom generativ AI har inte kommit till ytan sÀrskilt mycket i Är: behovet av att behÄlla identiteten, LoRA-stil, genom hela en karaktÀrsskildring; behovet av lÀngre speltider för utgÄende videor, med bibehÄllen övergripande konsistens (dvs. av miljöer och teman, etc., inte bara ID); och för förbÀttrad ljudgenerering och manipulation inom generativa video- och videoredigeringsarkitekturer; bland annat.

Meshfeber avtar

Jag observerade förra Äret att scenen upplevde en mÀrkbar ökning av tidningar som marknadsför system som utnyttjar traditionell CGI (dvs. nÀtbaserade representationer av den sorten som hÀrstammar frÄn 1970-talet), eller integrera det i neurala ramverkJag har observerat en betydande minskning av drivkraften mot mesh-baserade lösningar, sÀrskilt under senare halvan av Äret, under 2025.

MÄnga av de CGI-inkorporerade lösningarna i den tidigare vÄgen av artiklar, sÀrskilt de som handlar om parametriska mÀnskliga "kontroll"-figurer som 3D-morfbara modeller, kan ha ersatts av de nya funktionerna hos diffusionsbaserade generativa ramverk som Veo, Kling, Hunyuan och WAN, bland mÄnga andra.

Samtidigt, dokument som handlar om Gaussisk Splat tillvÀgagÄngssÀtt har tydligen ocksÄ pÄverkats antingen av utvecklingsstagnation, eller genom att ha överskuggats av 2025 Ärs diffusionsbaserade generationens AI-system; eller bÄda.

För ett Är sedan noterade jag att den inledande spÀnningen kring GSplat, vilket gjorde en anmÀrkningsvÀrt intryck i slutet av 2023, hade sjunkit ner i snÀvare forskningsinriktningar. I Är ser jag en ström av artiklar som syftar till att ta itu med de betydande resurskraven för denna metod, bland andra problem.

Även om jag skulle karakterisera Gaussisk Splatting som "för nĂ€rvarande avstannad", bör vi komma ihĂ„g att den hĂ€r tekniken gĂ„r tillbaka till början av 1990-talet och Ă€r revoltant till sin natur.

Ett undantag frÄn denna allmÀnna retrÀtt frÄn nÀtbaserade tillvÀgagÄngssÀtt Àr ett uppenbart ökat intresse för att integrera AI i ramverk som syftar till 3D-utskrift.

Minskning av AI-sÀkerhetsinlÀmningar

Min sista observation för 2025 Àr att kategorin "SÀkerhet" i datavetenskapssektionen pÄ Arxiv har uppvisat en mÀrkbar minskning av frekvens och kvalitet under 2025, och det Àr inte lÀtt att gissa varför.

Ocuco-landskapet Kryptografi och sĂ€kerhet Arkiv har utan tvekan alltid varit en andra klassens plats att publicera artiklar, eftersom denna forskningsgren föga förvĂ„nande domineras av privat sektors proprietĂ€ra IP – varav lite dyker upp i akademiska tidskrifter, och nĂ€stan inget av det syns pĂ„ gratis plattformar som Arxiv.

Dessutom har bidrag till denna kategori pĂ„ Arxiv ett högre Ă€n genomsnittet antal "gotchas" – underskattade medgivanden, ofta begravda pĂ„ ovĂ€ntade platser, som förnekar eller minskar uppsatsens skenbara vĂ€rde och nyhet. Ett exempel skulle vara en till synes sensationell sĂ€kerhetsintrĂ„ngsmetod som faktiskt förlitar sig pĂ„ nĂ„gon form av "vit lĂ„da" – dvs. privilegierad Ă„tkomst av nĂ„got slag till data eller procedurer, som en angripare sannolikt inte skulle kunna sĂ€kra.

Vad man kan förvÀnta sig under 2026

Även om media Ă€r riffande stĂ€ndigt om Gen AI-boomen som en upprepning av dot.com-boomen och -kraschen frĂ„n början av 2000-talet (med viss oliktĂ€nkande), verkar detta faktiskt representera en sorts falsk trygghet. NĂ€r det gĂ€ller infrastruktur, investeringar, kultur och forskning, har det förmodligen inte funnits en sĂ„dan tid som denna i mĂ€nsklighetens historia.

DĂ€rför Ă€r det svĂ„rt att se Ă„t vilket hĂ„ll forskningsscenen kommer att utvecklas under 2026, förutom att – som vanligt – ett antal lĂ„ngsiktiga insatser kommer att kulminera mellan nu och april, med en viss "prĂ€gel" av 2025 Ă„rs besattheter och trender som utmĂ€rker dem.

En utveckling som kan hjĂ€lpa till med krisen med inlĂ€mningsvolymer pĂ„ Arxiv och andra portaler Ă€r ett förbud mot eller kontroll av AI-genererade/stödda dokument, eftersom Arxiv nyligen antagen för granskningsartiklar – omfattningen av AI:s inblandning i en enskild artikel kan dock visa sig svĂ„r att kvantifiera, eftersom AI har penetrerad forskningskultur (Och Peer review) hur mycket det Ă€n har inkrĂ€kta pĂ„ andra domĂ€ner – som en droppe "blĂ€ck" som pĂ„verkar hela (det befintliga) vattenglaset, snarare Ă€n att radikalt förĂ€ndra mediet.

 

Första gÄngen publicerad mÄndagen den 22 december 2025

Skribent pÄ maskininlÀrning, domÀnspecialist pÄ mÀnsklig bildsyntes. Tidigare chef för forskningsinnehÄll pÄ Metaphysic.ai.
Personlig sida: martinanderson.ai
Kontakt: [e-postskyddad]
Twitter: @manders_ai