Andersons vinkel

En personlig syn på trender inom datorseende-litteratur 2025

Published December 22, 2025

Updated April 25, 2026

Martin Anderson

AI-generated image, by gpt-image-1 via ChatGPT-5.2, featuring a stylized isometric illustration of white-coated scientists in a computer laboratory.

Ethical disclosures och Gaussian Splatting är på nedgång, medan den ren volymen av inskickade artiklar representerar ett nytt problem för AI att hantera 2026.

Opinion Jag har följt datorseende- och bildsyntesforskning på arXiv och relaterade kanaler i ungefär sju år, över olika utgåvor – tillräckligt länge för att urskilja återkommande mönster och skiftningar i trender. Men dessa observationer är anekdotiska. Jag önskar verkligen att jag hade tid att utnyttja de väldiga korpusarna av ständigt växande data som representeras av Arxiv-publiceringsströmmen ensam, som säkert är rik på dolda insikter, med maskinlärandeanalys. Som det är kan jag bara rapportera mer informellt vad som kom till min uppmärksamhet sedan jag senast övervägde frågan.

Volym på 11

Många av trenderna inom AI-forskningspappersinskickningar som jag observerade 2024 etablerade sig som bestående delar 2025; inte minst av dessa är den outtröttliga och fortsatta ökningen av volym av AI-relaterade artiklar, i sig själv driven av AI, till den punkt där en upplevd kris:

Månatliga datavetenskapsinskickningar till Arxiv, oktober 2023-november 2025, med 3-månaders glidande medelvärde överlagrat. Källa

Denna tillväxttakt karakteriserades som en exponentiell fördubbling av volymen av AI-pappersinskickningar, flera år sedan, och den har bara tagit ett starkare grepp allteftersom den senaste AI-investeringsmani har höjt insatserna, samt den mängd finansiering som är tillgänglig för AI-relaterad forskning.

Fullständiga statistik för 2025 är inte tillgängliga ännu, och de aggregerade statistiken ovan representerar de allmänna numren som ökar över alla kategorier. Nedan kan vi se att datavetenskap fortsätter att följa en dominant trend, betydligt över dess stabila medarbetare:

2022-2025 ökning av CS-inskickningar. Källa

Sortera agnarna

I oktober, början på höstkonferenssäsongen, som alltid bringar en flod av ny forskning, bringade istället en DOS-attackliknande volym av inskickningar, vilket gav ytterligare impetus och brådska till den tidigare underbeskrivna forskningssträngen forskningsanalys; med andra ord, papper och repositorier som i sig själva försöker skära igenom den försämrade signal-till-brus-förhållandet i forskningsscenen.

Det senaste kom bara i förra veckan, i form av NoveltyRank, ett papper och GitHub-repositorium som finjusterar LLM:er som Qwen3-4B-Instruct-2507 och SciBERT så att de kan utföra binär klassificering av inskickade papper (förutsäga ‘nyhet’ från tidigare inskickningar), eller också parvisa nyhetsjämförelser (jämföra aktuella inskickningar för ‘nyhet’):

NoveltyRank-systemet jämför titeln och sammanfattningen av en inskickning med liknande tidigare papper, sammanfattar skillnaderna med hjälp av en LLM och skickar detta till en finjusterad Qwen3-4B-modell som bestämmer om arbetet räknas som ‘konceptuellt nytt’. Källa

Problemet med sådana ‘siktningar’ är utmaningen att definiera meningsfulla variabler. NoveltyRank-ansatsen använder ett pappers acceptans till konferens som en index för nyhet, och – kanske ganska förkastligt – använder Arxiv-publicering som en bakgrund-index för negativ nyhet.

Detta förutsätter två falska premisser: först, att alla konferensaccepterade inskickningar är nya eller av betydelse, vilket uppenbarligen inte är fallet; och andra, att nyhet i sig är av okvalificerad värde. Alla som har slösat bort en halvtimme på några av de spekulativa, till och med löjliga papper som inskickats – kanske – enbart för att upprätthålla ‘publicera eller dö’ – kvoter, kommer att veta att nyhet ofta är trivial, och inkrementell arbete ofta betydande.

Att förstå värdet av ett nytt papper involverar ett område där AI för närvarande är mycket svag – långsiktig kontext. Eftersom papper som verkar bana väg ofta kan avslöjas som mindre framsteg på befintligt arbete; dock kommer automatiserade system att behöva utveckla en ‘intuition’ för sådana fall, utan att flagga flera falska positiva, och utan att förlita sig på ärligheten hos de inskickande författarna.

Ethisk dykning

Som jag observerade tidigare, är portaler som Arxiv ganska resistenta mot laissez faire skrapning, och de data dumpar de tillhandahåller ofta saknar granulär detalj.

Därför, även om jag hade resurserna och tiden att ladda ner och extrahera funktioner från ett tillräckligt representativt urval av datavetenskapsartiklar, kommer många av de mer subtila trenderna inte att ha riktats eller analyserats.

En av dessa är närvaron eller frånvaron av etiska uttalanden; länge en obligatorisk inklusion för biologiska vetenskaper som berör animalisk experiment, 2024 såg toppen av trenden mot etisk karakterisering av ett föreslaget arbete, i slutet av inskickade papper i datavetenskapskategorin.

Anekdotiskt säger jag att denna praxis har fallit av en klippa under 2025. Min gissning är att de ivriga avregleringsansträngningarna från den nuvarande amerikanska regeringen, i förhållande till AI-utveckling, har gett forskarsamhället både i USA och utomlands, en viss ökad licens och känsla av implicit skydd från rättslig exponering.

Trots stöd för anti-deepfake-reglering, har den nuvarande amerikanska administrationen effektivt återställt mycket av ‘vilda västern’ -hållningen som karakteriserade 2021-23-eran – även om sammanhanget av ren vetenskaplig forskning som definierade det har sedan utvecklats till febrila, till och med historiska nivåer av investering.

Generativa videopapper som ‘AI-slop’

Med lanseringen av Hunyuan Video och WAN generativa video-serien under förra vintern, har AI-video helt förändrats 2025. Gamla hinder som svårigheten att skapa kompletta avatars, eller att få övertygande profilvyer av en person, sveptes bort uppenbarligen över natten.

De rikliga vikt-inkluderade utgåvorna av detta slag från Kina har, påstås, satt takten för generativa video-utgåvor i år, och är åtminstone en motverkande tryck på tendensen hos västerländska AI-videoarkitekturer att vara mer censurerade, förkommersialiserade och förskrivna.

Den avsaknaden av en vallgrav i denna ironiskt demokratiska CCCP-ledda scenen har lett till hundratals, om inte tusentals, företag som försöker utnyttja den nybildade marknaden för inferens genom att erbjuda användarvänliga portaler, med spelare så olika som civit.ai och RunPod som tjänar pengar på procedurer och teknologier som, i många fall, kunde köras på hemdatorer.

I allmänhet är dessa initiativ kortvariga kassagrepp som förväntar sig att bli övertagna av eventuell marknadskonsolidering (även om deras grundare säkert inte skulle ha något emot att oavsiktligt snubbla på en dominant marknadsandel, om det skulle hända).

Denna samma trivialitet och replikering har nått den generativa video-strängen i Arxiv-inskickningar 2025. Som jag observerade i förra veckan, har signal-till-brus-förhållandet för denna kategori nått en bedövande topp, eftersom forskare tävlar offentligt om de massiva mängderna potentiell finansiering som detta års genombrott säkert har släppt.

Det sagt, är den överväldigande majoriteten av inskickningar av detta slag blott inkrementella framsteg, på sin höjd. De kvarstående problemen i generativ AI har inte dykt upp mycket i år: behovet av att upprätthålla identitet, LoRA-liknande, genom hela en karaktärsskildring; behovet av längre körtider för utmatningsvideor, med sammanhållenhet (dvs. miljöer och teman etc., inte bara ID) upprätthållen; och förbättrad audiogenerering och manipulation inom generativ video och video-redigeringsarkitektur; bland andra.

Nätfeber avtar

Jag observerade i förra året att scenen upplevde en anmärkningsvärd ökning av papper som främjar system som utnyttjar traditionell CGI (dvs. nätbaserade representationer av det slag som härrör från 1970-talet), eller inkorporerar det i neurala ramverk. Jag har observerat en betydande minskning av impetus mot nätbaserade lösningar, särskilt under den senare hälften av året, under 2025.

Många av de CGI-inkorporerade lösningarna i den tidigare vågen av papper, särskilt de som hanterar parametriska mänskliga ‘kontroll’-figurer som 3D-formbara modeller, kan ha ersatts av de nya förmågorna hos diffusion-baserade generativa ramverk som Veo, Kling, Hunyuan och WAN, bland många andra.

Samtidigt har papper som hanterar Gaussian Splat -metoder tydligen påverkats antingen av utvecklingsstagnation eller genom att bli överskuggade av 2025 års diffusion-baserade gen AI-system; eller båda.

Jag skulle karakterisera Gaussian Splatting som ‘för närvarande stagnerad’, men vi bör komma ihåg att denna teknik går tillbaka till början av 1990-talet, och är återkommande av naturen.

En undantag från denna allmänna reträtt från nätbaserade metoder är en uppenbar ökning av intresse för att inkorporera AI i ramverk som syftar till 3D-utskrifter.

Minskning i AI-säkerhetsinskickningar

Min sista observation för 2025 är att ‘Säkerhets’-inskickningarna i datavetenskapssektionen på Arxiv har visat en anmärkningsvärd minskning i frekvens och kvalitet under 2025, och det är inte lätt att gissa varför.

Den kryptografi och säkerhetsarkiv har troligen alltid varit en andra klassens plats att publicera papper, eftersom denna sträng av forskning är oförklarligt dominerad av privat sektors proprietär IP – lite av vilket dyker upp i akademiska tidskrifter, och nästan ingen av vilken syns i fria plattformar som Arxiv.

Dessutom har inskickningar till denna kategori på Arxiv ett högre än genomsnittligt antal ‘gotchas’ – under-spelade medgivanden, ofta begravda på oväntade platser, som negarerar eller minskar det uppenbara värdet och nyheten i papperet. Ett exempel skulle vara en uppenbarligen sensationell säkerhetskränkningsmetod som faktiskt förlitar sig på någon ‘white box’-aspekt – dvs. privilegerad tillgång till data eller procedurer, som en angripare inte sannolikt kunde säkra.

Vad att förvänta i 2026

Även om media riffar konstant på Gen AI-boomen som en upprepning av dot.com-boomen och -bust-debaclet i början av 2000-talet (med något dissens), verkar detta faktiskt representera en sorts falsk säkerhet. I termer av infrastruktur, investering, kultur och forskning, har det inte funnits en sådan tid som denna i mänsklighetens historia.

Därför är det svårt att se vilken väg forskningsscenen kommer att trenda i 2026, utom att – som vanligt – ett antal långsiktiga ansträngningar kommer att kulminera mellan nu och april, med ett visst ‘stämpel’ av 2025 års besatthet och trender som kännetecknar dem.

En utveckling som kan hjälpa inskickningsvolymkrisen på Arxiv och andra portaler är ett förbud eller kontroll på AI-genererade/understödda papper, som Arxiv nyligen antog för översiktsartiklar – men omfattningen av AI:s inblandning i något papper kan visa sig svår att kvantifiera, eftersom AI har trängt in i forskningskulturen (och peer-granskning) lika mycket som det har trängt in i andra områden – som en droppe ‘bläck’ som påverkar hela (befintliga) glaset vatten, snarare än att radikalt förändra mediet.

Publicerad första gången måndagen den 22 december 2025

Related Topics:AI and deep research Automated Research