Anderson's hoek
Een persoonlijke kijk op trends in de literatuur over computer vision in 2025

Het aantal ethische openbaarmakingen en Gaussian Splatting neemt af, terwijl de enorme hoeveelheid ingediende artikelen een nieuw probleem vormt waar AI in 2026 mee te maken krijgt.
Advies Ik volg al zo'n zeven jaar onderzoek naar computervisie en beeldsynthese op arXiv en aanverwante platforms, via verschillende kanalen – lang genoeg om terugkerende patronen en verschuivingen in trends te herkennen. Maar deze observaties zijn anekdotisch. Ik zou graag de tijd hebben om de enorme hoeveelheid steeds groeiende data die alleen al via de publicaties op arXiv beschikbaar is, te benutten – data die ongetwijfeld rijk is aan verborgen inzichten – met behulp van machine learning-analyse. Zoals de zaken er nu voor staan, kan ik slechts vluchtig rapporteren wat mijn aandacht heeft getrokken. sinds ik de zaak voor het laatst heb overwogen..
Volume op 11
Veel van de trends in het aantal ingediende AI-onderzoekspapers die ik in 2024 waarnam, bleken ook in 2025 vast te staan; een van de belangrijkste is de onstuitbare en voortdurende stijging van volume van AI-gerelateerde publicaties, die zelf weer door AI worden gevoed, tot het punt van een waargenomen crisis:

Maandelijkse inzendingen op ArXiv over computerwetenschappen, oktober 2023-november 2025, met een voortschrijdend gemiddelde over 3 maanden eroverheen.. Bron
Deze groei werd gekarakteriseerd als een exponentiële verdubbeling van het aantal ingediende AI-papers. een aantal jaar geledenen het heeft alleen maar meer grip gekregen door de recente opkomst van AI-investeringsmanie Dit heeft de lat hoger gelegd, evenals de hoeveelheid financiering die beschikbaar is voor AI-gerelateerd onderzoek.
De volledige statistieken voor 2025 zijn nog niet beschikbaar, en de bovenstaande geaggregeerde statistieken geven de algemene stijging in alle categorieën weer. Hieronder zien we dat informatica een dominante trend blijft volgen, met een aanzienlijke voorsprong op de andere vakgebieden:

Stijging van het aantal inzendingen voor computerwetenschappelijke opleidingen tussen 2022 en 2025. Bron
Het kaf scheiden
In oktober, de start van het najaarsconferentieseizoen, dat normaal gesproken een stortvloed aan nieuw onderzoek met zich meebrengt, kwam er in plaats daarvan een... Volume aan inzendingen op DOS-aanvalsniveauwaardoor de tot nu toe onderbelichte onderzoekslijn extra impuls en urgentie krijgt. analyse van onderzoekstrendsMet andere woorden: er verschijnen steeds meer publicaties en databanken die er zelf naar streven de steeds slechter wordende signaal-ruisverhouding in het onderzoekslandschap te verbeteren.
De meest recente kwam pas vorige week, in de vorm van Nieuwheidsrang, een papier en GitHub-repository die LLM's zoals verfijnt Qwen3-4B-Instructie-2507 en SciBERT zodat ze een binaire classificatie van ingediende artikelen kunnen uitvoeren (het voorspellen van 'nieuwigheid' op basis van eerdere inzendingen), of een paarsgewijze vergelijking van nieuwigheid (het vergelijken van huidige inzendingen op 'nieuwigheid'):

Het NoveltyRank-systeem vergelijkt de titel en het abstract van een inzending met vergelijkbare eerdere publicaties, vat de verschillen samen met behulp van een LLM en geeft dit door aan een verfijnd Qwen3-4B-model dat bepaalt of het werk als 'conceptueel nieuw' kan worden beschouwd. Bron
Het probleem met dergelijke 'filter'-methoden is de uitdaging van betekenisvolle variabelen definiërenDe NoveltyRank-aanpak gebruikt de acceptatie van een artikel op een conferentie als indicator voor nieuwheid, en – wellicht wat afwijzend – gebruikt publicatie op Arxiv als achtergrondindicator. negatief nieuwigheid.
Dit veronderstelt twee onjuiste premissen: ten eerste, dat alle op de conferentie geaccepteerde inzendingen nieuw of van belang zijn, wat overduidelijk niet het geval is; en ten tweede, dat nieuwheid op zich van onschatbare waarde is. Iedereen die een half uur heeft verspild aan een aantal van de misleidende, zelfs belachelijke papers die – wellicht – uitsluitend zijn ingediend om te behouden... 'Publiceren of vergaan'-quotaZij zullen beseffen dat vernieuwing vaak triviaal is, en dat stapsgewijs werk vaak van grote betekenis is.
Het begrijpen van de waarde van een nieuw artikel is een gebied waar AI momenteel nog in ontwikkeling is. erg zwak - langetermijn verbandDoor de vaak oneerlijke manier waarop ze geschreven zijn, blijken baanbrekende artikelen in werkelijkheid vaak slechts kleine verbeteringen op bestaand werk te zijn. Geautomatiseerde systemen zullen echter een 'intuïtie' voor dergelijke gevallen moeten ontwikkelen, zonder meerdere valse positieven te genereren en zonder afhankelijk te zijn van de eerlijkheid van de indienende auteurs.
Ethische duik
Zoals ik heb eerder waargenomenPortalen zoals Arxiv zijn behoorlijk bestand tegen laissez faire Het scrapen van gegevens en de data die daaruit voortvloeit, missen vaak gedetailleerde informatie.
Zelfs als ik de middelen en tijd had om kenmerken te downloaden en te extraheren uit een voldoende representatieve dwarsdoorsnede van computerwetenschappelijke publicaties, zouden veel van de meer subtiele trends niet zijn onderzocht of geanalyseerd.
Een daarvan is de aanwezigheid of afwezigheid van ethische verklaring codicillen; lange an verplichte opname Voor biologische wetenschappen die raakvlakken hebben met dierproeven, bereikte de trend naar een ethische karakterisering van voorgesteld onderzoek een hoogtepunt in 2024, met name aan het einde van de ingediende artikelen in de categorie Informatica.
Naar mijn inschatting is deze praktijk in 2025 drastisch afgenomen. Ik vermoed dat de fervente deregulering door de huidige Amerikaanse overheid met betrekking tot AI-ontwikkeling de onderzoeksgemeenschap, zowel in de VS als daarbuiten, een zekere mate van vrijheid en een gevoel van impliciete bescherming tegen juridische problemen heeft gegeven.
Niettegenstaande zijn ondersteuning Wat de regulering van deepfakes betreft, heeft de huidige Amerikaanse regering in feite veel van de 'wildwest'-mentaliteit hersteld die kenmerkend was voor de periode 2021-23 – ook al is de context van puur wetenschappelijk onderzoek die deze periode definieerde, sindsdien geëvolueerd naar een fervent, zelfs historisch hoog niveau van investeringen.
Generatieve videopublicaties als 'AI-prut'
Met de lancering van de Hunyuanvideo en WAN Na de generatieve videoserie van afgelopen winter is AI-video in 2025 volledig getransformeerd. Oude obstakels zoals de moeilijkheid bij het maken van avatars met een volledig lichaam, of van overtuigende profielweergaven verkrijgen van een persoon, werden blijkbaar 's nachts meegesleurd.
De overvloedige gewichten die bij deze releases uit China worden meegeleverd, hebben bediscussieerbaarZe zetten de toon voor de release van generatieve video's dit jaar en vormen op zijn minst een tegenwicht tegen de neiging van westerse AI-videoarchitecturen om veel meer gecensureerd, vooraf gecommercialiseerd en voorgeschreven te zijn.
De afwezigheid van een gracht In deze ironisch genoeg democratische, door de CCCP geleide omgeving zijn honderden, zo niet duizenden bedrijven actief die de ontluikende markt voor inferentie willen exploiteren door gebruiksvriendelijke portals aan te bieden, met spelers die zo divers zijn als civit.ai en RunPod profiteren van procedures en technologieën die in veel gevallen op gewone computers uitgevoerd zouden kunnen worden.
Over het algemeen zijn deze initiatieven gericht op het vergaren van snel geld op de korte termijn, in de verwachting dat ze uiteindelijk door marktconsolidatie zullen worden ingehaald (hoewel de oprichters er ongetwijfeld geen bezwaar tegen zouden hebben als ze per ongeluk een dominant marktaandeel zouden verwerven, mocht dat gebeuren).
Diezelfde alledaagsheid en herhaling hebben ook de generatieve video-categorie in de Arxiv-inzendingen van 2025 getroffen. Zoals ik vorige week waargenomenDe signaal-ruisverhouding voor deze categorie heeft een verbijsterend hoogtepunt bereikt, nu onderzoekers publiekelijk concurreren om de enorme hoeveelheden potentiële financiering die de doorbraken van dit jaar ongetwijfeld hebben vrijgemaakt.
Desondanks zijn de overgrote meerderheid van de inzendingen van dit type op zijn best slechts kleine verbeteringen. De kernproblemen die nog steeds spelen in generatieve AI zijn dit jaar nauwelijks aan het licht gekomen: de noodzaak om identiteit behouden, LoRA-stijl, gedurende de hele karakterbeschrijving; de behoefte aan langere looptijden voor de outputvideo's, met behoud van algehele consistentie (d.w.z. van omgevingen en thema's, enz., niet alleen ID); en voor verbeterde audio generatie en manipulatie binnen generatieve video- en videobewerkingsarchitecturen; onder andere.
De mesh-koorts neemt af.
Ik heb vorig jaar geconstateerd dat er een opmerkelijke toename was in publicaties die systemen promoten die gebruikmaken van traditionele CGI (dat wil zeggen, mesh-gebaseerde representaties van het soort dat teruggaat tot de jaren 1970), of het integreren in neurale raamwerkenIk heb een aanzienlijke afname van de belangstelling voor mesh-gebaseerde oplossingen geconstateerd, met name in de tweede helft van het jaar, ten opzichte van 2025.
Veel van de CGI-oplossingen in die eerdere reeks publicaties, met name die welke betrekking hadden op parametrische menselijke 'besturingsfiguren' zoals 3D-vervormbare modellen, zijn mogelijk vervangen door de nieuwe mogelijkheden van op diffusie gebaseerde generatieve frameworks zoals Veo, Kling, Hunyuan en WAN, naast vele anderen.
Tegelijkertijd behandelen artikelen die betrekking hebben op Gaussian Splat Ook de benaderingen lijken te zijn beïnvloed door ontwikkelingsstagnatie, of doordat ze ingehaald zijn door de op diffusie gebaseerde gen-AI-systemen van 2025; of beide.
Een jaar geleden merkte ik op dat de aanvankelijke opwinding rond GSplat, die een opmerkelijke indruk eind 2023was teruggevallen in engere onderzoeksgebieden. Dit jaar zie ik een stroom publicaties die zich richten op de aanzienlijke hoeveelheid middelen die deze aanpak vereist, naast andere problemen.
Hoewel ik Gaussian Splatting zou omschrijven als 'momenteel gestagneerd', moeten we niet vergeten dat deze technologie dateert uit het begin van de jaren negentig en van nature een terugkerend fenomeen is.
Een uitzondering op deze algemene terugtrekking uit mesh-gebaseerde benaderingen is de schijnbare toename van interesse in het integreren van AI in frameworks gericht op 3D-printen.
Afname van meldingen over AI-beveiliging
Mijn laatste constatering voor 2025 is dat de categorie 'Beveiliging' in de sectie Informatica op Arxiv een opmerkelijke daling in frequentie en kwaliteit heeft laten zien in 2025, en het is niet eenvoudig te raden waarom.
De Cryptografie en beveiliging Arxiv is wellicht altijd al een ondergeschikte plek geweest voor het publiceren van artikelen, aangezien dit onderzoeksgebied – niet verrassend – gedomineerd wordt door intellectueel eigendom van de private sector. Daarvan verschijnt weinig in academische tijdschriften en vrijwel niets op gratis platforms zoals Arxiv.
Daarnaast bevatten inzendingen in deze categorie op Arxiv een bovengemiddeld aantal 'gotcha's' – subtiele bekentenissen, vaak verborgen op onverwachte plaatsen, die de ogenschijnlijke waarde en originaliteit van het artikel tenietdoen of verminderen. Een voorbeeld hiervan is een ogenschijnlijk sensationele methode voor beveiligingsinbreuk die in werkelijkheid gebaseerd is op een 'white box'-aspect – oftewel, een vorm van bevoorrechte toegang tot gegevens of procedures die een aanvaller waarschijnlijk niet zou kunnen verkrijgen.
Wat te verwachten in 2026
Hoewel de media improviseren permanent over de Gen AI-boom als een herhaling van de dotcom-hausse en -crash van begin jaren 2000 (met sommige tegenstanders), lijkt dit in feite een soort schijnveiligheid te bieden. Wat betreft infrastructuur, investeringen en cultuur. en Uit onderzoek blijkt dat er in de menselijke geschiedenis wellicht nog nooit zo'n tijdperk is geweest.
Het is daarom lastig te voorspellen welke kant het onderzoekslandschap in 2026 op zal gaan, behalve dat – zoals gebruikelijk – een aantal langetermijnprojecten tussen nu en april tot een hoogtepunt zullen komen, met een zekere 'stempel' van de obsessies en trends van 2025 als onderscheidend kenmerk.
Een ontwikkeling die mogelijk kan helpen bij de crisis rond het aantal inzendingen bij Arxiv en andere portals, is een verbod op of controle van door AI gegenereerde/ondersteunde artikelen, zoals ArXiv heeft onlangs nieuwe regels ingevoerd voor reviewartikelen. – de mate waarin AI betrokken is bij een bepaald artikel is echter moeilijk te kwantificeren, aangezien AI doordrongen onderzoekscultuur (En peer review) net zoals het andere domeinen heeft aangetast – als een druppel 'inkt' die het hele (bestaande) glas water beïnvloedt, in plaats van het medium radicaal te veranderen.
Eerste publicatie maandag 22 december 2025


