Andersonin kulma

Henkilökohtainen näkemys tietokoneen näön kirjallisuuden trendeistä vuonna 2025

Published December 22, 2025

Updated April 25, 2026

Martin Anderson

AI-generated image, by gpt-image-1 via ChatGPT-5.2, featuring a stylized isometric illustration of white-coated scientists in a computer laboratory.

Eettiset ilmoitukset ja Gaussian Splatting ovat hiipumassa, kun taas jättimäisen määrän lähettämiä papereita edustaa uusi ongelma, jonka AI joutuu ratkaisemaan vuonna 2026.

Mielipide Olen seurannut tietokoneen näön ja kuvansynteesin tutkimusta arXiv:ssä ja muissa julkaisufoorumeissa noin seitsemän vuoden ajan, eri kanavien kautta – tarpeeksi kauan, jotta voin erottaa toistuvat mallit ja trendien muutokset. Mutta nämä havainnot ovat anekdoottisia. Toivon todella, että minulla olisi aikaa hyödyntää arXiv-julkaisuvirran edustamaa valtavaa tietokorpusta, joka on varmasti täynnä piileviä oivalluksia, käyttäen koneoppimisen analyysiä. Nykyisessä tilassa voin vain raportoida epävirallisesti, mitä tuli minun tietooni siitä, kun viimeksi tarkastelin asiaa.

Äänenvoimakkuus 11

Monet vuoden 2024 tietokoneen näön tutkimuspaperien lähetyksiin liittyvistä trendeistä, joita havainnoi, vakiintuivat vuonna 2025; ei vähäisimpänä näistä on tietokoneen näön tutkimuspaperien määrän jatkuvan nousun, jota itse asiassa ruokkii AI, ja joka on johtanut havaittuun kriisiin:

Kuukausittaiset tietojenkäsittelytieteen Arxiv-lähetykset, lokakuu 2023 – marraskuu 2025, kolmen kuukauden liukuvan keskiarvon kanssa. Lähde

Tämä kasvunopeus luonnehdittiin eksponentiaaliseksi tuplaamiseksi tietokoneen näön tutkimuspaperien lähetyksissä, joitakin vuosia sitten, ja se on vain vakiintunut entisestään, kun viimeaikainen AI-panostusbuumi on nostanut panokset sekä saatavilla olevan AI-tutkimuksen rahoituksen määrän.

Vuoden 2025 täydelliset tilastot eivät ole vielä saatavilla, ja yllä olevat yhteenvetotilastot edustavat yleisiä kasvulukuja kaikissa kategoriassa. Alla voidaan nähdä, että tietojenkäsittelytiede jatkaa vahvaa trendiä, joka on selvästi muita vahvempi:

2022-2025 tietojenkäsittelytieteen lähetysten kasvu. Lähde

Lajittelu

Lokakuussa, syksyn konferenssikauden alussa, joka aina tuo tulvan uutta tutkimusta, tuli DOS-hyökkäyksen luonteinen lähetysten määrä, antaen lisää vauhtia ja kiirettä aiemmin vähäisesti tilatuille tutkimusaiheille tutkimustrendien analyysi; toisin sanoen, papereita ja repositorioita ilmestyy yhä enemmän, jotka itse pyrkivät leikkaamaan huonontuvan signaali-kohina-suhteen tutkimuskohtauksessa.

Viimeisin ilmestyi vasta viime viikolla, NoveltyRank -muodossa, joka on paperi ja GitHub-repositorio, joka hienosäätää LLM:ejä, kuten Qwen3-4B-Instruct-2507 ja SciBERT, jotta ne voivat suorittaa binäärisen luokittelun lähettämiä papereita (ennustaen ‘uudisuutta’ aiemmista lähetyksistä) tai pareittain uudisuusvertailua (vertaamalla nykyisiä lähetyksiä ‘uudisuudesta’):

NoveltyRank-järjestelmä vertaa lähetyksen otsikkoa ja tiivistelmää samankaltaisiin aiempiin papereihin, tiivistää erot LLM:n avulla ja antaa tämän hienosäädettyyn Qwen3-4B-malliin, joka päättää, onko työ ‘käsitteellisesti uusi’. Lähde

Ongelma sellaisilla ‘siivilöinti’-lähestymistavoilla on haaste määritellä merkityksellisiä muuttujia. NoveltyRank-lähestymistapa käyttää paperin hyväksymistä konferenssiin indeksinä uudisuudesta, ja – ehkäpä jossain määrin halveksuen – käyttää Arxiv-julkaisua taustaindeksinä negatiiviselle uudisuudelle.

Tämä olettaa kaksi väärää oletusta: ensinnäkin, että kaikki konferenssiin hyväksytyt lähetykset ovat uusia tai merkittäviä, mikä ei ole ilmiselvästi tapahtumassa; ja toiseksi, että uudisuus itsessään on ehdotonta arvoa. Kuka tahansa, joka on haaskannut puoli tuntia joihinkin epäilyttäviin, jopa naurettaviin papereihin – ehkä – ainoastaan ‘julkaise- tai-kuole’-kiintiöiden ylläpitämiseksi, tietää, että uudisuus usein on triviaalia, ja askelmaisia töitä usein merkittäviä.

Uuden paperin arvon ymmärtäminen sisältää alueen, jossa AI on tällä hetkellä erittäin heikko – pitkäaikainen konteksti. Koska papereita usein kirjoitetaan epärehellisesti, paperit, jotka vaikuttavat murtavansa maata, voidaan paljastaa usein vähäisiksi edistysaskeliksi olemassa olevasta työstä; kuitenkin automaattiset järjestelmät joutuvat kehittämään ‘vaiston’ tällaisiin tapauksiin, ilman useiden virheellisten positiivisten liputuksia, ja ilman luottamista lähettävien kirjoittajien rehellisyyteen.

Eettinen Pudotus

Kuten olen aiemmin havainnut, portaalit kuten Arxiv ovat melko vastustuskykyisiä laissez faire -haavien suhteen, ja heidän toimittamansa tietoaineistot usein puuttuvat yksityiskohtaisista yksityiskohdista.

Siksi, vaikka minulla olisi resursseja ja aikaa ladata ja poistaa piirteitä edustavan tietokoneen näön paperien riittävästä osasta, monet häikäisevimmistä trendeistä eivät ole kohdistuneet tai analysoitu.

Yksi näistä on eettisten lauselmien lisäykset; kauan säännöllinen pakollinen sisällyttäminen biotieteissä, jotka koskettavat eläinkokeita, vuosi 2024 näki huipun trendiä kohti eettisten luonnehdintojen työn lopussa lähettämissä papereissa Tietojenkäsittelytieteen kategoriassa.

Anekdoottisesti sanon, että tämä käytäntö on romahtanut koko vuoden 2025 ajan. Arvaukseni on, että nykyisen Yhdysvaltain hallituksen intohimo AI-kehityksen sääntelyn purkamiseen on antanut tutkimusyhteisölle sekä Yhdysvalloissa että ulkomailla tietyn lisäisen lisenssin ja tietyn sisällön suojelun oikeudelliselta altistumiselta.

Vaikka se on tukeva vastaan deepfake-sääntelyä, nykyinen Yhdysvaltain hallinto on käytännössä palauttanut paljon ‘villissä länsissä’ -asennetta, joka luonnehti vuosia 2021-23 – vaikka puhtaasti tieteellisen tutkimuksen konteksti, joka määritteli sen, on kehittynyt historialliseen panostus- ja sijoitustasoon.

Generatiiviset Videopaperit ‘AI-Sotkuina’

Hunyuan Videon ja WAN:in generatiivisen videon sarjan lanseerauksen myötä viime talvena, AI-videota on muutettu täysin vuonna 2025. Vanhat esteet, kuten kokonaisen hahmon luomisen vaikeus tai vakuuttavan profiilinäkymän saaminen henkilöstä, pyyhittiin näennäisesti yhdessä yössä.

Kiinalaisten tällaisen kaltaisten julkaisujen runsaat, painotettujen julkaisujen julkaisut ovat väittäen asettaneet vauhtia ja vastapainetta länsimaisille AI-videorakenteille, jotka ovat paljon enemmän sensuroituja, kaupallistettuja ja määrättyjä.

puolustus -puute tässä ironisesti demokraattisessa, Kiinan johtamassa kohtauksessa on johtanut satoihin, ellei tuhansiin yrityksiin, jotka pyrkivät hyödyntämään aiheuttamaa markkinatilaa inference-palvelujen tarjoamisella käyttäjäystävällisillä portaalilla, joissa toimijat ovat yhtä moninaisia kuin civit.ai ja RunPod hyötyvät proseduureista ja tekniikoista, jotka voidaan useissa tapauksissa suorittaa kotitietokoneilla.

Yleisesti ottaen nämä aloitteet ovat lyhytaikaisia rahastusyrityksiä, jotka odottavat oikeuttamaan markkinoiden lopullista konsolidaatiota (vaikka heidän perustajansa eivät vastustaisi sattumalta löytävänsä hallitsevan markkinaosuuden, jos se tapahtuisi).

Tämä sama arkisuus ja toisto on iskenyt generatiivisen videon Arxiv-lähetyksiin vuonna 2025. Kuten havainnoi viime viikolla, signaali-kohina-suhteen huippu on saavutettu tällä kategorialla, kun tutkijat kilpailevat julkisesti massiivisista potentiaalisista rahoituspoteista, jotka tämän vuoden läpimurrot ovat ilmeisesti vapauttaneet.

Sanottakoon, että suurin osa tällaisista lähetyksistä on vain askelmaisia edistysaskelia, parhaimmillaan. Generatiivisen AI:n ydinongelmat eivät ole paljastuneet juuri lainkaan tänä vuonna: tarve säilyttää identiteetti, LoRA-tyylisesti, koko hahmon esittämisen ajan; tarve pitempien suoritusaikojen tulostevideoille, joissa yleinen johdonmukaisuus (ts. ympäristöjen ja teemojen, ei vain ID) säilytetään; ja parannettu äänen generointi ja manipulointi generatiivisessa videossa ja video-editointiarkkitehtuureissa; muun muassa.

Verkkomalli-innostus Hiipuu

Havainnoi viime vuonna, että kohtaus koki merkittävän kasvun papereissa, jotka esittivät järjestelmiä, jotka hyödyntävät perinteistä CGI:ä (ts. verkkomallipohjaisia edustuksia 1970-luvun tyyliin), tai sisällyttävät sen neuroverkkorakenteisiin. Olen havainnut merkittävän vauhdin laskun verkkopohjaisiin ratkaisuihin, erityisesti vuoden 2025 jälkipuoliskolla.

Monet CGI:hen sisältyvät ratkaisut aiemmassa aallokossa papereista, erityisesti niistä, jotka käsittelevät parametrillisiä ihmishahmoja, kuten 3D-muovattavia malleja, saattavat korvata uusilla kyvyillä diffuusiopohjaisissa generatiivisissa kehyksissä, kuten Veo, Kling, Hunyuan ja WAN, muun muassa.

Samalla papereita, jotka käsittelevät Gaussian Splat -lähestymistapoja, näyttävät vaikuttaneen joko kehityksellisestä stagnaatiosta tai diffuusiopohjaisen gen AI -järjestelmien 2025 valtaamisesta; tai molemmista.

Vuosi sitten huomioni oli, että Gaussian Splattingin alkuperäinen jännitys, joka teki huomionarvoisen vaikutuksen loppuvuonna 2023, oli hiipunut kapeampiin tutkimuslinjoihin.

Tänä vuonna näen paperien virran, joka on suunnattu osoittamaan tämän lähestymistavan merkittävien resurssivaatimusten ratkaisemiseksi, muun muassa.

Vaikka luonnehtisin Gaussian Splattingia ‘tällä hetkellä pysähtyneeksi’, meidän on muistettava, että tämä teknologia on peräisin 1990-luvun alusta, ja on luonteeltaan paluuta herättävä.

AI-Turva Lähetykset Vähenevät

Viimeinen havaintoni vuodelta 2025 on, että ‘Turvallisuus’ -luokan lähetykset Tietojenkäsittelytieteen osiossa Arxiv:ssä ovat näyttäneet huomattavaa vähennystä sekä määrässä että laadussa, ja se ei ole helppo arvata, miksi.

Salaus ja Turvallisuus -arkisto on aina ollut toissijainen paikka julkaista papereita, koska tämä tutkimussuunta on yllättäen hallinnollinen yksityissektorin omistama IP – vähän siitä, mitä ilmestyy akateemisissa lehdissä, ja lähes mikään ei näy vapaissa alustoissa, kuten Arxiv.

Lisäksi lähetykset tähän kategoriaan Arxiv:ssä ovat keskimäärin korkeampi ‘gotcha’ -luku – alikäytetyt myöntämiset, usein piilotettuina odottamattomissa paikoissa, jotka kumoavat tai vähentävät paperin ilmeisen arvon ja uudisuuden. Yksi esimerkki olisi ilmeisen sensaationomainen turvallisuusloukkausmenetelmä, joka itse asiassa riippuu jostakin ‘valkoisen laatikon’ -aspektista – ts. etuoikeutettuun pääsyyn tietoihin tai prosessiin, kuten hyökkääjä ei voinut todennäköisesti turvata.

Mitä Odottaa Vuonna 2026

Vaikka media riffaa jatkuvasti Gen AI -buumista kuin dot.com -buumin ja -romahduksen uudelleen toistamisesta varhaisessa 2000-luvun alussa (jonka jotkut vastustavat), tämä näyttäytyy olevan jonkinlainen väärä turvallisuus. Infrastruktuurin, sijoituksen, kulttuurin ja tutkimuksen suhteen on todella ollut tällainen aika ihmiskunnan historiassa.

Siksi on vaikea nähdä, mihin suuntaan tutkimuskohtaus kehittyy vuonna 2026, paitsi että – kuten yleensä – useat pitkäaikaiset ponnistelut tulevat päätökseen nyt ja huhtikuun välillä, ja niissä on varmasti jokin ‘leima’ vuoden 2025 mieltymyksistä ja trendeistä.

Yksi kehitys, joka voi auttaa lähetyksen määrän kriisiä Arxiv:ssä ja muissa portaalissa, on AI-generoitu/avustettujen paperien kieltäminen tai tarkastaminen, kuten Arxiv vastikään toteutti arvostelupapereiden osalta – kuitenkin AI:n osallistumisen määrä kussakin paperissa voi osoittautua hankalaksi määritellä, koska AI on tunkeutunut tutkimuskulttuuriin (ja vertaisarviointiin) samalla tavalla kuin se on tunkeutunut muihin aloihin – kuin ‘muste’-tippa, joka vaikuttaa koko (olemassa olevaan) lasiin vettä, eikä radikaalisti muuta mediumia.

Ensijulkaistu maanantaina, 22. joulukuuta 2025

Related Topics:AI and deep research Automated Research