Liity verkostomme!

Andersonin kulma

Henkilökohtainen näkemys tietokonenäön kirjallisuuden trendeistä vuonna 2025

mm
Tekoälyn luoma kuva, jonka on luonut gpt-image-1 ChatGPT-5.2:n kautta. Kuvassa on tyylitelty isometrinen kuva valkotakkisista tiedemiehistä tietokonelaboratoriossa.

Eettiset tiedonannot ja Gaussinen roiske-ilmiö ovat hiipumassa, ja lähetettyjen tutkimuspapereiden valtava määrä edustaa uutta ongelmaa, johon tekoälyn on puututtava vuonna 2026.

 

Lausunto Olen seurannut konenäön ja kuvien synteesin tutkimusta arXivissä ja siihen liittyvissä julkaisuissa noin seitsemän vuoden ajan eri kanavissa – riittävän kauan erottaakseni toistuvia malleja ja trendien muutoksia. Nämä havainnot ovat kuitenkin anekdoottisia. Toivon rehellisesti, että minulla olisi aikaa hyödyntää koneoppimisanalyysin avulla pelkästään Arxivin julkaisuvirran edustamaa valtavaa, jatkuvasti kasvavaa datamäärää, joka on varmasti täynnä piileviä oivalluksia. Nykytilanteessa voin vain raportoida epävirallisesti siitä, mikä tuli tietooni. siitä lähtien, kun viimeksi pohdin asiaa.

Äänenvoimakkuus kohdassa 11

Monet vuonna 2024 havaitsemistani tekoälytutkimuspapereiden lähettämisen trendeistä vakiintuivat vakioiksi vuonna 2025; näistä vähäisin on vääjäämätön ja jatkuva kasvu tilavuus tekoälyyn liittyviä artikkeleita, jotka itsessään ovat tekoälyn vauhdittamia, siihen pisteeseen asti, että koettu kriisi:

Tietojenkäsittelytieteen Arxiv-lähetykset kuukausittain, lokakuu 2023–marraskuu 2025, kolmen kuukauden liukuva keskiarvo päällä. Lähde: https://arxiv.org/stats/monthly_submissions

Tietojenkäsittelytieteen Arxiv-lähetykset kuukausittain, lokakuu 2023–marraskuu 2025, kolmen kuukauden liukuva keskiarvo päällä. Lähde

Tätä kasvuvauhtia luonnehdittiin tekoälyyn lähetettyjen artikkeleiden määrän eksponentiaaliseksi kaksinkertaistumiseksi, useita vuosia sitten, ja se on vain saanut syvempää jalansijaa viimeaikaisen Tekoälyn sijoitusmania on nostanut panoksia sekä tekoälyyn liittyvään tutkimukseen käytettävissä olevan rahoituksen määrää.

Täydellisiä tilastoja vuodelta 2025 ei ole vielä saatavilla, ja yllä esitetyt kootut tilastot edustavat yleisiä kasvulukuja kaikissa kategorioissa. Alla näemme, että tietojenkäsittelytiede jatkaa hallitsevaa trendiä, huomattavasti muita parempina:

Tietojenkäsittelytieteen töiden määrä kasvoi vuosina 2022–2025. Lähde - https://info.arxiv.org/about/reports/submission_category_by_year.html

Tietojenkäsittelytieteen töiden määrä kasvoi vuosina 2022–2025. Lähde

Akanoiden lajittelu

Lokakuussa alkanut syyskonferenssikausi, joka tuo aina tulvan uutta tutkimusta, toi sen sijaan mukanaan... DOS-hyökkäystason lähetysten määrä, mikä antaa lisävauhtia ja kiireellisyyttä tähän mennessä alirahoitettuun tutkimuslohkoon tutkimustrendien analyysiToisin sanoen, yhä useammin ilmestyy artikkeleita ja arkistoja, jotka itsessään pyrkivät kaventamaan tutkimuskentän heikkenevää signaali-kohinasuhdetta.

Viimeisin tuli vasta viime viikolla muodossa Uutuusluokitustai paperi ja GitHub-arkisto joka hienosäätää oikeustieteen maistereita, kuten Qwen3-4B-Instruct-2507 ja SciBERT jotta he voivat suorittaa lähetettyjen artikkeleiden binäärisen luokittelun (ennustamalla 'uutuus' aiempien lähetysten perusteella) tai pareittain uutuusvertailun (vertaamalla nykyisiä lähetyksiä 'uutuus':

NoveltyRank-järjestelmä vertaa lähetetyn artikkelin otsikkoa ja tiivistelmää samankaltaisiin aiempiin artikkeleihin, tiivistää erot LLM-menetelmällä ja siirtää tulokset hienosäädetylle Qwen3-4B-mallille, joka päättää, onko työ "käsitteellisesti uusi". Lähde - https://arxiv.org/pdf/2512.14738

NoveltyRank-järjestelmä vertaa lähetetyn artikkelin otsikkoa ja abstraktia samankaltaisiin aiempiin artikkeleihin, tiivistää erot LLM-menetelmällä ja siirtää tiedot hienosäädetylle Qwen3-4B-mallille, joka päättää, onko työ "käsitteellisesti uusi". Lähde

Tällaisten "seulontamenetelmien" ongelmana on haaste merkityksellisten muuttujien määrittelyNoveltyRank-lähestymistavassa käytetään artikkelin konferenssiin hyväksymistä uutuuden indeksinä ja – kenties hieman välinpitämättömästi – Arxiv-julkaisua taustaindeksinä. negatiivinen uutuus.

Tämä edellyttää kahta väärää lähtökohtaa: ensinnäkin, että kaikki konferenssissa hyväksytyt artikkelit ovat uusia tai merkittäviä, mikä ei selvästikään pidä paikkaansa; ja toiseksi, että uutuus itsessään on ehdottoman arvokasta. Jokainen, joka on tuhlannut puoli tuntia joihinkin harhaanjohtaviin, jopa naurettaviin artikkeleihin, jotka on lähetetty – kenties – pelkästään ylläpitääkseen… "julkaise tai tuhoudu" -kiintiöt, tietää, että uutuus on usein triviaalia ja lisätyö usein merkittävää.

Uuden paperin arvon ymmärtäminen liittyy alueeseen, jolla tekoälyä tällä hetkellä käytetään. erittäin heikko – pitkäaikainen taustaKoska ne on usein kirjoitettu epärehellisesti, näennäisesti uraauurtavilta vaikuttavat artikkelit voivat usein paljastua pieniksi edistysaskeleiksi aiempaan työhön verrattuna. Automaattisten järjestelmien on kuitenkin kehitettävä "intuitio" tällaisia ​​tapauksia varten merkitmättä useita vääriä positiivisia tuloksia ja luottamatta lähettävien kirjoittajien rehellisyyteen.

Eettinen syöksy

Kuten olen havaittu ennenportaalit, kuten Arxiv, ovat melko vastustuskykyisiä laissez faire kaapimalla, ja niiden toimittamista datavedoksista puuttuu usein yksityiskohtia.

Siksi, vaikka minulla olisi resursseja ja aikaa ladata ja poimia ominaisuuksia riittävän edustavasta läpileikkauksesta tietojenkäsittelytieteen julkaisuja, monia hienovaraisempia trendejä ei olisi kohdennettu tai analysoitu.

Yksi näistä on sen läsnäolo tai puuttuminen eettinen lausunto liitteistäpitkä ja pakollinen sisällyttäminen Eläinkokeita käsittelevissä biologisissa tieteissä vuosi 2024 oli huippuvuosi, jolloin ehdotetun työn eettinen luonnehdinta saavutti huippunsa tietojenkäsittelytieteen kategoriassa lähetettyjen artikkeleiden määrässä.

Anekdoottisesti sanon, että tämä käytäntö on romahtanut vuoden 2025 aikana. Arvaukseni on, että nykyisen Yhdysvaltain hallituksen kiihkeät pyrkimykset purkaa sääntelyä tekoälyn kehityksen suhteen ovat antaneet tutkimusyhteisölle sekä Yhdysvalloissa että ulkomailla tietynasteisen lisääntyneen toimivallan ja tunteen implisiittisestä suojasta oikeudelliselta altistumiselta.

Huolimatta siitä tuki Syvähuijausten vastaisen sääntelyn osalta nykyinen Yhdysvaltain hallinto on käytännössä palauttanut suuren osan vuosien 2021–23 aikakaudelle ominaisesta "villin lännen" asenteesta – vaikka sitä määritellyt puhtaasti tieteellisen tutkimuksen konteksti on sittemmin kehittynyt kiihkeäksi, jopa historiallisen tasoiseksi investoinniksi.

Generatiiviset videopaperit "tekoälyjätteinä"

Kanssa käynnistää Hunyuan Video ja WAN generatiivisen videosarjan viime talvena, tekoälyvideo on muuttunut täysin vuonna 2025. Vanhat esteet, kuten vaikeus tehdä kokonaisia ​​fysiikkahahmoja, tai vakuuttavien profiilikatselukertojen hankkiminen henkilön, pyyhkäistiin pois ilmeisesti yön aikana.

Tämänkaltaiset runsaspainoiset julkaisut Kiinasta ovat, luultavasti, asettivat tahdin generatiivisille videojulkaisuille tänä vuonna ja ovat ainakin vastapaine länsimaisten tekoälyvideoarkkitehtuurien taipumukselle olla paljon sensuroidumpia, esikaupallistettuja ja määräiltyjä.

RFID lukija NFC lukija vallihaudan puuttuminen tässä ironisen demokraattisessa CCCP:n johtamassa skenessä on johtanut satoihin, ellei tuhansiin yrityksiin, jotka pyrkivät hyödyntämään kehittyviä markkinoita päättelyyn tarjoamalla käyttäjäystävällisiä portaaleja, joissa toimijat ovat niin monimuotoisia kuin civit.ai ja RunPod hyötyen menetelmistä ja teknologioista, joita monissa tapauksissa voitaisiin käyttää kotimaisilla tietokoneilla.

Yleisesti ottaen nämä aloitteet ovat lyhytaikaisia ​​rahan kaappauksia, jotka odotetaan tulevan markkinoiden konsolidoitumisen uhriksi (vaikka niiden perustajat eivät epäilemättä vastustaisi sitä, että vahingossa törmäisivät hallitsevaan markkinaosuuteen, jos niin tapahtuisi).

Sama arkipäiväisyys ja replikaatio on iskenyt generatiivisen videon säikeeseen Arxivin vuonna 2025 lähettämissä töissä. Kuten minä havaittiin viime viikollaTämän kategorian signaali-kohinasuhde on saavuttanut lamaannuttavan huippunsa, kun tutkijat kilpailevat julkisesti valtavista potentiaalisista rahoitussummista, joita tämän vuoden läpimurrot ovat epäilemättä vapauttaneet.

Suurin osa tämänkaltaisista ehdotuksista on kuitenkin parhaimmillaankin vain pieniä edistysaskeleita. Generatiivisen tekoälyn jäljellä olevat ydinongelmat eivät ole tänä vuonna juurikaan nousseet esiin: tarve ylläpitää identiteettiä, LoRA-tyylinen, koko hahmon kuvauksen ajan; tarve pidemmille suoritusajoille tulostetuille videoille, samalla säilyttäen yleisen yhdenmukaisuuden (eli ympäristöjen ja teemojen jne., ei vain identiteetin); ja parannetuille äänen sukupolvi ja manipulointi generatiivisten video- ja videonmuokkausarkkitehtuureissa; muun muassa.

Verkkokuume laantuu

Havaitsin viime vuonna, että perinteistä tietokoneella luotua kuvaa hyödyntäviä järjestelmiä mainostavien julkaisujen määrä kasvoi huomattavasti (esim. verkkopohjaiset esitykset (sellaisia, jotka ovat peräisin 1970-luvulta), tai sisällyttää se neuroverkkoihinOlen havainnut verkkopohjaisten ratkaisujen suosion merkittävää vähenemistä, erityisesti vuoden 2025 jälkipuoliskolla.

Monet aiemmissa tutkimuspapereissa käytetyistä CGI-ratkaisuista, erityisesti ne, jotka käsittelevät parametrisia ihmis"kontrollihahmoja", kuten 3D-muokattavat mallit, ovat saattaneet korvata diffuusiopohjaisten generatiivisten kehysten, kuten Veon, Klingin, Hunyuanin ja WANin, uudet ominaisuudet, monien muiden ohella.

Samaan aikaan papereita, jotka käsittelevät Gaussin läiskä Lähestymistapoihin on ilmeisesti vaikuttanut joko kehityksen pysähtyneisyys tai vuoden 2025 diffuusioon perustuvien tekoälyjärjestelmien varjoon jääminen; tai molemmat.

Vuosi sitten huomasin, että GSplatin alkuinnostus, joka teki huomattava vaikutelma vuoden 2023 lopullaoli laantunut kapeampiin tutkimuslinjoihin. Tänä vuonna näen joukon artikkeleita, jotka pyrkivät käsittelemään tämän lähestymistavan merkittäviä resurssivaatimuksia muiden ongelmien ohella.

Vaikka kuvailisin Gaussin roiskeanalyysiä "tällä hetkellä pysähtyneeksi", meidän on muistettava, että tämä teknologia on peräisin 1990-luvun alkupuolelta ja on luonteeltaan uusi tulokas.

Yksi poikkeus tähän yleiseen vetäytymiseen verkkopohjaisista lähestymistavoista on ilmeinen kiinnostuksen lisääntyminen tekoälyn sisällyttämiseen 3D-tulostukseen tarkoitettuihin kehyksiin.

Tekoälyn tietoturvailmoitusten väheneminen

Viimeinen havaintoni vuodelta 2025 on, että Arxivin tietojenkäsittelytieteen osion "Turvallisuus"-kategorian lähetysten tiheys ja laatu ovat laskeneet huomattavasti vuonna 2025, eikä ole helppo arvata miksi.

RFID lukija NFC lukija Salaus ja turvallisuus Arkisto on luultavasti aina ollut toisen luokan paikka julkaista artikkeleita, koska tätä tutkimusalaa hallitsee odotetusti yksityisen sektorin oma immateriaalioikeus – jota esiintyy vain vähän akateemisissa julkaisuissa, ja lähes ei lainkaan vapailla alustoilla, kuten Arxivissa.

Lisäksi Arxiviin tähän kategoriaan lähetetyissä artikkeleissa on keskimääräistä enemmän "mitätöitä" – aliarvostettuja, usein odottamattomiin paikkoihin haudattuja tunnustuksia, jotka mitätöivät tai vähentävät artikkelin näennäistä arvoa ja uutuusarvoa. Yksi esimerkki olisi näennäisesti sensaatiomainen tietoturvaloukkausmenetelmä, joka todellisuudessa perustuu johonkin "valkoisen laatikon" periaatteeseen – eli jonkinlaiseen etuoikeutettuun pääsyyn tietoihin tai prosesseihin, joita hyökkääjä ei todennäköisesti voisi suojata.

Mitä odottaa vuonna 2026

Vaikka media onkin riffittely alituisesti tekoälyn buumista 2000-luvun alun dot.com-buumin ja -romahduksen toistona (jossa jonkin verran erimielisyyttä), tämä itse asiassa näyttää edustavan eräänlaista väärää turvallisuutta. Infrastruktuurin, investointien ja kulttuurin osalta ja tutkimuksen mukaan ihmiskunnan historiassa ei ole luultavasti koskaan ollut tällaista aikaa.

Siksi on vaikea nähdä, mihin suuntaan tutkimusala kehittyy vuonna 2026, paitsi että – kuten tavallista – useat pitkän aikavälin ponnistelut huipentuvat tästä hetkestä huhtikuuhun, ja niille jää tietynlainen vuoden 2025 pakkomielteiden ja trendien "leima".

Yksi kehitysaskel, joka saattaa auttaa Arxivin ja muiden portaalien lähetysmääräkriisiin, on tekoälyn luomien/avusteisten esseiden kieltäminen tai tarkistaminen. Arxiv hyväksyttiin äskettäin tarkastelupapereita varten – tekoälyn osallistumisen laajuutta yksittäisessä tutkimuksessa voi kuitenkin olla vaikea mitata, koska tekoälyllä on tunkeutui tutkimuskulttuuriin (Ja vertaisarviointi) paljolti niin kuin se on tunkeutunut muille alueille – kuin pisara "mustetta", joka vaikuttaa koko (olemassa olevaan) vesilasiin sen sijaan, että muuttaisi radikaalisti väliainetta.

 

Julkaistu ensimmäisen kerran maanantaina 22

Koneoppimisen kirjoittaja, ihmiskuvan synteesin asiantuntija. Entinen tutkimussisällön johtaja Metaphysic.ai:ssa.
Henkilökohtainen sivusto: martinanderson.ai
Ottaa yhteyttä: [sähköposti suojattu]
Twitter: @manders_ai