L'angolo di Anderson
Uno sguardo personale alle tendenze della letteratura sulla visione artificiale nel 2025

Le divulgazioni etiche e il Gaussian Splatting sono in declino, mentre l'enorme volume di articoli presentati rappresenta un nuovo problema che l'intelligenza artificiale dovrà affrontare nel 2026.
Opinione Ho seguito la ricerca sulla visione artificiale e la sintesi di immagini su arXiv e piattaforme correlate per circa sette anni, su diverse piattaforme – un tempo sufficiente per distinguere modelli ricorrenti e cambiamenti di tendenza. Ma queste osservazioni sono aneddotiche. Sinceramente, vorrei avere il tempo di sfruttare il vasto corpus di dati in continua crescita rappresentato dal solo flusso di pubblicazioni di Arxiv, che è sicuramente ricco di intuizioni nascoste, utilizzando l'analisi del machine learning. Allo stato attuale, posso solo riportare in modo più superficiale ciò che è giunto alla mia attenzione. da quando ho considerato la questione l'ultima volta.
Volume a 11
Molte delle tendenze nelle presentazioni di articoli di ricerca sull'intelligenza artificiale che ho osservato nel 2024 si sono affermate come elementi fissi nel 2025; non ultima di queste è l'inesorabile e continuo aumento di volume di documenti relativi all'intelligenza artificiale, alimentati di per sé dall'intelligenza artificiale, al punto di una crisi percepita:

Invii mensili di informatica su Arxiv, ottobre 2023-novembre 2025, con media mobile trimestrale sovrapposta. Fonte
Questo tasso di crescita è stato caratterizzato da un raddoppio esponenziale del volume di articoli presentati sull'intelligenza artificiale, diversi anni fa, e ha preso piede ancora più profondamente con il recente avvento di La mania degli investimenti nell'intelligenza artificiale ha alzato la posta in gioco e l'entità dei finanziamenti disponibili per la ricerca sull'intelligenza artificiale.
I dati completi per il 2025 non sono ancora disponibili e le statistiche aggregate mostrate sopra rappresentano i numeri generali in crescita in tutte le categorie. Di seguito possiamo osservare che l'informatica continua a seguire un trend dominante, nettamente superiore alle altre discipline:

Aumento delle richieste di CS nel periodo 2022-2025. Fonte
Separare la pula
Ad ottobre, l'inizio della stagione delle conferenze autunnali, che porta sempre con sé un'ondata di nuove ricerche, ha portato invece un Volume di invii a livello di attacco DOS, dando ulteriore impulso e urgenza al filone di ricerca finora sottoscritto analisi delle tendenze della ricerca; in altre parole, stanno emergendo sempre più articoli e archivi che, di per sé, cercano di contrastare il peggioramento del rapporto segnale/rumore nel panorama della ricerca.
L'ultima è arrivata solo la settimana scorsa, sotto forma di NoveltyRank, una carta e Repository GitHub che perfeziona LLM come Qwen3-4B-Istruisci-2507 e SciBERT in modo che possano effettuare una classificazione binaria dei documenti inviati (prevedendo la "novità " rispetto ai documenti inviati in precedenza) o un confronto di novità a coppie (confrontando i documenti inviati in precedenza per "novità "):

Il sistema NoveltyRank confronta il titolo e l'abstract di un articolo con articoli simili del passato, riassume le differenze utilizzando un LLM e passa il tutto a un modello Qwen3-4B perfezionato che decide se il lavoro può essere considerato "concettualmente nuovo". Fonte
Il problema con questi approcci di "vagliatura" è la sfida di definire variabili significativeL'approccio NoveltyRank utilizza l'accettazione di un articolo alla conferenza come indice di novità e, forse in modo piuttosto sprezzante, utilizza la pubblicazione Arxiv come indice di base di negativo. novità .
Ciò presuppone due false premesse: in primo luogo, che tutti i contributi accettati dalla conferenza siano nuovi o di rilievo, il che è palesemente falso; e in secondo luogo, che la novità in sé abbia un valore incondizionato. Chiunque abbia sprecato mezz'ora su alcuni dei documenti speciosi, persino ridicoli, presentati – forse – solo per sostenere quote "pubblica o muori", sapranno che la novità è spesso banale e il lavoro incrementale spesso significativo.
Comprendere il valore di un nuovo articolo coinvolge un'area in cui l'intelligenza artificiale è attualmente molto debole – a lungo termine contestoA causa del modo spesso disonesto in cui sono scritti, gli articoli che sembrano innovativi possono rivelarsi molto spesso piccoli progressi rispetto a lavori esistenti; tuttavia, i sistemi automatizzati dovranno sviluppare un'"intuizione" per tali casi, senza segnalare molteplici falsi positivi e senza fare affidamento sull'onestà degli autori che li hanno presentati.
Immersione etica
Come ho osservato prima, portali come Arxiv sono piuttosto resistenti a laissez faire scraping e i dump di dati che forniscono spesso mancano di dettagli granulari.
Pertanto, anche se avessi le risorse e il tempo per scaricare ed estrarre le caratteristiche da una sezione trasversale adeguatamente rappresentativa di articoli di informatica, molte delle tendenze più sottili non sarebbero state individuate o analizzate.
Uno di questi è la presenza o l'assenza di codicilli di dichiarazione etica; lungo un inclusione obbligatoria per le scienze biologiche che toccano la sperimentazione animale, il 2024 ha visto l'apogeo della tendenza verso la caratterizzazione etica di un lavoro proposto, alla fine dei lavori presentati nella categoria Informatica.
A titolo di aneddoto, affermo che questa pratica è crollata nel corso del 2025. La mia ipotesi è che i fervidi sforzi di deregolamentazione dell'attuale governo degli Stati Uniti, in relazione allo sviluppo dell'intelligenza artificiale, abbiano dato alla comunità di ricerca, sia negli Stati Uniti che all'estero, una certa maggiore licenza e un senso di implicita protezione dall'esposizione legale.
Nonostante la sua supporto per quanto riguarda la regolamentazione anti-deepfake, l'attuale amministrazione statunitense ha di fatto ripristinato gran parte dell'atteggiamento da "far west" che aveva caratterizzato l'era 2021-23, nonostante il contesto di pura ricerca scientifica che lo definiva si sia da allora evoluto in livelli di investimento ferventi, persino storici.
Documenti video generativi come "scarto di intelligenza artificiale"
Con il lancio del Hunyuan Video e WAN serie di video generativi dello scorso inverno, il video AI è stato completamente trasformato nel 2025. Vecchi ostacoli come il difficoltà nel realizzare avatar con fisico completoo di ottenere visualizzazioni di profilo convincenti di una persona, sono stati spazzati via apparentemente durante la notte.
Le abbondanti versioni di questo tipo, comprensive di pesi, provenienti dalla Cina hanno, discutibilmente, dettano il ritmo delle uscite di video generativi quest'anno e rappresentano almeno una contropressione alla tendenza delle architetture video di intelligenza artificiale occidentali a essere molto più censurate, pre-commercializzate e prescritte.
. assenza di fossato in questa scena ironicamente democratica guidata dal CCCP ha portato centinaia, se non migliaia di aziende che cercano di sfruttare il mercato nascente dell'inferenza offrendo portali di facile utilizzo, con attori diversi come civit.ai e RunPod traendo profitto da procedure e tecnologie che, in molti casi, potrebbero essere eseguite su computer domestici.
In generale, queste iniziative sono tentativi di accaparrarsi denaro a breve termine, che si prevede saranno usurpati da un eventuale consolidamento del mercato (anche se, senza dubbio, i loro fondatori non avrebbero nulla in contrario a inciampare accidentalmente in una quota di mercato dominante, se ciò dovesse accadere).
Questa stessa banalità e replicazione ha colpito il filone video generativo nelle proposte di Arxiv nel 2025. Come ho osservato la scorsa settimana, il rapporto segnale/rumore per questa categoria ha raggiunto un picco paralizzante, poiché i ricercatori competono pubblicamente per le enormi quantità di potenziali finanziamenti che le scoperte di quest'anno hanno senza dubbio liberato.
Detto questo, la stragrande maggioranza delle proposte di questo tipo sono, nella migliore delle ipotesi, semplici progressi incrementali. I problemi fondamentali che permangono nell'IA generativa non sono emersi molto quest'anno: la necessità di mantenere l'identità , Stile LoRA, in tutta la rappresentazione del personaggio; la necessità di tempi di esecuzione più lunghi per i video di output, con coerenza generale (ad esempio, di ambienti e temi, ecc., non solo ID) mantenuta; e per un miglioramento generazione audio e manipolazione all'interno di architetture di video generativo e di video-editing; tra gli altri.
La febbre della maglia si attenua
L'anno scorso ho osservato che la scena stava vivendo un notevole aumento di articoli che promuovevano sistemi che sfruttano la CGI tradizionale (ad esempio, rappresentazioni basate su mesh del tipo che risale agli anni '1970), o incorporarlo in strutture neuraliHo osservato una significativa diminuzione dell'impulso verso soluzioni basate su mesh, in particolare nella seconda metà dell'anno, nel corso del 2025.
Molte delle soluzioni CGI incorporate in quella prima ondata di documenti, in particolare quelle che trattano figure di "controllo" umano parametrico come Modelli 3D trasformabili, potrebbero essere stati soppiantati dalle nuove capacità dei framework generativi basati sulla diffusione come Veo, Kling, Hunyuan e WAN, tra molti altri.
Allo stesso tempo, i documenti che trattano di Splat gaussiano Apparentemente, anche gli approcci sono stati influenzati dalla stagnazione dello sviluppo o dall'essere stati eclissati dai sistemi di intelligenza artificiale di generazione basati sulla diffusione del 2025; o da entrambi.
Un anno fa ho notato che l'entusiasmo iniziale di GSplat, che ha fatto un notevole impressione alla fine del 2023, si era ridotto a linee di ricerca più ristrette. Quest'anno, vedo un flusso di articoli volti ad affrontare le significative richieste di risorse di questo approccio, tra gli altri problemi.
Sebbene definirei il Gaussian Splatting "attualmente in stallo", dovremmo ricordare che questa tecnologia risale ai primi anni '1990 ed è revenant per natura.
Un'eccezione a questo generale ritiro dagli approcci basati su mesh è l'apparente aumento di interesse nell'incorporare l'intelligenza artificiale in framework destinati alla stampa 3D.
Diminuzione delle richieste di sicurezza dell'IA
La mia ultima osservazione per il 2025 è che la categoria degli invii "Sicurezza" nella sezione Informatica di Arxiv ha evidenziato un notevole calo di frequenza e qualità nel 2025, e non è facile indovinarne il motivo.
. Crittografia e sicurezza Si può sostenere che l'archivio sia sempre stato un luogo di seconda classe in cui pubblicare articoli, poiché questo filone di ricerca è, come prevedibile, dominato dalla proprietà intellettuale del settore privato, di cui solo una piccola parte emerge nelle riviste accademiche e quasi nessuna si vede in piattaforme gratuite come Arxiv.
Inoltre, gli articoli presentati in questa categoria su Arxiv presentano un numero di "gotcha" superiore alla media: ammissioni sottovalutate, spesso nascoste in luoghi inaspettati, che negano o sminuiscono l'apparente valore e la novità dell'articolo. Un esempio potrebbe essere un metodo di violazione della sicurezza apparentemente sensazionale che in realtà si basa su un aspetto "white box", ovvero un accesso privilegiato di qualche tipo a dati o procedure, che un aggressore difficilmente potrebbe proteggere.
Cosa aspettarsi nel 2026
Sebbene i media siano riff costantemente sul boom dell'intelligenza artificiale di generazione come una ripetizione del disastro del boom e del crollo delle dot.com dei primi anni 2000 (con qualche dissenso), questo sembra in realtà rappresentare una sorta di falsa sicurezza. In termini di infrastrutture, investimenti, cultura e Secondo la ricerca, si può sostenere che non ci sia mai stato un momento come questo nella storia dell'umanità .
Pertanto è difficile prevedere quale sarà l'andamento della ricerca nel 2026, se non fosse che, come al solito, una serie di sforzi a lungo termine culmineranno tra oggi e aprile, contraddistinti da una certa "impronta" delle ossessioni e delle tendenze del 2025.
Uno sviluppo che potrebbe aiutare a risolvere la crisi del volume di invio su Arxiv e altri portali è il divieto o il controllo dei documenti generati/aiutati dall'intelligenza artificiale, come Arxiv è stato recentemente promulgato per la revisione degli articoli – tuttavia, la portata del coinvolgimento dell’IA in un singolo documento potrebbe rivelarsi difficile da quantificare, poiché l’IA ha cultura di ricerca penetrata (E peer review) tanto quanto ha invaso altri ambiti, come una goccia di "inchiostro" che influenza l'intero bicchiere d'acqua (esistente), anziché cambiare radicalmente il mezzo.
Prima pubblicazione lunedì 22 dicembre 2025


