Unghiul lui Anderson

O interpretare personală a tendințelor literaturii de viziune pe computer în 2025

Publicat December 22, 2025

Martin Anderson

Imagine generată de inteligența artificială, realizată de gpt-image-1 prin intermediul ChatGPT-5.2, care prezintă o ilustrație izometrică stilizată a unor oameni de știință în haine albe într-un laborator de informatică.

Dezvăluirile etice și splatting-ul gaussian sunt în declin, în timp ce volumul mare de lucrări trimise reprezintă o nouă problemă pe care inteligența artificială trebuie să o abordeze în 2026.

Opinie Am urmărit cercetările în domeniul vederii computerizate și sintezei imaginilor pe arXiv și alte platforme conexe timp de aproximativ șapte ani, prin diverse canale – suficient de mult timp pentru a distinge tipare recurente și schimbări de tendințe. Dar aceste observații sunt anecdotice. Sincer, mi-aș dori să am timp să exploatez vastul corpus de date în continuă creștere reprezentat doar de fluxul de publicații Arxiv, care este cu siguranță bogat în perspective ascunse, folosind analiza învățării automate. În stadiul actual, pot doar să relatez mai treptat ce mi-a atras atenția. de când m-am gândit ultima dată la această problemă.

Volum la 11

Multe dintre tendințele în ceea ce privește trimiterea de lucrări de cercetare în domeniul inteligenței artificiale pe care le-am observat în 2024 s-au impus ca fiind fixe în 2025; nu în ultimul rând, este creșterea inexorabilă și continuă a volum de lucrări legate de inteligența artificială, alimentate în sine de inteligența artificială, până la punctul în care o criză percepută:

Trimiteri lunare Arxiv despre informatică, octombrie 2023 - noiembrie 2025, cu medie mobilă pe 3 luni suprapusă. Sursa: https://arxiv.org/stats/monthly_submissions

Trimiteri lunare Arxiv de informatică, octombrie 2023 - noiembrie 2025, cu suprapunere a mediei mobile pe 3 luni. Sursa

Această rată de creștere a fost caracterizată ca o dublare exponențială a volumului de lucrări despre inteligența artificială trimise, câțiva ani în urmăși a prins și mai multă înrădăcinare odată cu apariția recentă a Mania investițiilor în inteligența artificială a crescut miza, precum și volumul finanțării disponibile pentru cercetarea legată de inteligența artificială.

Statisticile complete pentru 2025 nu sunt încă disponibile, iar statisticile agregate prezentate mai sus reprezintă cifrele generale în creștere în toate categoriile. Mai jos putem vedea că informatica continuă să aibă o tendință dominantă, semnificativ peste categoriile similare:

Creșterea numărului de documente CS trimise în perioada 2022-2025. Sursa - https://info.arxiv.org/about/reports/submission_category_by_year.html

Creșterea numărului de propuneri de CS în perioada 2022-2025. Sursa

Sortarea pleavei

În octombrie, începutul sezonului de conferințe de toamnă, care aduce întotdeauna un flux de noi cercetări, a adus în schimb o Volumul de trimiteri la nivel de atac DOS, oferind un impuls și o urgență sporite componentei de cercetare, care până acum nu a fost suficient de solicitată analiza tendințelor de cercetareCu alte cuvinte, apar din ce în ce mai des lucrări și depozite care, în sine, încearcă să depășească înrăutățirea raportului semnal-zgomot din domeniul cercetării.

Cea mai recentă a venit abia săptămâna trecută, sub forma NoveltyRank, A hârtie și GitHub depozit care ajustează fin LLM-urile, cum ar fi Qwen3-4B-Instruct-2507 și SciBERT astfel încât să poată efectua o clasificare binară a lucrărilor trimise (prezicând „noutatea” din trimiterile anterioare) sau altfel o comparație a noutății în perechi (comparând trimiterile actuale pentru „noutate”):

Sistemul NoveltyRank compară titlul și rezumatul unei lucrări cu lucrări anterioare similare, rezumă diferențele folosind un LLM și transmite aceste informații unui model Qwen3-4B optimizat, care decide dacă lucrarea este considerată „nouă din punct de vedere conceptual”. Sursa - https://arxiv.org/pdf/2512.14738

Sistemul NoveltyRank compară titlul și rezumatul unei lucrări trimise cu lucrări anterioare similare, rezumă diferențele folosind un LLM și transmite aceste informații unui model Qwen3-4B optimizat, care decide dacă lucrarea este considerată „nouă din punct de vedere conceptual”. Sursa

Problema cu astfel de abordări de „cernere” este provocarea de a definirea variabilelor semnificativeAbordarea NoveltyRank folosește acceptarea unei lucrări la conferință ca indice de noutate și – poate destul de disprețuitor – folosește publicația Arxiv ca indice de fundal al negativ noutate.

Aceasta presupune două premise false: în primul rând, că toate lucrările acceptate la conferință sunt noi sau importante, ceea ce, în mod evident, nu este cazul; și, în al doilea rând, că noutatea în sine are o valoare necondiționată. Oricine a pierdut o jumătate de oră cu unele dintre lucrările înșelătoare, chiar ridicole, prezentate – poate – doar pentru a susține cote de tip „publică sau piere”, vor ști că noutatea este adesea banală, iar munca incrementală este adesea semnificativă.

Înțelegerea valorii unei lucrări noi implică un domeniu în care inteligența artificială este în prezent... foarte slab - termen lung contextDin cauza modului adesea nesincer în care sunt scrise, lucrările care par a fi inovatoare pot fi adesea dezvăluite ca progrese minore față de lucrările existente; cu toate acestea, sistemele automate vor trebui să dezvolte o „intuiție” pentru astfel de cazuri, fără a semnala multiple rezultate fals pozitive și fără a se baza pe onestitatea autorilor care trimit lucrările.

Plonjare etică

Așa cum am observat înainte, portaluri precum Arxiv sunt destul de rezistente la laissez faire scraping, iar dump-urile de date pe care le furnizează adesea duc lipsă de detalii granulare.

Prin urmare, chiar dacă aș avea resursele și timpul necesare pentru a descărca și extrage caracteristici dintr-o secțiune transversală adecvat reprezentativă de lucrări de informatică, multe dintre tendințele mai subtile nu ar fi fost vizate sau analizate.

Una dintre acestea este prezența sau absența codicile declarației etice; lung și includere obligatorie Pentru științele biologice care abordează experimentarea pe animale, anul 2024 a marcat apogeul tendinței către caracterizarea etică a unei lucrări propuse, la sfârșitul numărului de lucrări trimise în categoria Informatică.

Anecdotic, spun că această practică a scăzut considerabil pe parcursul anului 2025. Presupunerea mea este că eforturile fervente de dereglementare ale actualului guvern american, în legătură cu dezvoltarea inteligenței artificiale, au oferit comunității de cercetare, atât din State, cât și din străinătate, o anumită licență sporită și un sentiment de protecție implicită față de expunerea legală.

În ciuda acesteia a sustine În ceea ce privește reglementarea anti-deepfake, actuala administrație americană a restabilit efectiv o mare parte din poziția „Vestului Sălbatic” care a caracterizat era 2021-23 – chiar dacă contextul cercetării științifice pure care a definit-o a evoluat de atunci către niveluri fervente, chiar istorice, de investiții.

Lucrările video generative ca „deșeuri legate de inteligența artificială”

Odată cu lansarea Hunyuan Video și WAN seria de videoclipuri generative din iarna trecută, videoclipurile bazate pe inteligență artificială au fost complet transformate în 2025. Vechile obstacole, cum ar fi dificultatea de a crea avatare cu fizic complet, sau obținerea unor vizualizări de profil convingătoare a unei persoane, au fost măturate aparent peste noapte.

Lansările generoase de acest fel din China, inclusiv greutăți, au... discutabil, au stabilit ritmul lansărilor video generative din acest an și reprezintă cel puțin o presiune contraactivă asupra tendinței arhitecturilor video occidentale bazate pe inteligență artificială de a fi mult mai cenzurate, pre-comercializate și prescrise.

absența unui șanț de apărare În această scenă ironic democratică, condusă de CCCP, sute, dacă nu chiar mii de companii încearcă să exploateze piața emergentă a inferențelor prin oferirea de portaluri ușor de utilizat, cu jucători la fel de diverși ca civit.ai și RunPod profitând de proceduri și tehnologii care, în multe cazuri, puteau fi rulate pe computere interne.

În general, aceste inițiative sunt acaparari de fonduri pe termen scurt, care se așteaptă să fie uzurpate de o eventuală consolidare a pieței (deși, fără îndoială, fondatorii lor nu s-ar opune să obțină accidental o cotă de piață dominantă, dacă aceasta s-ar întâmpla).

Aceeași banalitate și replicare a lovit și firul video generativ din materialele Arxiv din 2025. După cum am... observat săptămâna trecută, raportul semnal-zgomot pentru această categorie a atins un vârf amorțitor, deoarece cercetătorii concurează public pentru sumele masive de finanțare potențială pe care descoperirile din acest an le-au eliberat, fără îndoială.

Acestea fiind spuse, marea majoritate a propunerilor de acest tip sunt, în cel mai bun caz, doar progrese incrementale. Problemele principale care rămân în IA generativă nu au ieșit prea mult la suprafață anul acesta: nevoia de a menține identitatea, Stil LoRA, pe parcursul unei reprezentări a personajelor; necesitatea unor durate mai lungi pentru videoclipurile de ieșire, menținând consecvența generală (adică a mediilor și temelor etc., nu doar a ID-ului); și pentru îmbunătățirea generare audio și manipulare în cadrul arhitecturilor de video generativ și editare video; printre altele.

Febra plasei se diminuează

Am observat anul trecut că scena înregistra o creștere notabilă a numărului de lucrări care promovau sisteme care utilizează CGI tradițional (de exemplu, reprezentări bazate pe plasă de tipul celor care datează din anii 1970), sau încorporează-l în cadre neuronaleAm observat o diminuare semnificativă a impulsului către soluțiile bazate pe plasă, în special în a doua jumătate a anului, față de 2025.

Multe dintre soluțiile încorporate în CGI în acel val anterior de lucrări, în special cele care se ocupă de figuri parametrice umane de „control”, cum ar fi Modele 3D transformabile, este posibil să fi fost înlocuite de noile capabilități ale framework-urilor generative bazate pe difuzie, cum ar fi Veo, Kling, Hunyuan și WAN, printre multe altele.

În același timp, lucrări care tratează Splat gaussian Abordările au fost, de asemenea, aparent afectate fie de stagnarea dezvoltării, fie de eclipsarea lor de sistemele de inteligență artificială bazate pe difuzie din 2025; sau de ambele.

Acum un an am observat că entuziasmul inițial al GSplat, care a făcut ca o impresie notabilă la sfârșitul anului 2023, se restrânsese în linii de cercetare mai restrânse. Anul acesta, văd un flux de lucrări care vizează, printre alte probleme, nevoile semnificative de resurse ale acestei abordări.

Deși aș caracteriza splatting-ul gaussian ca fiind „blocat în prezent”, ar trebui să ne amintim că această tehnologie datează de la începutul anilor 1990 și este renăscută prin natura sa.

O excepție de la această retragere generală de la abordările bazate pe mesh este o creștere aparentă a interesului pentru încorporarea inteligenței artificiale în framework-uri care vizează imprimarea 3D.

Diminuarea numărului de trimiteri privind securitatea inteligenței artificiale

Ultima mea observație pentru 2025 este că categoria de trimiteri „Securitate” din secțiunea Informatică de la Arxiv a înregistrat o scădere notabilă a frecvenței și calității în 2025 și nu este ușor de ghicit de ce.

Criptografie și securitate Se poate spune că arhiva a fost întotdeauna un loc de mâna a doua pentru publicarea de lucrări, deoarece acest domeniu de cercetare este, așa cum era de așteptat, dominat de proprietatea intelectuală proprie din sectorul privat - o mică parte din aceasta apare în reviste academice și aproape nimic nu apare pe platforme gratuite precum Arxiv.

În plus, lucrările trimise la această categorie pe Arxiv au un număr mai mare decât media de „capturi” – mărturisiri subestimate, adesea ascunse în locuri neașteptate, care neagă sau diminuează valoarea și noutatea aparentă a lucrării. Un exemplu ar fi o metodă aparent senzațională de încălcare a securității, care se bazează de fapt pe un aspect de „cutie albă” – adică acces privilegiat de un anumit tip la date sau proceduri, cum ar fi cele pe care un atacator probabil nu le-ar putea securiza.

Ce să te aștepți în 2026

Deși mass-media este riffing mereu despre boom-ul Generației AI ca o repetare a dezastrului de tip boom-and-bust al dot.com de la începutul anilor 2000 (cu unele disidențe), aceasta pare să reprezinte de fapt un fel de falsă securitate. În ceea ce privește infrastructura, investițiile, cultura și cercetărilor, se poate spune că nu a existat un astfel de moment în istoria omenirii.

Prin urmare, este greu de văzut în ce direcție va evolua scena cercetării în 2026, cu excepția faptului că – ca de obicei – o serie de eforturi pe termen lung vor culmina între acum și aprilie, fiind caracterizate de o anumită „amprentă” a obsesiilor și tendințelor anului 2025.

O evoluție care ar putea ajuta la rezolvarea crizei volumului de trimiteri de la Arxiv și alte portaluri este interzicerea sau verificarea lucrărilor generate/asistate de inteligență artificială, deoarece Arxiv a fost recent adoptat pentru lucrările de analiză – totuși, gradul de implicare a IA în orice lucrare poate fi greu de cuantificat, deoarece IA a cultura cercetării pătrunsă (Și evaluare reciprocă) la fel cum a invadat alte domenii – precum o picătură de „cerneală” care afectează întregul pahar cu apă (existent), în loc să schimbe radical mediul.

Publicat prima dată luni, 22 decembrie 2025

Subiecte asemănătoare:AI și cercetare profundă Cercetare automată