Këndi i Andersonit

Një qëndrim personal mbi tendencat e letërsisë së vizionit kompjuterik në 2025

Publikuar Dhjetor 22, 2025

Martin Anderson

Imazh i gjeneruar nga inteligjenca artificiale, nga gpt-image-1 nëpërmjet ChatGPT-5.2, që paraqet një ilustrim izometrik të stilizuar të shkencëtarëve me bluza të bardha në një laborator kompjuterash.

Zbulimet etike dhe Gaussian Splatting janë në rënie, ndërsa vëllimi i madh i punimeve të paraqitura përfaqëson një problem të ri që IA duhet të trajtojë në vitin 2026.

Opinion Kam ndjekur kërkimin mbi vizionin kompjuterik dhe sintezën e imazhit në arXiv dhe vende të ngjashme për afërsisht shtatë vjet, në platforma të ndryshme - mjaftueshëm gjatë për të dalluar modelet e përsëritura dhe ndryshimet në trende. Por këto vëzhgime janë anekdotike. Sinqerisht do të doja të kisha kohë të shfrytëzoja korpusin e gjerë të të dhënave në rritje të përfaqësuar vetëm nga rrjedha e publikimeve të Arxiv, e cila është sigurisht e pasur me njohuri të fshehura, duke përdorur analizën e të mësuarit automatik. Siç është situata, mund të raportoj vetëm më rastësisht atë që më ra në sy. që kur e kam shqyrtuar çështjen për herë të fundit.

Vëllimi në 11

Shumë nga trendet në dorëzimin e punimeve kërkimore mbi inteligjencën artificiale që vura re në vitin 2024 u vendosën si të përhershme në vitin 2025; jo më pak e rëndësishmja prej tyre është rritja e paepur dhe e vazhdueshme e... vëllim të punimeve që lidhen me IA-në, në vetvete të nxitura nga IA, deri në pikën e një krizë e perceptuar:

Dorëzimet mujore të Arkivit të Shkencave Kompjuterike, Tetor 2023 - Nëntor 2025, me mesatare rrotulluese 3-mujore të mbivendosur. Burim

Kjo shkallë rritjeje u karakterizua si një dyfishim eksponencial i vëllimit të dorëzimeve të punimeve të inteligjencës artificiale, disa vite më parë, dhe ka marrë një ndikim më të thellë vetëm me ardhjen e fundit të Mania e investimeve në inteligjencën artificiale ka rritur rreziqet, si dhe sasinë e fondeve të disponueshme për kërkime të lidhura me inteligjencën artificiale.

Statistikat e plota për vitin 2025 nuk janë ende të disponueshme, dhe statistikat e përgjithshme të paraqitura më sipër përfaqësojnë numrat e përgjithshëm në rritje në të gjitha kategoritë. Më poshtë mund të shohim se shkenca kompjuterike vazhdon të ndjekë një trend dominues, dukshëm mbi shokët e saj të qëndrueshëm:

Rritja e dorëzimeve të dokumenteve të kontabilitetit gjatë viteve 2022-2025. Burimi - https://info.arxiv.org/about/reports/submission_category_by_year.html

Rritja e dorëzimeve të kërkesave për kredi gjatë viteve 2022-2025. Burim

Renditja e bykut

Në tetor, fillimi i sezonit të konferencave të vjeshtës, i cili gjithmonë sjell një vërshim të hulumtimeve të reja, solli në vend të kësaj një Vëllimi i dorëzimeve në nivelin e sulmit DOS, duke i dhënë shtysë dhe urgjencë shtesë degës kërkimore deri më tani të nënvlerësuar të analiza e trendeve të kërkimit; me fjalë të tjera, po shfaqen gjithnjë e më shumë punime dhe depo që, në vetvete, kërkojnë të kapërcejnë përkeqësimin e raportit sinjal-zhurmë në skenën e kërkimit.

I fundit erdhi vetëm javën e kaluar, në formën e Renditja e Risive, Një letër Magazinimi i GitHub i cili përmirëson LLM-të si p.sh. Qwen3-4B-Instruct-2507 SciBERT në mënyrë që ata të mund të kryejnë klasifikim binar të punimeve të paraqitura (duke parashikuar 'risinë' nga dorëzimet e mëparshme), ose krahasim të risisë në çifte (duke krahasuar dorëzimet aktuale për 'risi'):

Sistemi NoveltyRank krahason titullin dhe abstraktin e një dorëshkrimi me punime të ngjashme të mëparshme, përmbledh ndryshimet duke përdorur një LLM dhe ia kalon këtë një modeli të përmirësuar Qwen3-4B që vendos nëse puna llogaritet si 'konceptualisht e re'. Burimi - https://arxiv.org/pdf/2512.14738

Sistemi NoveltyRank krahason titullin dhe abstraktin e një dorëshkrimi me punime të ngjashme në të kaluarën, përmbledh ndryshimet duke përdorur një LLM dhe ia kalon këtë një modeli të përmirësuar Qwen3-4B që vendos nëse puna llogaritet si 'e re nga ana konceptuale'. Burim

Problemi me qasje të tilla 'sitëzuese' është sfida e përcaktimi i variablave kuptimplotëQasja NoveltyRank përdor pranimin e një punimi në konferencë si një indeks të risisë dhe - ndoshta në mënyrë mjaft shpërfillëse - përdor botimin Arxiv si një indeks sfondi të negativ risi.

Kjo supozon dy premisa të gabuara: së pari, se të gjitha dorëshkrimet e pranuara nga konferenca janë të reja, ose me pasoja, gjë që nuk është aspak e vërtetë; dhe së dyti, se vetë risia ka vlerë të pakushtëzuar. Kushdo që ka humbur gjysmë ore në disa nga dokumentet e rreme, madje edhe qesharake të dorëzuara - ndoshta - vetëm për të ruajtur... kuota 'publiko ose zhduku', do të dijë se risia është shpesh e parëndësishme dhe puna graduale shpesh e rëndësishme.

Të kuptuarit e vlerës së një punimi të ri përfshin një fushë ku inteligjenca artificiale është aktualisht... shumë i dobët – afatgjatë kontekstPër shkak të mënyrës shpesh të pasinqertë se si shkruhen, punimet që duket se bëjnë përparime shumë shpesh mund të zbulohen si përparime të vogla në punën ekzistuese; megjithatë, sistemet e automatizuara do të duhet të zhvillojnë një 'intuitë' për raste të tilla, pa sinjalizuar shumë pozitivë të rremë dhe pa u mbështetur në ndershmërinë e autorëve që i dorëzojnë.

Etike Plunge

Siç kam vëzhguar më parë, portalet si Arxiv janë mjaft rezistente ndaj laissez faire skraping, dhe të dhënat që ato ofrojnë shpesh nuk kanë detaje të hollësishme.

Prandaj, edhe nëse do të kisha burimet dhe kohën për të shkarkuar dhe nxjerrë karakteristika nga një seksion kryq përfaqësues në mënyrë adekuate i punimeve të shkencave kompjuterike, shumë nga trendet më delikate nuk do të ishin synuar ose analizuar.

Njëra prej tyre është prania ose mungesa e kodikulet e deklaratave etike; një kohë e gjatë përfshirje e detyrueshme Për shkencat biologjike që prekin eksperimentimin me kafshë, viti 2024 pa kulmin e trendit drejt karakterizimit etik të një pune të propozuar, në fund të punimeve të paraqitura në kategorinë e Shkencave Kompjuterike.

Nga ana anekdotike, them se kjo praktikë ka rënë nga shkëmbi gjatë gjithë vitit 2025. Mendoj se përpjekjet e zjarrta të derregullimit të qeverisë aktuale të SHBA-së, në lidhje me zhvillimin e inteligjencës artificiale, i kanë dhënë komunitetit të kërkimit si në Shtetet e Bashkuara ashtu edhe jashtë saj, njëfarë licence më të madhe dhe një ndjenjë mbrojtjeje të nënkuptuar nga ekspozimi ligjor.

Pavarësisht saj mbështetje Për rregullimin anti-deepfake, administrata aktuale amerikane ka rivendosur në mënyrë efektive pjesën më të madhe të qëndrimit të "Perëndimit të Egër" që karakterizoi epokën 2021-23 - edhe pse konteksti i kërkimit të pastër shkencor që e përcaktoi atë që atëherë ka evoluar në nivele të zjarrta, madje historike, investimesh.

Dokumentet Video Gjenerative si 'Shkatërrime të IA-së'

Me fillimin e Hunyuan Video dhe WAN seri video gjeneruese gjatë dimrit të kaluar, videoja me inteligjencë artificiale është transformuar tërësisht në vitin 2025. Pengesa të vjetra si p.sh. vështirësia e krijimit të avatarëve me trup të plotë, ose e marrjen e pikëpamjeve bindëse të profilit të një personi, u rrëmbyen me sa duket gjatë natës.

Lëshimet e këtij lloji me pesha të bollshme nga Kina kanë, ndoshta, përcaktojnë ritmin për publikimet e videove gjeneruese këtë vit dhe janë të paktën një presion kundërveprues mbi tendencën e arkitekturave perëndimore të videos me inteligjencë artificiale për të qenë shumë më të censuruara, të para-komercializuara dhe të përshkruara.

La mungesa e një hendeku Në këtë skenë ironikisht demokratike të udhëhequr nga CCCP, qindra, nëse jo mijëra kompani kërkojnë të shfrytëzojnë tregun e sapolindur për nxjerrje përfundimesh duke ofruar portale miqësore për përdoruesit, me lojtarë aq të larmishëm sa civit.ai RunPod duke përfituar nga procedurat dhe teknologjitë që, në shumë raste, mund të ekzekutohen në kompjuterë shtëpiakë.

Në përgjithësi, këto iniciativa janë kapje parash afatshkurtra të cilat pritet të uzurpohen nga konsolidimi përfundimtar i tregut (megjithëse, pa dyshim, themeluesit e tyre nuk do të kundërshtonin që aksidentalisht të pengoheshin në një pjesë dominuese të tregut, nëse kjo do të ndodhte).

E njëjta gjë e zakonshme dhe përsëritje ka prekur edhe temën e videos gjeneruese në dorëzimet e Arxiv në vitin 2025. Ndërsa unë vëzhguar javën e kaluar, raporti sinjal-zhurmë për këtë kategori ka arritur një kulm marramendës, ndërsa studiuesit konkurrojnë publikisht për shumat masive të financimit të mundshëm që padyshim kanë lëshuar zbulimet e këtij viti.

Megjithatë, shumica dërrmuese e dorëzimeve të këtij lloji janë thjesht përparime graduale, në rastin më të mirë. Problemet kryesore që mbeten në IA-në gjeneruese nuk kanë dalë shumë në pah këtë vit: nevoja për të ruaj identitetin, Në stilin LoRA, gjatë gjithë përshkrimit të personazhit; nevoja për kohëzgjatje më të gjata ekzekutimi për videot dalëse, me ruajtjen e qëndrueshmërisë së përgjithshme (p.sh., të mjediseve dhe temave, etj., jo vetëm të ID-së); dhe për përmirësim të gjenerimi i audios dhe manipulimi brenda arkitekturave gjeneruese të videos dhe redaktimit të videos; ndër të tjera.

Ethet e rrjetës zvogëlohen

Vitin e kaluar vura re se skena po përjetonte një rritje të dukshme të punimeve që promovonin sisteme që shfrytëzojnë CGI-në tradicionale (p.sh., përfaqësime të bazuara në rrjetë të llojit që daton që nga vitet 1970), ose përfshijeni atë në strukturat nervoreKam vërejtur një rënie të ndjeshme të shtytjes drejt zgjidhjeve të bazuara në rrjetë, veçanërisht në gjysmën e dytë të vitit, gjatë vitit 2025.

Shumë nga zgjidhjet e përfshira në CGI në atë valë të hershme të punimeve, veçanërisht ato që merren me figura parametrike të 'kontrollit' njerëzor, të tilla si Modele të morfueshme 3D, mund të jetë zëvendësuar nga aftësitë e reja të kornizave gjeneruese të bazuara në difuzion, të tilla si Veo, Kling, Hunyuan dhe WAN, ndër të tjera.

Në të njëjtën kohë, dokumentet që merren me Gaussian Splat Me sa duket, qasjet janë prekur ose nga stanjacioni zhvillimor, ose për shkak se janë eklipsuar nga sistemet e inteligjencës artificiale të bazuara në difuzion të vitit 2025; ose të dyja.

Një vit më parë vura re se ngazëllimi fillestar i GSplat, i cili bëri një përshtypje e dukshme në fund të vitit 2023, ishte zhytur në linja më të ngushta kërkimore. Këtë vit, shoh një rrjedhë punimesh që synojnë adresimin e kërkesave të konsiderueshme për burime të kësaj qasjeje, ndër probleme të tjera.

Edhe pse do ta karakterizoja Gaussian Splatting si 'aktualisht të bllokuar', duhet të kujtojmë se kjo teknologji daton që nga fillimi i viteve 1990 dhe është e dobishme nga natyra.

Një përjashtim nga kjo tërheqje e përgjithshme nga qasjet e bazuara në rrjetë është një rritje e dukshme e interesit në përfshirjen e IA-së në kornizat që synojnë printimin 3D.

Zvogëlim në Dorëzimet e Sigurisë së IA-së

Vëzhgimi im i fundit për vitin 2025 është se kategoria e dorëshkrimeve 'Siguria' në seksionin e Shkencave Kompjuterike në Arxiv ka dëshmuar një rënie të dukshme të frekuencës dhe cilësisë në vitin 2025, dhe nuk është e lehtë të hamendësohet pse.

La Kriptografia dhe Siguria Arkivi ka qenë gjithmonë një vend i klasit të dytë për të postuar punime, pasi kjo degë kërkimore, siç pritej, dominohet nga të drejtat e pronësisë intelektuale të sektorit privat - pak prej të cilave shfaqen në revistat akademike dhe pothuajse asnjë prej të cilave nuk shihet në platforma falas si Arxiv.

Për më tepër, dorëzimet në këtë kategori në Arxiv kanë një numër më të lartë se mesatarja të 'gabimeve' - pranime të nënvlerësuara, shpesh të fshehura në vende të papritura, që mohojnë ose zvogëlojnë vlerën dhe risinë e dukshme të punimit. Një shembull do të ishte një metodë me sa duket sensacionale e shkeljes së sigurisë që në fakt mbështetet në një aspekt të 'kutisë së bardhë' - dmth., qasje e privilegjuar e një lloji në të dhëna ose procedura, të tilla si ato që një sulmues ka të ngjarë të mos i sigurojë.

Tofarë duhet të presim në 2026-ën

Edhe pse media është riffing vazhdimisht mbi bumin e Inteligjencës Artificiale të Gjeneratës si një përsëritje e debaklit të bumit dhe dështimit të dot.com të viteve të para të 2000-tave (me disa mospajtime), kjo në fakt duket se përfaqëson një lloj sigurie të rreme. Për sa i përket infrastrukturës, investimeve, kulturës Sipas hulumtimit, mund të thuhet se nuk ka pasur një kohë të tillë në historinë e njerëzimit.

Prandaj, është e vështirë të parashikohet se në ç'drejtim do të zhvillohet skena kërkimore në vitin 2026, përveçse - si zakonisht - një numër përpjekjesh afatgjata do të kulmojnë midis tani dhe prillit, me një 'vulë' të caktuar të obsesioneve dhe trendeve të vitit 2025 që i dallon ato.

Një zhvillim që mund të ndihmojë në krizën e vëllimit të dorëzimeve në Arxiv dhe portale të tjera është ndalimi ose kontrolli i dokumenteve të gjeneruara/të ndihmuara nga inteligjenca artificiale, pasi Arxiv u miratua së fundmi për dokumente rishikimi – megjithatë, shkalla e përfshirjes së IA-së në çdo punim mund të jetë e vështirë për t'u përcaktuar, pasi IA ka depërtoi në kulturën kërkimore (Dhe rishikim kolegial) ashtu siç ka pushtuar fusha të tjera – si një pikë 'bojë' që ndikon në të gjithë gotën (ekzistuese) me ujë, në vend që ta ndryshojë rrënjësisht mjedisin.

Botuar për herë të parë të hënën, më 22 dhjetor 2025

Temat e ngjashme:AI dhe kërkime të thella Kërkim i automatizuar