stub Mudell ta' Tagħlim Magni Jifhem ir-Relazzjonijiet Oġġetti - Unite.AI
Kuntatt magħna

Robotika

Mudell ta' Tagħlim Magni Jifhem ir-Relazzjonijiet tal-Oġġetti

Aġġornata on

Riċerkaturi fil-Massachusetts Institute of Technology (MIT) żviluppaw mudell ġdid ta’ tagħlim tal-magni (ML) li jifhem ir-relazzjonijiet sottostanti bejn l-oġġetti f’xena. Il-mudell jirrappreżenta relazzjonijiet individwali wieħed wieħed qabel ma jgħaqqad ir-rappreżentazzjonijiet biex jiddeskrivi x-xena ġenerali. 

Permezz ta 'dan l-approċċ ġdid, il-mudell ML jista' jiġġenera immaġini aktar preċiżi minn deskrizzjonijiet tat-test, u jista 'jagħmel dan anke meta x-xena jkollha proġetti multipli rranġati f'relazzjonijiet differenti ma' xulxin. 

Dan l-iżvilupp ġdid huwa importanti peress li ħafna mudelli ta' tagħlim fil-fond mhumiex kapaċi jifhmu r-relazzjonijiet imħabblin bejn oġġetti individwali.

Il-mudell tat-tim jista 'jintuża f'każijiet fejn ir-robots industrijali jridu jwettqu kompiti ta' manipulazzjoni f'diversi stadji, bħal stivar ta 'oġġetti jew assemblaġġ ta' apparat. Jgħin ukoll biex iwassal biex il-magni eventwalment ikunu jistgħu jitgħallmu mill-ambjenti tagħhom u jinteraġixxu magħhom, bħall-bnedmin. 

Yilun Du huwa student tal-PhD fil-Laboratorju tax-Xjenza tal-Kompjuter u l-Intelliġenza Artifiċjali (CSAIL) u ko-awtur ewlieni tad-dokument. Du ko-mexxa r-riċerka ma 'Shuang Li, student PhD CSAIL, u Nan Liu, student gradwat fl-Università ta' Illinois f'Urbana-Champaign. Kien jinkludi wkoll lil Joshua B. Tenenbaum, Paul E. Newton Professur tal-Iżvilupp tal-Karriera tax-Xjenza Konjittiva u l-Kompjutazzjoni fid-Dipartiment tax-Xjenzi tal-Moħħ u Konjittivi, u l-awtur anzjan Antonio Torralba, il-Professur tal-Inġinerija Elettrika u Xjenza tal-Kompjuter tad-Delta Electronics. Kemm Tenenbaum kif ukoll Torralba huma membri tas-CSAIL.

Il-Qafas il-Ġdid

“Meta nħares lejn mejda, ma nistax ngħid li hemm oġġett fil-post XYZ. Moħħna ma jaħdimx hekk. F’moħħna, meta nifhmu xena, nifhmuha tassew ibbażata fuq ir-relazzjonijiet bejn l-oġġetti. Aħna naħsbu li billi nibnu sistema li tista 'tifhem ir-relazzjonijiet bejn l-oġġetti, nistgħu nużaw dik is-sistema biex jimmanipulaw u nibdlu l-ambjenti tagħna b'mod aktar effettiv,” jgħid Du.

Il-qafas il-ġdid jista 'jiġġenera immaġni ta' xena bbażata fuq deskrizzjoni test ta 'oġġetti u r-relazzjonijiet tagħhom. 

Is-sistema mbagħad tista 'tkisser dawn is-sentenzi f'biċċiet iżgħar li jiddeskrivu kull relazzjoni individwali. Kull parti mbagħad tiġi mmudellata separatament, u l-biċċiet huma kkombinati permezz ta 'proċess ta' ottimizzazzjoni li jiġġenera immaġni tax-xena. 

Bis-sentenzi mqassma f'biċċiet iqsar, is-sistema tista' mbagħad tikkombinahom mill-ġdid b'modi differenti, li tippermettilha tadatta għal deskrizzjonijiet tax-xena li qatt ma ltaqgħet magħhom.

"Sistemi oħra jieħdu r-relazzjonijiet kollha b'mod ħolistiku u jiġġeneraw l-immaġni one-shot mid-deskrizzjoni. Madankollu, approċċi bħal dawn ifallu meta jkollna deskrizzjonijiet barra mid-distribuzzjoni, bħal deskrizzjonijiet b'aktar relazzjonijiet, peress li dawn il-mudelli ma jistgħux verament jadattaw shot wieħed biex jiġġeneraw immaġini li fihom aktar relazzjonijiet. Madankollu, hekk kif qed nikkomponu dawn il-mudelli separati u iżgħar flimkien, nistgħu nimudellaw numru akbar ta’ relazzjonijiet u naddattaw għal kombinazzjonijiet ġodda,” tgħid Du.

Is-sistema tista 'wkoll twettaq dan il-proċess bil-maqlub. Jekk jiġi mitmugħ immaġini, jista 'jsib deskrizzjonijiet tat-test li jaqblu mar-relazzjonijiet bejn l-oġġetti fix-xena. 

Evalwazzjoni tal-Mudell

Ir-riċerkaturi talbu lill-bnedmin biex jevalwaw jekk l-immaġini ġġenerati kinux jaqblu mad-deskrizzjoni tax-xena oriġinali. Meta d-deskrizzjonijiet kien fihom tliet relazzjonijiet, li kien l-aktar tip kumpless, 91 fil-mija tal-parteċipanti qalu li l-mudell il-ġdid wettaq aħjar minn metodi oħra ta 'tagħlim fil-fond.

“Ħaġa interessanti li sibna hija li għall-mudell tagħna, nistgħu nżidu s-sentenza tagħna milli jkollna deskrizzjoni ta’ relazzjoni waħda għal tnejn, jew tlieta, jew saħansitra erba’ deskrizzjonijiet, u l-approċċ tagħna jkompli jkun kapaċi jiġġenera immaġini li huma deskritti b’mod korrett minn dawk. deskrizzjonijiet, filwaqt li metodi oħra jfallu,” jgħid Du.

Il-mudell wera wkoll kapaċità impressjonanti biex jaħdem b'deskrizzjonijiet li ma kienx iltaqa' magħhom qabel.

“Dan huwa promettenti ħafna għax dan huwa eqreb ta’ kif jaħdmu l-bnedmin. Il-bnedmin jistgħu jaraw biss diversi eżempji, iżda nistgħu niġbdu informazzjoni utli minn dawk il-ftit eżempji biss u ngħaqqduhom flimkien biex noħolqu kombinazzjonijiet infiniti. U l-mudell tagħna għandu tali proprjetà li tippermettilha titgħallem minn inqas dejta iżda tiġġeneralizza għal xeni jew ġenerazzjonijiet ta 'immaġni aktar kumplessi," tgħid Li.

It-tim issa se jfittex li jittestja l-mudell fuq stampi tad-dinja reali li huma aktar kumplessi u jesplora kif eventwalment jinkorpora l-mudell fis-sistemi tar-robotika. 

 

Alex McFarland huwa ġurnalist u kittieb tal-IA li jesplora l-aħħar żviluppi fl-intelliġenza artifiċjali. Huwa kkollabora ma' bosta startups u pubblikazzjonijiet tal-AI madwar id-dinja.