Connect nala

Sirdoonka Artificial

'Wadooyinka Qarsoon' Ee Fashili kara Nidaamyada Aqoonsiga Lugaha

mm

Published

 on

ChatGPT-4o: Isbeddel degdeg ah: '1792x1024 muuqaal muuqaal ah oo muujinaya muuqaal ariel ah oo orthogonal ah oo hoos u eegaya aagga 42nd ee NYC. Sawirka intiisa badan waa inuu lahaadaa midab buluug ah, laakiin meelaha laamiga dhexdiisa ah waa inay jiraan wadooyin midab casaan ah oo la tilmaamay, sida nooc ka mid ah marinka khariidad. Ka dhig sida Sims-ka.'

Wadashaqeyn cusub oo cilmi baaris ah oo u dhaxeysa Israa'iil iyo Japan ayaa ku doodaysa in nidaamyada ogaanshaha dadka lugeynaya ay leeyihiin daciifnimo, taas oo u oggolaanaysa shakhsiyaadka si wanaagsan loo wargeliyay inay ka baxsadaan nidaamyada aqoonsiga wejiga iyagoo u maraya waddooyinka si taxaddar leh loo qorsheeyay iyada oo loo marayo meelaha shabakadaha ilaalintu ay ugu waxtarka yar yihiin.

Iyada oo taageero ka muuqaalo si guud loo heli karo laga soo bilaabo Tokyo, New York iyo San Francisco, cilmi-baarayaashu waxay soo saareen hab otomaatig ah oo lagu xisaabinayo waddooyinkaas, oo ku saleysan hababka aqoonsiga shayga ugu caansan ee laga yaabo in lagu isticmaalo shabakadaha dadweynaha.

Saddexda isgoys ee loo adeegsaday daraasadda: Isgoyska Shibuya ee Tokyo, Japan; Broadway, New York; iyo Degmada Castro, San Francisco. Xigasho: https://arxiv.org/pdf/2501.15653

Saddexda isgoys ee loo adeegsaday daraasadda: Isgoyska Shibuya ee Tokyo, Japan; Broadway, New York; iyo Degmada Castro, San Francisco. Xigasho: https://arxiv.org/pdf/2501.15653

Habkan, waxaa suurtagal ah in la dhaliyo khariidado kulaylka kalsoonida taas oo calaamadisa aagagga kaamirada ku jirta ee dadka lugaynaya ay ugu yar tahay inay bixiyaan aqoonsiga wejiga ee wanaagsan:

Dhanka midig, waxaan ku aragnaa khariidadda kuleyliyaha kalsoonida ee uu dhaliyay habka cilmi-baarayaasha. Meelaha guduudan waxay muujinayaan kalsooni hoose, iyo qaabeynta mawqifka, joogitaanka kamarada iyo arrimo kale oo ay u badan tahay inay carqaladeeyaan aqoonsiga wejiga.

Dhanka midig, waxaan ku aragnaa khariidadda kuleyliyaha kalsoonida ee uu dhaliyay habka cilmi-baarayaasha. Meelaha guduudan waxay muujinayaan kalsooni hoose, iyo qaabeynta mawqifka, joogitaanka kamarada iyo arrimo kale oo ay u badan tahay inay carqaladeeyaan aqoonsiga wejiga.

Aragti ahaan habkan oo kale waxa lagu qalabayn karaa abka goobta-ogsoon, ama nooc kale oo madal ah si loo faafiyo dariiqyada ugu yar ee 'aqoonsiga saaxiibtinimo' ee A ilaa B meel kasta oo la xisaabiyay.

Warqadda cusubi waxay soo jeedinaysaa habkan oo kale, cinwaankiisuna yahay Farsamada Kobcinta Qarsoonnimada ku saleysan goobta (L-PET); Waxa kale oo ay soo jeedinaysaa cabbir ka-hortagga cinwaankiisu yahay Xaddiga La Qabsiga Ku Salaysan Goobta (L-BAT), kaas oo asal ahaan si toos ah u wada hawlo isku mid ah, laakiin markaa isticmaala macluumaadka si loo xoojiyo oo loo hagaajiyo tallaabooyinka ilaalinta, halkii laga samayn lahaa habab looga fogaado in la aqoonsado; iyo marar badan, horumarinta noocan oo kale ah ma suurtowdo haddii aan maalgelin dheeraad ah lagu samayn kaabayaasha ilaalinta.

Warqaddu sidaas darteed waxay dejinaysaa dagaal teknoolajiyadeed oo suurtagal ah oo kor u kaca oo u dhexeeya kuwa doonaya inay wanaajiyaan wadooyinkooda si ay uga fogaadaan ogaanshaha iyo awoodda nidaamyada ilaalinta si ay si buuxda u isticmaalaan tignoolajiyada aqoonsiga wajiga.

Hababka hore ee lagu ogaanayo foiling aad ayay uga qurux yar yihiin tan, waxayna udub dhexaad u yihiin habab iska soo horjeeda, sida Weerarada TnT, iyo adeegsiga qaababka daabacan si loo jahawareeriyo algorithm ogaanshaha.

Shaqada 2019 'Doqonista kamaradaha ilaalinta otomaatiga ah: dhejisyo iska soo horjeeda oo lagu weeraro ogaanshaha qofka' ayaa muujiyay qaab cadaawad daabacan oo awood u leh in lagu qanciyo nidaamka aqoonsiga oo aan qofna la ogaan, taasoo u oggolaanaysa nooc 'muuqaal la'aan. Xigasho: https://arxiv.org/pdf/1904.08653

Shaqada 2019 'Doqonista kamaradaha ilaalinta otomaatiga ah: dhejisyo iska soo horjeeda oo lagu weeraro ogaanshaha qofka' ayaa muujiyay qaab cadaawad daabacan oo awood u leh in lagu qanciyo nidaamka aqoonsiga oo aan qofna la ogaan, taasoo u oggolaanaysa nooc 'muuqaal la'aan. Xigasho: https://arxiv.org/pdf/1904.08653

Cilmi-baarayaasha ka dambeeya warqadda cusub waxay u fiirsadaan in habkoodu u baahan yahay diyaargarow yar, iyada oo aan loo baahnayn in la sameeyo waxyaabo liddi ku ah oo xiran (fiiri sawirka kore).

The warqad waxaa cinwaan looga dhigay Farsamo Kobcinta Qarsoonnimada ah si looga fogaado in ay ogaadaan kamaradaha Fiidiyowga ah ee Waddada Adigoo aan isticmaalin Agabka Cadawga ah, waxayna ka timid shan cilmi-baarayaal oo ku baahsan Jaamacadda Ben-Gurion ee Negev iyo Fujitsu Limited.

Habka iyo Imtixaanada

Iyadoo la raacayo shaqooyinkii hore sida Maaskarada Cadawga ah, AdvHat, balastar iska soo horjeeda, iyo dibad baxyo kala duwan oo la mid ah, cilmi-baarayaashu waxay u malaynayaan in 'weeraray' lugeynayay uu garanayo nidaamka ogaanshaha shayga loo isticmaalo shabakadda ilaalada. Tani dhab ahaantii maaha malo aan macquul ahayn, sababtoo ah qaadashada baahsan ee nidaamka casriga casriga ah ee nidaamyada furan sida YOLO ee nidaamyada ilaalinta ee ka midka ah Cisco iyo Ultralytics (hadda xoogga dhexe ee horumarinta YOLO).

Waraaqdu waxay sidoo kale u malaynaysaa in qofka lugaynaya uu heli karo qulqulka tooska ah ee internetka ee go'an goobaha la xisaabinayo, taas oo, mar kale, waa a male macquul ah Inta badan meelaha ay u badan tahay in ay leeyihiin xoojinta caynsanaanta.

ites sida 511ny.org waxay siisaa marin u helida kamarado ilaalo oo badan oo aagga NYC ah. Xigasho: https://511ny.or

Goobaha sida 511ny.org waxay bixiyaan marin u helida kamarado ilaalo oo badan oo aagga NYC ah. Xigasho: https://511ny.or

Taas ka sokow, lugeeyuhu wuxuu u baahan yahay inuu galo habka la soo jeediyay, iyo goobta lafteeda (tusaale, isgoysyada iyo waddooyinka lagu dhisayo waddo 'ammaan' ah).

Si loo horumariyo L-PET, qorayaashu waxay qiimeeyeen saamaynta xagasha lugaynta ee la xidhiidha kamarada; saamaynta dhererka kamarada; saamaynta fogaanta; iyo saamaynta wakhtiga maalinta. Si ay runta dhulka u helaan, waxay sawireen qofka xaglaha 0°, 45°, 90°, 135°, 180°, 225°, 270°, and 315°.

Indho-indhaynta runta dhabta ah ee ay sameeyeen cilmi-baarayaashu.

Indho-indhaynta runta dhabta ah ee ay sameeyeen cilmi-baarayaashu.

Waxay ku celceliyeen kala duwanaanshiyahan saddex kamaradood oo dhaadheer oo kala duwan (0.6m, 1.8m, 2.4m), iyo xaaladaha iftiinka kala duwan (subaxda, galabnimada, habeenka iyo xaaladaha 'shaybaadhka').

Quudinta muuqaalkan Degdeg R-CNN iyo YOLOv3 qalabka sheyga, waxay ogaadeen in kalsoonida shaygu ay ku xidhan tahay xawliga xagasha qofka lugaynaya, fogaanta qofka lugaynaya, dhererka kamarada, iyo xaaladaha cimilada/ iftiinka*.

Qorayaashu waxay dabadeed tijaabiyeen tiro balaadhan oo ah sheyga wax-sheegayaasha isla xaalad isku mid ah: Degdeg R-CNN; YOLOv3; SSD; DiffusionDet; iyo RTMDet.

Qorayaashu waxay yiraahdeen:

"Waxaan ogaanay in dhammaan shanta qaab-dhismeed ee shay-baarayaasha ay saameeyeen booska lugeynaya iyo iftiinka ambient. Intaa waxaa dheer, waxaan ogaanay in seddex ka mid ah shanta nooc (YOLOv3, SSD, iyo RTMDet) saameyntu waxay sii socotaa dhammaan heerarka iftiinka iftiinka.'

Si loo kordhiyo baaxadda, cilmi-baarayaashu waxay adeegsadeen muuqaallo laga soo qaaday kamaradaha taraafigga ee dadweynaha laga heli karo ee saddex goobood: Shibuya Crossing ee Tokyo, Broadway ee New York, iyo Degmada Castro ee San Francisco.

Goob kasta waxa lagu diyaariyay inta u dhaxaysa shan ilaa lix duubis, iyada oo ku dhawaad ​​afar saacadood oo muuqaal ah duubistiiba. Si loo falanqeeyo waxqabadka ogaanshaha, hal xargo ayaa la soo saaray labadii ilbiriqsi kasta, waxaana lagu farsameeyay iyadoo la isticmaalayo shay bare degdeg ah oo R-CNN ah. pixel kasta oo ka mid ah xayndaabyada la helay, habka ayaa lagu qiyaasay isku celceliska kalsoonida 'qofka' sanaaduuqda xaddidaadda ee ku jira pixel kaas.

"Waxaan ogaanay in dhammaan saddexda goobood, kalsoonida walxaha wax-sheeguhu ay kala duwan tahay iyadoo ku xiran meesha ay joogaan dadka ku jira qaabka. Tusaale ahaan, muuqaalka isgoysyada Shibuya, waxa jira meelo badan oo kalsoonidu hoosayso oo ka fog kamarada, iyo sidoo kale meel u dhow kamarada, halkaas oo tiir qayb ahaan qariyo dadka lugaynaya.'

Habka L-PET asal ahaan waa nidaamkan, oo lagu doodi karo 'hubka' si loo helo waddo loo maro aagga magaalada oo ay u badan tahay in ay keento in lugeynaya si guul leh loo aqoonsado.

Taas bedelkeeda, L-BAT waxay raacdaa habraac la mid ah, iyada oo ay ku kala duwan tahay in ay cusbooneysiiso dhibcaha nidaamka ogaanshaha, abuurista jawaab celin loogu talagalay in lagu tirtiro habka L-PET oo ka dhigo 'meelaha indhoolaha' ee nidaamka si waxtar leh.

(Sida la taaban karo, si kastaba ha ahaatee, hagaajinta caymiska ku salaysan kulaylka la helay waxay u baahan doontaa wax ka badan kaliya casriyeynta kamarada ku fadhida booska la filayo; iyadoo lagu saleynayo shuruudaha imtixaanka, oo ay ku jiraan goobta, waxay u baahan doontaa rakibidda kamarado dheeraad ah si loo daboolo dayacanka. aagagga - sidaas darteed waxaa lagu doodi karaa in habka L-PET uu kor u qaadayo 'dagaal qabow' gaar ahaan xaalad aad qaali u ah.

Celcelis ahaan kalsoonida dadka lugaynaya ee pixel kasta, oo ka kooban qaababka kala duwan ee qalabka wax baadha, ee aagga la arkay ee Castro Street, oo lagu falanqeeyay shan fiidiyow. Fiidiyow kasta waxaa lagu duubay xaalado iftiin kala duwan: qorrax ka soo baxa, maalin, qorrax dhac, iyo laba goobood oo habeenkii oo kala duwan. Natiijooyinka waxaa si gaar ah loogu soo bandhigay xaalad kasta oo iftiin ah.

Celcelis ahaan kalsoonida dadka lugaynaya ee pixel kasta, oo ka kooban qaababka kala duwan ee qalabka wax baadha, ee aagga la arkay ee Castro Street, oo lagu falanqeeyay shan fiidiyow. Fiidiyow kasta waxaa lagu duubay xaalado iftiin kala duwan: qorrax ka soo baxa, maalin, qorrax dhac, iyo laba goobood oo habeenkii oo kala duwan. Natiijooyinka waxaa si gaar ah loogu soo bandhigay xaalad kasta oo iftiin ah.

Isagoo u beddelay matalaadda shaxanka pixel-ku-salaysan ee a matalaad garaaf ku habboon hawsha, cilmi-baarayaashu waxay la qabsadeen Dijkstra algorithm si loo xisaabiyo waddooyinka ugu fiican ee lugeynayay si ay u maraan meelaha la dhimay ogaanshaha ilaalo.

Halkii laga heli lahaa dariiqa ugu gaaban, algoorithm-ka waa la bedelay si loo yareeyo kalsoonida ogaanshaha, loola dhaqmayo gobollada kalsoonida sare leh sida meelaha 'qiimaha' sare leh. La qabsigani waxa uu u oggolaaday algorithm-ka in uu aqoonsado dariiqyada mara meelaha indho la'aanta ah ama aagagga ogaanshaha hooseeya, isaga oo si wax ku ool ah u hagaya dadka lugeynaya ee mara waddooyinka hoos u dhaca aragga ee nidaamyada ilaalinta.

Muuqaal muujinayo beddelka khariidadda kulaylka goobta laga beddelay matrix-ku-salaysan-pixel una beddelay matalaad ku salaysan garaaf.

Muuqaal muujinayo beddelka khariidadda kulaylka goobta laga beddelay matrix-ku-salaysan-pixel una beddelay matalaad ku salaysan garaaf.

Cilmi baadhayaashu waxay qiimeeyeen saamaynta nidaamka L-BAT ku leeyahay ogaanshaha dadka lugaynaya iyagoo wata xog-ururin laga dhisay duubista afarta saacadood ee kor ku xusan ee taraafikada dadweynaha. Si loo buuxiyo ururinta, hal xargo ayaa la farsameeyay labadii ilbiriqsi kasta iyadoo la adeegsanayo sheyga SSD.

Mid kasta oo ka mid ah, hal sanduuq oo xidhidh ayaa la doortay oo uu ku jiro qof la ogaaday sida muunad togan, iyo meel kale oo random ah oo aan dad la ogaan ayaa loo isticmaalay muunad taban. Tijaabooyin mataano ah ayaa sameeyay xog-ururin lagu qiimeeyo laba nooc oo R-CNN ah oo degdeg ah - mid leh L-BAT la dabaqay, iyo mid aan lahayn.

Waxqabadka moodooyinka waxaa lagu qiimeeyay iyadoo la hubinayo sida saxda ah ee ay u aqoonsadeen muunadaha togan iyo kuwa taban: sanduuqa isku dhafka ah ee muunada togan ayaa loo tixgaliyay inuu yahay mid run ah, halka sanduuqa isku dhafka ah ee ku dul wareegaya muunada taban lagu calaamadeeyay togan been abuur ah.

Metrics loo isticmaalo si loo go'aamiyo isku halaynta ogaanshaha L-BAT ahaayeen Goobta Qalooca hoosteeda (AUC); heerka togan ee dhabta ah (TPR); heerka beenta ah (FPR); iyo celcelis ahaan kalsoonida togan ee runta ah. Cilmi-baadhayaashu waxay caddeeyeen in isticmaalka L-BAT ay xoojisay kalsoonida ogaanshaha iyada oo la ilaalinayo heer sare oo qumman oo run ah (inkasta oo koror yar oo been abuur ah).

Xiritaanka, qorayaashu waxay xuseen in habka uu leeyahay xaddidaadyo. Mid waa in khariidadaha kulaylka ee habkoodu uu gaar u yahay wakhti gaar ah oo maalinta ah. In kasta oo ayan sharraxayn, tani waxay tusinaysaa in hab weyn, oo isku dhafan oo kala duwan loo baahan doono si loogu xisaabtamo wakhtiga maalinta ee hawlgelinta dabacsanaan badan.

Waxa kale oo ay fiirsadaan in khariidadaha kuleylku aysan u wareejin doonin qaab dhismeedka moodeelka kala duwan, oo ay ku xiran yihiin nooc gaar ah oo wax qabad. Maadaama shaqada la soo jeediyay ay asal ahaan tahay caddayn-fikrad, dhismooyin badan oo adroit ayaa laga yaabaa, malaha, sidoo kale in la horumariyo si loo xalliyo deyntan farsamo.

Ugu Dambeyn

Hab kasta oo cusub oo weerar ah kaas oo xalku u yahay 'bixinta kamaradaha ilaalada cusub' ayaa xoogaa faa'iido leh, maadaama balaarinta shabakadaha kamaradaha madaniga ah ee meelaha aadka loo ilaaliyo ay noqon karto loolan siyaasadeed, iyo sidoo kale ka dhigan kharash bulsho oo caan ah oo inta badan u baahan doona amarka cod-bixiyaha.

Waxaa laga yaabaa in su'aasha ugu weyn ee shaqada ay tahay 'Nidaamka ilaalada il-xiran miyay ka faa'iidaystaan ​​ilaha furan qaab-dhismeedka SOTA sida YOLO?'. Tani, dabcan, waa wax aan macquul aheyn in la ogaado, maadaama kuwa sameeyay nidaamyada lahaanshaha ee awooda shabakado badan oo dowladeed iyo kamarad madani ah (ugu yaraan Mareykanka) waxay ku doodi doonaan in soo bandhigida isticmaalka noocaas ah ay u furi karto inay weeraraan.

Si kastaba ha ahaatee, u guuritaanka IT-ga dawladda iyo koodhka lahaanshaha guriga ee caalamiga ah iyo koodhka isha furan waxay soo jeedinayaan in qof kasta oo tijaabiya doodaha qorayaasha (tusaale) YOLO laga yaabo inay isla markiiba si fiican ugu garaacdo Ghanna.

 

* Caadi ahaan waxaan ku dari lahaa natiijooyinka miiska la xidhiidha marka lagu bixiyo warqadda, laakiin kiiskan kakanaanta miisaska warqaddu waxay ka dhigtaa kuwo aan iftiimin akhristaha caadiga ah, markaa koobitaanka ayaa faa'iido badan leh.

Markii ugu horreysay ee la daabacay Talaado, Janaayo 28, 2025

Qore ku saabsan barashada mashiinka, takhasuska domain ee isku dhafka sawirka aadanaha. Madaxii hore ee nuxurka cilmi baarista Metaphysic.ai.
Goobta gaarka ah: martinanderson.ai
Contact: [emailka waa la ilaaliyay]
Twitter: @manders_ai