Robotika
AI Tgħin Timijiet ta 'Robots Kollaborattivi u Drones
Tim ta’ riċerkaturi fl-Università ta’ Illinois Grainger College of Engineering żviluppa metodu ġdid biex iħarreġ aġenti multipli bħal robots u drones biex jaħdmu flimkien mal-użu tal-intelliġenza artifiċjali (AI). L-aġenti jiddependu fuq it-tagħlim ta 'rinfurzar, li huwa wieħed mit-tipi ewlenin ta' tekniki ta 'tagħlim bil-magni.
Teknika Deċentralizzata
Huy Tran huwa inġinier aerospazjali fl-università.
"Huwa aktar faċli meta l-aġenti jistgħu jitkellmu ma 'xulxin," qal Huy Tran. “Imma ridna nagħmlu dan b’mod li jkun deċentralizzat, jiġifieri li ma jitkellmux bejniethom. Iffukajna wkoll fuq ċitazzjonijiet fejn mhux ovvju x’għandhom ikunu r-rwoli jew l-impjiegi differenti għall-aġenti.”
Skont Tran, dan ix-xenarju huwa aktar kumpless għax mhux ċar x'għandu jagħmel aġent wieħed kontra aġent ieħor.
"Il-mistoqsija interessanti hija kif nitgħallmu nwettqu kompitu flimkien maż-żmien," qal.
Teknika ta' Tagħlim ta' Rinfurzar
It-tim bbaża ruħu fuq it-teknika ta 'tagħlim tal-magni msejħa tagħlim ta' rinfurzar biex jevita din il-problema. Ippermettilhom joħolqu funzjoni ta 'utilità li tgħid lill-aġent meta jkun qed jagħmel xi ħaġa utli għat-tim.
“Bil-gowls tat-tim, diffiċli tkun taf min ikkontribwixxa għar-rebħa,” kompla Tran. “Aħna żviluppajna teknika ta’ tagħlim tal-magni li tippermettilna nidentifikaw meta aġent individwali kkontribwixxa għall-għan globali tat-tim. Jekk tħares lejha f'termini ta' sports, plejer tal-futbol wieħed jista' jiskorja, iżda rridu nkunu nafu wkoll dwar azzjonijiet minn sħabi oħra li wasslu għall-gowl, bħal assists. Huwa diffiċli li tifhem dawn l-effetti mdewma.”
L-algoritmi tar-riċerkaturi jidentifikaw ukoll meta aġent jew robot qed jagħmel xi ħaġa li tmur kontra, jew ma tikkontribwixxix għall-għan.
"Mhux tant li r-robot għażel li jagħmel xi ħaġa ħażina, biss xi ħaġa li mhix utli għall-għan aħħari," huwa qal.
L-algoritmi ġew ittestjati bl-użu ta 'logħob simulat, bħal StarCraft.
"StarCraft jista 'jkun ftit aktar imprevedibbli - konna eċċitati li naraw il-metodu tagħna jaħdem tajjeb f'dan l-ambjent ukoll."
Dan it-tip ta 'algoritmu huwa applikabbli għal diversi sitwazzjonijiet fid-dinja reali, jgħid it-tim. Uħud mill-applikazzjonijiet potenzjali jinkludu sorveljanza militari, robots f'maħżen, kontroll tas-sinjali tat-traffiku, vetturi awtonomi li jikkoordinaw kunsinni, u kontroll ta 'grilja tal-enerġija elettrika.
It-tim li wettaq din ir-riċerka rivoluzzjonarja kien jinkludi lil Seung Hyun Kim, Neale Van Stralen, u Girish Chowdhary. Ġie ppreżentat fil-konferenza riveduta mill-pari dwar l-Aġenti Awtonomi u s-Sistemi Multi-Aġenti.