stub Tehisintellektiga juhitav hävitaja alistas simuleeritud lahingus inimpiloodi – Unite.AI
Ühenda meile

Tehisintellekt

Tehisintellektiga juhitav hävitaja alistas simuleeritud lahingus inimpiloodi

mm
Ajakohastatud on

Hiljuti peeti sündmus, kus AI-ga juhitud hävitaja ja inimpiloot vastandati virtuaalses koertevõitluses, mille lõpptulemusena õnnestus tehisintellektil oma inimvastane alistada, lisades veel ühe näite, kuidas tehisintellekt ületab inimesi isegi erakordselt keerukate ülesannete täitmisel.

Nagu DefenceOne teatas, korraldas hiljutise virtuaalse koeravõitluse USA sõjavägi osana pidevast jõupingutusest demonstreerida autonoomsete agentide võimet võita õhusõidukeid koeravõitlustes. AlphaDogFighti väljakutse. Defence Advanced Research Project Agency (DARPA) valis välja kaheksa erinevate kaitsetöövõtjate välja töötatud tehisintellekti meeskonda ja pani need tehisintellekti meeskonnad vastamisi virtuaalsetes koertevõitlustes. Selle turniiri võitis Heron Systemsi välja töötatud tehisintellekt ja seejärel pandi tehisintellekt vastamisi inimpiloodiga, kes kandis VR-kiivrit ja istus lennusimulaatoris. AI võitis väidetavalt kõik viis mängitud vooru.

Heron Systemsi välja töötatud tehisintellekt oli sügavalt tugevdav õppesüsteem. Sügav tugevdamine õppimine on protsess, mis võimaldab AI-agendil katse-eksitustest õppides keskkonnas ikka ja jälle katsetada. Lockheed Martini tehisintellekt oli võistlusel teisel kohal ja kasutas ka sügavat tugevdamise õppesüsteemi. Lockheed Martini insenerid ja direktorid selgitasid, et õhuvõitluses hästi toimivate algoritmide väljatöötamine on palju erinev ülesanne lihtsalt lennata ning kindlat orientatsiooni ja kõrgust säilitava algoritmi väljatöötamisest. Tehisintellekti algoritmid peavad mõistma mitte ainult seda, et teatud toimingute eest on määratud karistused, vaid ka seda, et kõik karistused ei ole võrdselt kaalutud. Mõnel tegevusel on võrreldes teiste tegevustega väga rasked tagajärjed, näiteks kokkupõrge. Seda tuleb teha, määrates igale võimalikule tegevusele kaalud ja kohandades neid kaalusid vastavalt agendi kogemustele.

Heron Systems ütles, et nad koolitasid oma mudelit, viies selle läbi üle 4 miljardi simulatsiooni ja et mudel oli selle tulemusel omandanud umbes 12-aastase kogemuse. Kuid tehisintellektil ei lubatud oma lahingukatsete kogemustest õppida. On ebaselge, kuidas oleksid konkursi tulemused muutunud, kui modellil oleks lubatud konkursivoorudest õppida. Kui võistlus oleks kestnud kauem, oleks võinud olla ka teistsugune tulemus. Inimpiloot suutis mõne vooru järel AI taktikaga kohaneda ja mängu lõpuks suutis tehisintellekti vastu palju kauem vastu pidada. Piloodi kohanemise aeg oli lihtsalt veidi liiga hilja.

See on tegelikult teine ​​kord, kui tehisintellekt on simuleeritud koeravõitluses inimest peksnud. 2016. aastal AI süsteem alistas hävitaja instruktori. Hiljutine DARPA simulatsioon oli jõulisem kui 2016. aasta prooviversioon, kuna paljud tehisintellektid pandi vastamisi, et leida parim, enne kui see inimpiloodi vastu asus.

Tsiteeriti DARPA strateegilise tehnoloogia büroo direktorit Timothy Graysoni, kes ütles, et katse eesmärk on paremini mõista, kuidas masinad ja inimesed omavahel suhtlevad, ning luua paremaid inim-masina meeskondi. Nagu Graysonit tsiteeris:

"Ma arvan, et see, mida me täna näeme, on algus millelegi, mida ma hakkan nimetama inimese ja masina sümbioosiks... Mõelgem kokpitis istuvale inimesele, keda üks neist tehisintellekti algoritmidest lennutab, kui tõeliselt ühte relvasüsteemi. kus inimene keskendub sellele, mida inimene kõige paremini oskab [nagu kõrgema astme strateegiline mõtlemine] ja tehisintellekt teeb seda, mida tehisintellekt kõige paremini oskab.