stuacach Feabhsaíonn Algartam MaxDiff RL Foghlaim Róbatach le "Fánacht Deartha" - Unite.AI
Ceangail le linn

Róbataic

Feabhsaíonn Algartam MaxDiff RL Foghlaim Róbatach le “Fánacht Deartha”

Nuashonraithe on

I forbairt úrnua, tá algartam AI nua cruthaithe ag innealtóirí Ollscoil Northwestern a gheallfaidh réimse na róbataic cliste a athrú. Tá an t-algartam, darb ainm Uasmhéid Foghlama Treisithe Idirleata (MaxDiff RL), deartha chun cabhrú le robots scileanna casta a fhoghlaim go tapa agus go hiontaofa, rud a d'fhéadfadh praiticiúlacht agus sábháilteacht robots a réabhlóidiú thar raon leathan feidhmchlár, ó fheithiclí féin-tiomána go cúntóirí tí agus tionscail. uathoibriú.

Dúshlán na gCóras AI Corpraithe

Chun tábhacht MaxDiff RL a thuiscint, tá sé riachtanach tuiscint a fháil ar na difríochtaí bunúsacha idir córais AI disembodied, mar ChatGPT, agus córais AI corpraithe, cosúil le robots. Braitheann AI disembodied ar mhéideanna ollmhóra sonraí coimeádta go cúramach arna soláthar ag daoine, ag foghlaim trí thriail agus earráid i dtimpeallacht fhíorúil nach bhfuil feidhm ag dlíthe fisiceacha, agus nach bhfuil aon iarmhairtí inláimhsithe ag teipeanna aonair. I gcodarsnacht leis sin, ní mór do róbait sonraí a bhailiú go neamhspleách, ag dul i ngleic le castachtaí agus srianta an domhain fhisiciúil, áit ar féidir impleachtaí tubaisteach a bheith ag teip amháin.

Níl algartaim thraidisiúnta, atá deartha go príomha le haghaidh AI disembodied, oiriúnach le haghaidh feidhmeanna róbataic. Is minic a bhíonn deacracht acu dul i ngleic leis na dúshláin a bhaineann le córais AI corpraithe, as a dtagann feidhmíocht neamhiontaofa agus guaiseacha sábháilteachta féideartha. Mar a mhíníonn an tOllamh Todd Murphey, saineolaí róbataic ag Scoil Innealtóireachta McCormick Northwestern, “I róbataic, d’fhéadfadh teip amháin a bheith tubaisteach.”

MaxDiff RL: Randamach Deartha don Fhoghlaim Níos Fearr

Chun an bhearna idir AI neamhchorpraithe agus corpraithe a líonadh, dhírigh foireann an Iarthuaiscirt ar algartam a fhorbairt a chuireann ar chumas robots sonraí ardcháilíochta a bhailiú go huathrialach. I gcroílár MaxDiff RL tá coincheap na foghlaim a threisiú agus “randamacht deartha,” a spreagann róbait a dtimpeallachtaí a fhiosrú chomh randamach agus is féidir, ag bailiú sonraí éagsúla agus cuimsitheach faoina dtimpeallacht.

Trí fhoghlaim trí na heispéiris randamacha féinchoimeádta seo, is féidir le róbait na scileanna riachtanacha a fháil chun tascanna casta a chur i gcrích ar bhealach níos éifeachtaí. Feabhsaíonn an tacar sonraí éagsúil a ghintear trí randamacht deartha cáilíocht na faisnéise a úsáideann róbait chun foghlama, agus sealbhaítear scileanna níos tapúla agus níos éifeachtaí dá bharr. Is ionann an próiseas foghlama feabhsaithe seo agus iontaofacht agus feidhmíocht mhéadaithe, rud a fhágann go bhfuil róbait faoi thiomáint ag MaxDiff RL níos inoiriúnaithe agus in ann déileáil le raon leathan dúshlán.

MaxDiff RL á chur sa Tástáil

Chun éifeachtúlacht MaxDiff RL a bhailíochtú, rinne na taighdeoirí sraith tástálacha, ag cur an algartam nua in aghaidh na múnlaí nua-aimseartha atá ann faoi láthair. Ag baint úsáide as ionsamhlúcháin ríomhaire, chuir siad an tasc ar róbait raon de thascanna caighdeánacha a dhéanamh. Ba shuntasach na torthaí: d’fheidhmigh róbait ag baint úsáide as MaxDiff RL go seasta níos fearr ná a gcomhghleacaithe, ag taispeáint luasanna foghlama níos tapúla agus comhsheasmhacht níos fearr i gcur i gcrích tascanna.

B'fhéidir gurb é an toradh is suntasaí ná cumas na robots atá feistithe le MaxDiff RL chun go n-éireodh leo ar thascanna in aon iarracht amháin, fiú agus iad ag tosú gan aon eolas roimh ré. Mar a thugann an príomhthaighdeoir Thomas Berrueta faoi deara, “Bhí ár róbait níos tapúla agus níos lúfar - in ann an méid a d’fhoghlaim siad a ghinearálú go héifeachtach agus é a chur i bhfeidhm i gcásanna nua.” Buntáiste suntasach é an cumas seo chun é a “fháil i gceart an chéad uair” in feidhmchláir fhíorshaolacha, áit nach féidir le róbait an acmhainn a bhaineann le triail agus earráid gan deireadh.

Feidhmchláir agus Tionchar Féideartha

Síneann impleachtaí MaxDiff RL i bhfad níos faide ná réimse an taighde. Mar algartam ginearálta, tá an cumas aige raon leathan feidhmchlár a réabhlóidiú, ó ghluaisteáin féin-tiomána agus drones seachadta go cúntóirí tí agus uathoibriú tionsclaíoch. Trí aghaidh a thabhairt ar na saincheisteanna bunúsacha a chuir bac le fada ar réimse na róbataice cliste, réitíonn MaxDiff RL an bealach le haghaidh cinnteoireacht iontaofa i dtascanna agus i dtimpeallachtaí atá ag éirí níos casta.

Is príomhláidreacht é solúbthacht an algartam, mar a léirigh an comhúdar Allison Pinosky: “Ní gá é seo a úsáid ach amháin le haghaidh feithiclí róbatacha a ghluaiseann timpeall. D’fhéadfaí é a úsáid freisin le haghaidh róbait chónaitheacha – amhail lámh róbait i gcistin a fhoghlaimíonn conas an miasniteoir a luchtú.” De réir mar a mhéadaíonn castacht na dtascanna agus na dtimpeallachtaí, éiríonn an tábhacht a bhaineann le corprú sa phróiseas foghlama níos tábhachtaí fós, rud a fhágann gur uirlis fhíorluachmhar é MaxDiff RL do thodhchaí na róbataic.

Leap Forward in AI agus Róbataic

Is cloch mhíle shuntasach é forbairt MaxDiff RL ag innealtóirí Ollscoil an Iarthuaiscirt maidir le dul chun cinn na róbataice cliste. Trí chur ar chumas robots foghlaim níos tapúla, níos iontaofa, agus le hinoiriúnaitheacht níos fearr, tá an cumas ag an algartam nuálaíoch seo an bealach a bhraithimid agus a n-idirghníomhaíonn muid le córais róbatacha a athrú ó bhonn.

Agus muid ar an imeall ré nua in AI agus róbataic, beidh ról ríthábhachtach ag halgartaim cosúil le MaxDiff RL i múnlú na todhchaí. Leis an gcumas atá aige aghaidh a thabhairt ar na dúshláin uathúla atá os comhair córais ionchorpraithe AI, osclaíonn MaxDiff RL saol d’fhéidearthachtaí d’fheidhmchláir fhíorshaolacha, ó shábháilteacht agus éifeachtúlacht iompair agus déantúsaíochta a fheabhsú go dtí an tslí ina mairimid agus a n-oibrímid le cúntóirí róbatacha a réabhlóidiú.

De réir mar a leanann an taighde ar aghaidh ag brú teorainneacha an méid is féidir, is cinnte go mbeidh tionchar MaxDiff RL agus dul chun cinn comhchosúil le brath ar fud na dtionscal agus inár saol laethúil. Tá todhchaí na róbaitice cliste níos gile ná riamh, agus le halgartaim cosúil le MaxDiff RL chun tosaigh, is féidir linn a bheith ag tnúth le saol ina bhfuil robots ní hamháin níos cumasaí ach freisin níos iontaofa agus inoiriúnaithe ná riamh.

Is iriseoir agus scríbhneoir AI é Alex McFarland a dhéanann iniúchadh ar na forbairtí is déanaí san intleacht shaorga. Chomhoibrigh sé le go leor gnólachtaí nuathionscanta agus foilseachán AI ar fud an domhain.