stuacach Taighdeoirí AI Cruthaíonn Samhail Imeartha Físchluichí ar Féidir Chuimhniú ar Imeachtaí san Am atá caite - Unite.AI
Ceangail le linn

Faisnéise Saorga

Taighdeoirí AI Cruthaíonn Samhail Imeartha Cluiche Físe ar Féidir Chuimhniú ar Imeachtaí san Am atá caite

mm
Nuashonraithe on

Tá foireann taighdeoirí ag saotharlann AI Uber le déanaí d'fhorbair córas halgartaim AI a d’fheidhmigh níos fearr ná imreoirí daonna agus córais AI eile ag físchluichí clasaiceacha Atari. Tá an córas AI a d'fhorbair na taighdeoirí in ann cuimhneamh ar straitéisí rathúla roimhe seo, ag cruthú straitéisí nua bunaithe ar an méid a d'oibrigh san am atá caite. Tá an staidéir creideann an fhoireann taighde go bhfuil feidhm ag na halgartaim a d'fhorbair siad i réimsí teicniúla eile cosúil le próiseáil teanga agus róbataic.

Is é an modh tipiciúil a úsáidtear chun córais AI a chruthú atá in ann cluichí físeáin a imirt ná algartam foghlama treisithe a úsáid. Foghlaimíonn halgartaim um fhoghlaim treisithe conas tasc a chur i gcrích trí raon gníomhartha féideartha a fhiosrú, agus tar éis gach gníomh, cuirtear cineál athneartaithe (luach saothair nó pionós) ar fáil dóibh. Le himeacht ama, foghlaimíonn an tsamhail AI cad iad na gníomhaíochtaí as a dtagann luach saothair níos mó, agus is dóichí go gcuirfear na gníomhartha seo i gcrích. Ar an drochuair, téann samhlacha foghlama treisithe i dtrioblóid nuair a thagann siad ar phointí sonraí nach bhfuil ag teacht le cinn eile sa tacar sonraí.

De réir na foirne taighde, is é an chúis nár bhreithnigh taighdeoirí AI eile a gcur chuige ná go bhfuil an straitéis éagsúil leis an gcur chuige “inspreagadh intreach” a úsáidtear go hiondúil san fhoghlaim atreisithe. Is í an tsaincheist a bhaineann le cur chuige inspreagtha intreach ná go bhféadfadh an tsamhail “dearmad” a dhéanamh ar réimsí a bhféadfadh luach saothair a thabhairt dóibh ar fiú iad a iniúchadh. Tugtar “detachment” ar an bhfeiniméan seo. Mar thoradh air sin, nuair a thagann an tsamhail ar shonraí gan choinne, féadfaidh sé dearmad a dhéanamh ar réimsí ar chóir iad a iniúchadh go fóill.

De réir TechXplore, chuir an fhoireann taighde faoi shamhail foghlama a chruthú a bhí níos solúbtha agus in ann freagairt do shonraí gan choinne. Sháraigh na taighdeoirí an fhadhb seo trí algartam a thabhairt isteach atá in ann cuimhneamh ar na gníomhartha go léir a rinne leagan roimhe seo den mhúnla nuair a rinne sé iarracht fadhb a réiteach. Nuair a thagann an tsamhail AI ar phointe sonraí nach bhfuil ag teacht leis an méid atá foghlamtha aige go dtí seo, seiceálann an tsamhail a léarscáil chuimhne. Aithneoidh an tsamhail ansin cé na straitéisí ar éirigh leo agus ar theip orthu agus roghnóidh sé straitéisí mar is cuí.

Nuair a bhíonn físchluiche á imirt, bailíonn an tsamhail screenshots den chluiche mar a imríonn sé, ag déanamh loga dá ghníomhartha. Cuirtear na híomhánna le chéile bunaithe ar chosúlachtaí, ag cruthú pointí soiléire in am ar féidir leis an tsamhail tagairt siar dóibh. Is féidir leis an algartam na híomhánna logáilte a úsáid chun filleadh ar phointe suimiúil ama agus leanúint ar aghaidh ag iniúchadh as sin. Nuair a aimsíonn an tsamhail go bhfuil sé ag dul amú, déanfaidh sé tagairt siar do na screenshots a glacadh agus déanfaidh sé iarracht straitéis eile.

Mar atá mínithe ag an BBC, tá an fhadhb ann freisin maidir le cásanna contúirteacha a láimhseáil don ghníomhaire AI ag imirt an chluiche. Má théann an gníomhaire isteach i nguais a d'fhéadfadh é a mharú, a chuirfeadh cosc ​​air filleadh ar áiteanna ar fiú níos mó taiscéalaíochta a dhéanamh orthu, fadhb ar a dtugtar “síolrú”. Láimhseálann an tsamhail AI fadhbanna díráille trí phróiseas ar leith ón gceann a úsáidtear chun taiscéalaíocht ar sheanréimsí a spreagadh.

Bhí an modh súgartha ag an bhfoireann taighde trí 55 cluiche Atari. Úsáidtear na cluichí seo go coitianta chun feidhmíocht na samhlacha AI a thagarmharcáil, ach chuir na taighdeoirí casadh dá samhail leis. Thug na taighdeoirí isteach rialacha breise do na cluichí, ag ordú don mhúnla ní hamháin an scór is airde a bhaint amach ach iarracht a dhéanamh scór níos airde a bhaint amach gach uair. Nuair a rinneadh anailís ar thorthaí fheidhmíocht an mhúnla, fuair na taighdeoirí amach go raibh a gcóras AI níos fearr ná AIanna eile ag na cluichí thart ar 85% den am. D'éirigh go han-mhaith leis an AI ag an gcluiche Montezuma's Revenge, cluiche ardánaithe ina seachnaíonn an t-imreoir guaiseacha agus a bhailíonn sé seoda. Bhuail an cluiche an taifead le haghaidh imreoir daonna agus scóráil sé níos airde ná mar atá ag aon chóras AI eile.

De réir taighdeoirí Uber AI, tá feidhm ag na straitéisí a úsáideann an fhoireann taighde ar thionscail cosúil le róbataic. Baineann robots leas as an gcumas cuimhneamh ar na gníomhartha a n-éiríonn leo, nár oibrigh, agus nár triaileadh fós.

 

Blogger agus ríomhchláraitheoir le speisialtachtaí i Foghlaim Meaisín agus Deep Learning topaicí. Tá súil ag Daniel cabhrú le daoine eile cumhacht AI a úsáid ar mhaithe le leas sóisialta.