stuacach Cad is Foghlaim Neartú ann? - Aontú.AI
Ceangail le linn
Máistir-rang AI:

AI 101

Cad is Foghlaim Neartú ann?

mm
Nuashonraithe on

Cad is Foghlaim Neartú ann?

Go simplí, is teicníocht meaisínfhoghlama í foghlaim atreisithe a bhaineann le hoiliúint a chur ar ghníomhaire hintleachta saorga trí ghníomhartha agus luaíochtaí gaolmhara a athrá. Déanann gníomhaire foghlama athneartaithe turgnaimh i dtimpeallacht, ag déanamh gníomhartha agus ag fáil luach saothair nuair a dhéantar na gníomhartha cearta. Le himeacht ama, an gníomhaire foghlaimíonn sé na gníomhartha a dhéanamh a uasmhéadóidh a luach saothair. Sin sainmhíniú tapa ar fhoghlaim athneartaithe, ach má fhéachann tú níos géire ar na coincheapa atá taobh thiar d'fhoghlaim atreisithe cabhróidh sé sin leat tuiscint níos fearr agus níos iomasach a fháil uirthi.

Cuirtear an téarma “foghlaim treisithe” in oiriúint ó choincheap na treisiú sa síceolaíocht. Ar an ábhar sin, déanaimis nóiméad a ghlacadh chun coincheap síceolaíoch an athneartaithe a thuiscint. Sa chiall shíceolaíoch, tagraíonn an téarma atreisiú do rud a mhéadaíonn an dóchúlacht go dtarlóidh freagairt/gníomh ar leith. Is smaoineamh lárnach é coincheap an athneartaithe seo de theoiric an aeroiriúnaithe oibrí, a mhol an síceolaí BF Skinner ar dtús. Sa chomhthéacs seo, is éard is atreisiú ann rud ar bith is cúis le méadú ar mhinicíocht iompraíochta ar leith. Má smaoinímid ar atreisiú féideartha do dhaoine, is féidir rudaí cosúil le moladh, ardú ag an obair, candy, agus gníomhaíochtaí spraíúla a bheith i gceist.

Sa chiall thraidisiúnta, shíceolaíoch, tá dhá chineál athneartaithe ann. Tá atreisiú dearfach agus atreisiú diúltach ann. Is éard is atreisiú dearfach ann ná rud éigin a chur leis chun iompar a mhéadú, cosúil le cóir leighis a thabhairt do do mhadra nuair a bhíonn sé féin-iompartha go maith. Is éard atá i gceist le hathneartú diúltach ná spreagadh a bhaint chun iompraíocht a mhealladh, mar shampla fuaimeanna arda a stopadh chun cat sciatach a mhealladh.

Neartú Dearfach & Diúltach

Méadaíonn atreisiú dearfach minicíocht iompraíochta agus laghdaíonn athneartú diúltach an mhinicíocht. Go ginearálta, is é atreisiú dearfach an cineál atreisithe is coitianta a úsáidtear san fhoghlaim athneartaithe, toisc go gcabhraíonn sé le samhlacha an fheidhmíocht is fearr a bhaint as tasc ar leith. Ní hamháin sin ach cuireann treisiú dearfach leis an múnla chun athruithe níos inbhuanaithe a dhéanamh, athruithe a d’fhéadfadh a bheith ina bpatrúin chomhsheasmhacha agus a mhairfidh ar feadh tréimhsí fada ama.

I gcodarsnacht leis sin, cé gur dóichí go dtarlóidh iompraíocht mar gheall ar atreisiú diúltach, baintear úsáid as chun íoschaighdeán feidhmíochta a choinneáil seachas chun uasfheidhmíocht samhla a bhaint amach. Is féidir le treisiú diúltach san fhoghlaim atreisithe cuidiú lena chinntiú go gcoinnítear samhail ar shiúl ó ghníomhartha neamh-inmhianaithe, ach ní féidir leis i ndáiríre múnla a dhéanamh iniúchadh a dhéanamh ar ghníomhartha inmhianaithe.

Gníomhaire Neartú a Thraenáil

Nuair a chuirtear oiliúint ar ghníomhaire athneartaithe foghlama, tá ceithre chomhábhar éagsúla ann or stáit a úsáidtear san oiliúint: stáit tosaigh (Stát 0), stát nua (Stát 1), gníomhartha, agus luach saothair.

Samhlaigh go bhfuil muid ag oiliúint gníomhaire athneartaithe chun cluiche físeán platforming a imirt áit a bhfuil sé mar sprioc ag an AI é a dhéanamh go dtí deireadh an leibhéil trí bhogadh ar fud an scáileáin. Tarraingítear staid tosaigh an chluiche ón gcomhshaol, rud a chiallaíonn go ndéantar anailís ar an gcéad fhráma den chluiche agus go dtugtar é don mhúnla. Bunaithe ar an eolas seo, ní mór don tsamhail cinneadh a dhéanamh ar ghníomh.

Le linn na gcéimeanna tosaigh den oiliúint, is gníomhartha randamacha iad seo ach de réir mar a threisítear an tsamhail, beidh gníomhartha áirithe níos coitianta. Tar éis an gníomh a dhéanamh déantar timpeallacht an chluiche a nuashonrú agus cruthaítear staid nó fráma nua. Más rud é go raibh toradh inmhianaithe ar an ngníomh a rinne an gníomhaire, déarfaimis sa chás seo go bhfuil an gníomhaire fós beo agus nár bhuail an namhaid é, tugtar luach saothair éigin don ghníomhaire agus is dóichí go ndéanfaidh sé amhlaidh i. an todhchaí.

Bíonn an bunchóras seo lúbtha i gcónaí, ag tarlú arís agus arís eile, agus gach uair a dhéanann an gníomhaire iarracht beagán níos mó a fhoghlaim agus a luach saothair a uasmhéadú.

Tascanna Eipeasacha vs Leanúnacha

De ghnáth is féidir tascanna foghlama treisithe a chur i gceann amháin de dhá chatagóir éagsúla: tascanna eipeasóideacha agus tascanna leanúnacha.

Déanfaidh tascanna eipeasóideacha an lúb foghlama/oiliúna agus feabhsóidh siad a bhfeidhmíocht go dtí go gcomhlíontar roinnt critéar deiridh agus go gcuirfear deireadh leis an oiliúint. I gcluiche, d’fhéadfadh sé seo a bheith ag baint amach deireadh an leibhéil nó ag titim isteach i nguais mar spící. I gcodarsnacht leis sin, níl aon chritéir foirceanta ag tascanna leanúnacha, go bunúsach leanúint ar aghaidh ag traenáil go deo go dtí go roghnaíonn an t-innealtóir deireadh a chur leis an oiliúint.

Monte Carlo vs Difríocht Sealadach

Tá dhá phríomhbhealach ann chun gníomhaire foghlama treisithe a fhoghlaim, nó oiliúint a chur air. I cur chuige Monte Carlo, ní sheachadtar luach saothair don ghníomhaire (déantar a scór a nuashonrú) ach amháin ag deireadh na heachtra oiliúna. Chun é sin a chur ar bhealach eile, ní bhfaighidh an tsamhail amach cé chomh maith agus a d'fheidhmigh sé go dtí go bhfuil an coinníoll foirceanta buailte. Féadfaidh sé an fhaisnéis seo a úsáid ansin chun nuashonrú a dhéanamh agus nuair a chuirfear tús leis an gcéad bhabhta oiliúna eile freagróidh sé de réir na faisnéise nua.

An modh ama-difríocht difriúil le modh Monte Carlo sa mhéid is go ndéantar an meastachán luacha, nó an meastachán scóir, a nuashonrú le linn na heachtra oiliúna. Nuair a théann an tsamhail ar aghaidh go dtí an chéad chéim eile, déantar na luachanna a nuashonrú.

Taiscéalaíocht vs Saothrú

Is gníomh cothromaithe é gníomhaire foghlama athneartaithe a oiliúint, lena n-áirítear dhá mhéadracht dhifriúla a chothromú: taiscéalaíocht agus saothrú.

Is éard is taiscéalaíocht ann ná tuilleadh eolais a bhailiú faoin timpeallacht máguaird, agus tá taiscéalaíocht ag baint úsáide as an eolas atá ar eolas cheana féin faoin gcomhshaol chun pointí luaíochta a thuilleamh. Mura ndéanann gníomhaire ach an timpeallacht a iniúchadh agus nach ndéanann sé leas as riamh, ní dhéanfar na gníomhartha atá ag teastáil go deo. Ar an láimh eile, mura ndéanann an gníomhaire ach shaothrú agus nach ndéanann sé iniúchadh ar bith, ní fhoghlaimeoidh an gníomhaire ach gníomh amháin a dhéanamh agus ní bhfaighidh sé amach ar straitéisí féideartha eile chun luach saothair a thuilleamh. Dá bhrí sin, tá sé ríthábhachtach taiscéalaíocht agus saothrú a chothromú agus gníomhaire foghlama treisithe á chruthú.

Cásanna Úsáide Chun Foghlama Atreisithe

Is féidir foghlaim athneartaithe a úsáid i raon leathan ról, agus is fearr í a fheileann d’fheidhmchláir nuair a éilíonn tascanna uathoibriú.

Réimse amháin é uathoibriú na dtascanna atá le déanamh ag róbait thionsclaíocha ina mbíonn foghlaim athneartaithe úsáideach. Is féidir foghlaim treisithe a úsáid freisin le haghaidh fadhbanna cosúil le mianadóireacht téacs, ag cruthú samhlacha atá in ann achoimre a dhéanamh ar chorpáin fhada téacs. Tá taighdeoirí ag tástáil freisin maidir le foghlaim atreisithe a úsáid i réimse an chúraim shláinte, le gníomhairí athneartaithe ag láimhseáil poist mar leas iomlán a bhaint as beartais chóireála. D’fhéadfaí foghlaim threisithe a úsáid freisin chun ábhar oideachais a shaincheapadh do dhaltaí.

Achoimre ar Fhoghlaim Treisithe

Is modh cumhachtach é foghlaim treisithe chun gníomhairí AI a thógáil a d'fhéadfadh torthaí iontacha agus uaireanta iontasacha a bheith mar thoradh orthu. Is féidir le hoiliúint a chur ar ghníomhaire trí fhoghlaim atreisithe a bheith casta agus deacair, mar go dtógann sé go leor atriallta traenála agus cothromaíocht íogair den dé-nósacht taiscéalaithe/leasaithe. Má éiríonn leis, áfach, is féidir le gníomhaire a chruthaítear le foghlaim athneartaithe tascanna casta a dhéanamh faoi raon leathan timpeallachtaí éagsúla.

Blogger agus ríomhchláraitheoir le speisialtachtaí i Foghlaim Meaisín agus Deep Learning topaicí. Tá súil ag Daniel cabhrú le daoine eile cumhacht AI a úsáid ar mhaithe le leas sóisialta.