stuacach Cad is Rófheistiú ann? - Aontú.AI
Ceangail le linn
Máistir-rang AI:

AI 101

Cad is Rófheistiú ann?

mm
Nuashonraithe on

Cad is Rófheistiú ann?

Nuair a chuireann tú oiliúint ar líonra néaraíoch, caithfidh tú rófheisteas a sheachaint. Ró-fheistiú Is saincheist í laistigh den mheaisínfhoghlaim agus staitisticí ina bhfoghlaimíonn samhail patrúin an tacair sonraí oiliúna ró-mhaith, ag míniú go foirfe an tacar sonraí oiliúna ach ag teip ar a chumhacht réamh-mheastacháin a ghinearálú do thacair eile sonraí.

Chun é sin a chur ar bhealach eile, i gcás múnla rófheistithe is minic a léireoidh sé cruinneas an-ard ar an tacar sonraí oiliúna ach is beag cruinneas ar shonraí a bhailítear agus a rithfear tríd an tsamhail amach anseo. Sin sainmhíniú tapa ar rófheisteas, ach déanaimis dul thar choincheap an rófheistithe go mion. Breathnaímid ar conas a tharlaíonn rófheisteas agus conas is féidir é a sheachaint.

Tuiscint ar “Oiliúint” agus gannfheidhmiú

Tá sé ina chuidiú breathnú ar choincheap an tearcfheistithe agus “oiriúnach” go ginearálta nuair a bhíonn rófheisteas á phlé. Nuair a dhéanaimid oiliúint ar mhúnla táimid ag iarraidh creat a fhorbairt a bheidh in ann nádúr, nó aicme, míreanna laistigh de thacar sonraí a thuar, bunaithe ar na gnéithe a chuireann síos ar na míreanna sin. Ba chóir go mbeadh samhail in ann patrún a mhíniú laistigh de thacar sonraí agus na haicmí pointí sonraí don todhchaí bunaithe ar an bpatrún seo a thuar. Dá fheabhas a mhíníonn an tsamhail an gaol idir gnéithe an tacair oiliúna, is amhlaidh is “oiriúnach” dár múnla.

Seasann an líne ghorm do thuartha le múnla nach bhfuil oiriúnach, agus seasann an líne ghlas do shamhail oiriúnach níos fearr. Grianghraf: Pep Roca via Wikimedia Commons, CC BY SA 3.0, ( https://commons.wikimedia.org/wiki/File:Reg_ls_curvil%C3%ADnia.svg)

Múnla a mhíníonn go dona an gaol idir gnéithe na sonraí oiliúna agus a dteipeann ar an gcaoi sin samplaí de shonraí na todhchaí a rangú go cruinn is ea tearcfheistithe na sonraí oiliúna. Dá ndéanfá an coibhneas tuartha de shamhail neamhfheistithe a ghrafáil le hidirbhealach iarbhír na ngnéithe agus na lipéid, d’fhéachfadh na tuartha ón marc. Dá mbeadh graf againn le luachanna iarbhír tacair oiliúna lipéadaithe, bheadh ​​an chuid is mó de na pointí sonraí in easnamh go mór ar mhúnla nach bhfuil oiriúnach go mór. D’fhéadfadh múnla a bhfuil feiliúnach níos fearr uirthi cosán a ghearradh trí lár na bpointí sonraí, agus gan ach beagán pointí sonraí aonair a bhaint de na luachanna tuartha.

Is minic a tharlaíonn tearcfheistiú nuair nach bhfuil dóthain sonraí ann chun samhail chruinn a chruthú, nó nuair a dhéantar iarracht samhail líneach a dhearadh le sonraí neamhlíneacha. Is minic a chuideoidh tuilleadh sonraí oiliúna nó níos mó gnéithe le tearcfheistiú a laghdú.

Mar sin, cén fáth nach gcruthóimid múnla a mhíníonn go foirfe gach pointe sna sonraí oiliúna? Cinnte go bhfuil cruinneas foirfe inmhianaithe? Is é is cúis le rófheistiú múnla a chruthú a d’fhoghlaim patrúin na sonraí oiliúna go rómhaith. Ní bheidh an tacar sonraí oiliúna agus tacair shonraí eile sa todhchaí a ritheann tú tríd an tsamhail díreach mar a chéile. Is dócha go mbeidh siad an-chosúil ar go leor bealaí, ach beidh difríocht eatarthu freisin ar phríomhbhealaí. Mar sin, má dhéantar samhail a dhearadh a mhíníonn an tacar sonraí oiliúna go foirfe, ciallaíonn sé go mbeidh teoiric agat faoin ngaol idir gnéithe nach ginearálú go maith le tacair shonraí eile.

Tuiscint ar Overfeistiú

Tarlaíonn rófheisteas nuair a fhoghlaimíonn samhail na sonraí laistigh den tacar sonraí oiliúna ró-mhaith, rud a fhágann go mbíonn an tsamhail thíos leis nuair a dhéantar tuar ar shonraí seachtracha. D’fhéadfadh sé seo tarlú nuair a fhoghlaimíonn an tsamhail ní hamháin na gnéithe den tacar sonraí, foghlaimíonn sé freisin luaineachtaí randamach nó torann laistigh den tacar sonraí, ag cur tábhachta ar na teagmhais randamacha/neamhthábhachtacha seo.

Is mó an seans go dtarlóidh rófheisteas nuair a úsáidtear samhlacha neamhlíneacha, mar go mbíonn siad níos solúbtha agus gnéithe sonraí á bhfoghlaim. Is minic a bhíonn paraiméadair agus teicnící éagsúla ag halgartaim neamhparaiméadracha foghlama meaisín ar féidir iad a chur i bhfeidhm chun íogaireacht an mhúnla i leith sonraí a shrianadh agus ar an gcaoi sin rófheisteas a laghdú. Mar shampla, samhlacha crann cinneadh an-íogair do rófheisteas, ach is féidir teicníocht ar a dtugtar bearradh a úsáid chun cuid de na sonraí atá foghlamtha ag an tsamhail a bhaint go randamach.

Dá ndéanfá tuartha na samhla ar ais X agus Y a ghrafadh amach, bheadh ​​líne réamh-mheastacháin agat a théann i zigzags anonn is anall, rud a léiríonn go ndearna an tsamhail iarracht ró-dheacair na pointí ar fad sa tacar sonraí a chur isteach ann. a mhíniú.

Rialú Rófheistithe

Nuair a dhéanaimid oiliúint ar mhúnla, ba mhaith linn go hidéalach nach ndéanfaidh an tsamhail aon earráidí. Nuair a thagann feidhmíocht an mhúnla le chéile i dtreo réamhaisnéisí cearta a dhéanamh ar na pointí sonraí go léir sa tacar sonraí oiliúna, tá an feistiú ag éirí níos fearr. Tá samhail le dea-oiriúnach in ann beagnach gach ceann de na tacair sonraí oiliúna a mhíniú gan ró-fheistiú.

De réir mar a thraenálann samhail feabhsaítear a fheidhmíocht le himeacht ama. Laghdóidh ráta earráide an mhúnla de réir mar a théann an t-am oiliúna ar aghaidh, ach ní laghdaíonn sé ach go pointe áirithe. Is gnách gurb é an pointe ag a dtosaíonn feidhmíocht an mhúnla ar an tacar tástála ag ardú arís ná an pointe a dtarlaíonn rófheisteas. D'fhonn an oireann is fearr a fháil do mhúnla, ba mhaith linn stop a chur le hoiliúint an mhúnla ag an bpointe caillteanais is ísle ar an tacar oiliúna, sula dtosaíonn an earráid ag méadú arís. Is féidir an pointe stad is fearr a fháil amach trí fheidhmíocht an mhúnla a ghrafadh ar feadh an ama oiliúna agus stop a chur leis an oiliúint nuair is lú an caillteanas. Mar sin féin, riosca amháin a bhaineann leis an modh seo chun rófheisteas a rialú ná go gciallaíonn sonrú críochphointe na hoiliúna bunaithe ar fheidhmíocht tástála go n-áireofar na sonraí tástála beagán sa nós imeachta oiliúna, agus go gcaillfidh sé a stádas mar shonraí “gan teagmháil”.

Tá cúpla bealaí éagsúla ann inar féidir le duine dul i ngleic le rófheisteas. Modh amháin chun rófheisteas a laghdú ná tactic athshamplála a úsáid, a fheidhmíonn trí chruinneas an mhúnla a mheas. Is féidir leat úsáid a bhaint freisin a bailíochtú tacar sonraí sa bhreis ar an tacar tástála agus breac an cruinneas oiliúna in aghaidh an tacair bailíochtaithe in ionad an tacar sonraí tástála. Coinníonn sé seo do thacar sonraí tástála gan fheiceáil. Is modh athshamplála coitianta é tras-bhailíochtú K-folds. Cuireann an teicníocht seo ar do chumas do shonraí a roinnt ina bhfo-thacair a bhfuil an tsamhail oilte orthu, agus ansin déantar anailís ar fheidhmíocht na samhla ar na fo-thacair chun meastachán a dhéanamh ar an gcaoi a bhfeidhmeoidh an tsamhail ar shonraí seachtracha.

Tá úsáid a bhaint as tras-bhailíochtú ar cheann de na bealaí is fearr chun cruinneas samhla a mheas ar shonraí nach bhfacthas riamh roimhe, agus nuair a chuirtear le chéile é le tacar sonraí bailíochtaithe is minic is féidir rófheisteas a choinneáil chomh híseal agus is féidir.

Blogger agus ríomhchláraitheoir le speisialtachtaí i Foghlaim Meaisín agus Deep Learning topaicí. Tá súil ag Daniel cabhrú le daoine eile cumhacht AI a úsáid ar mhaithe le leas sóisialta.