cung Çfarë është mësimi i thellë? (2024) - Unite.AI
Lidhu me ne
Masterclass i AI:

UA 101

Çfarë është mësimi i thellë?

mm
Përditësuar on

Të mësuarit e thellë është një nga fushat më me ndikim dhe me rritje më të shpejtë në inteligjencën artificiale. Megjithatë, marrja e një kuptimi intuitiv të të mësuarit të thellë mund të jetë i vështirë sepse termi mësim i thellë mbulon një sërë algoritmesh dhe teknikash të ndryshme. Të mësuarit e thellë është gjithashtu një nëndisiplinë e mësimit të makinerive në përgjithësi, kështu që është e rëndësishme të kuptojmë se çfarë është mësimi i makinerive për të kuptuar mësimin e thellë.

Isfarë është mësimi i makinerisë?

Mësim i thellë është një zgjerim i disa koncepteve që burojnë nga mësimi i makinerive, kështu që për këtë arsye, le të marrim një minutë për të shpjeguar se çfarë është mësimi i makinës.

E thënë thjesht, mësimi i makinerive është një metodë për të mundësuar kompjuterët të kryejnë detyra specifike pa koduar në mënyrë eksplicite çdo rresht të algoritmeve të përdorura për të përmbushur ato detyra. Ka shumë algoritme të ndryshme të mësimit të makinerive, por një nga algoritmet më të përdorura është a perceptron me shumë shtresa. Një perceptron me shumë shtresa quhet gjithashtu një rrjet nervor dhe përbëhet nga një seri nyjesh/neuronesh të lidhur së bashku. Ekzistojnë tre shtresa të ndryshme në një perceptron me shumë shtresa: shtresa hyrëse, shtresa e fshehur dhe shtresa dalëse.

Shtresa hyrëse i merr të dhënat në rrjet, ku ato manipulohen nga nyjet në shtresën e mesme/të fshehur. Nyjet në shtresën e fshehur janë funksione matematikore që mund të manipulojnë të dhënat që vijnë nga shtresa hyrëse, duke nxjerrë modele përkatëse nga të dhënat hyrëse. Kështu "mëson" rrjeti nervor. Rrjetet nervore marrin emrin e tyre nga fakti se ato janë të frymëzuara nga struktura dhe funksioni i trurit të njeriut.

Lidhjet ndërmjet nyjeve në rrjet kanë vlera të quajtura pesha. Këto vlera janë në thelb supozime se si të dhënat në një shtresë lidhen me të dhënat në shtresën tjetër. Ndërsa rrjeti trajnohet, peshat rregullohen dhe qëllimi është që peshat/supozimet rreth të dhënave përfundimisht të konvergojnë në vlera që përfaqësojnë me saktësi modelet kuptimplote brenda të dhënave.

Funksionet e aktivizimit janë të pranishme në nyjet e rrjetit, dhe këto funksione aktivizimi i transformojnë të dhënat në një mënyrë jolineare, duke i mundësuar rrjetit të mësojë paraqitje komplekse të të dhënave. Funksionet e aktivizimit shumëzojnë vlerat hyrëse me vlerat e peshës dhe shtojnë një term paragjykim.

Çfarë është mësimi i thellë?

Mësimi i thellë është termi i dhënë për arkitekturat e mësimit të makinerive që bashkojnë shumë perceptrone shumështresore së bashku, në mënyrë që të mos ketë vetëm një shtresë të fshehur, por shumë shtresa të fshehura. Sa më "i thellë" të jetë rrjeti nervor i thellë, aq më të sofistikuara mund të mësojë rrjeti.

Rrjetet e shtresave të thella të përbëra nga neurone nganjëherë referohen si rrjete plotësisht të lidhura ose shtresa plotësisht të lidhura, duke iu referuar faktit që një neuron i caktuar mban një lidhje me të gjithë neuronet që e rrethojnë. Rrjetet e lidhura plotësisht mund të kombinohen me funksione të tjera të mësimit të makinerive për të krijuar arkitektura të ndryshme të të mësuarit të thellë.

Lloje të ndryshme të të mësuarit të thellë

Ka një shumëllojshmëri arkitekturash të të mësuarit të thellë të përdorura nga studiues dhe inxhinierë, dhe secila prej arkitekturave të ndryshme ka rastin e vet të përdorimit të specialitetit.

Rrjetet nervore konvolucionale

Rrjetet nervore konvolucionale, ose CNN, janë arkitektura e rrjetit nervor që përdoret zakonisht në krijimin e sistemeve të vizionit kompjuterik. Struktura e rrjeteve nervore konvolucionale u mundëson atyre të interpretojnë të dhënat e imazhit, duke i kthyer ato në numra që një rrjet plotësisht i lidhur mund të interpretojë. Një CNN ka katër komponentë kryesorë:

  • Shtresat konvolucionale
  • Shtresat e marrjes së mostrave/bashkimit
  • Funksionet e aktivizimit
  • Shtresa plotësisht të lidhura

Shtresat konvolucionale janë ato që marrin imazhet si hyrje në rrjet, duke analizuar imazhet dhe duke marrë vlerat e pikselëve. Nën-kampionimi ose bashkimi është vendi ku vlerat e imazhit konvertohen/reduktohen për të thjeshtuar paraqitjen e imazheve dhe për të zvogëluar ndjeshmërinë e filtrave të imazhit ndaj zhurmës. Funksionet e aktivizimit kontrollojnë se si rrjedhin të dhënat nga një shtresë në shtresën tjetër, dhe shtresat plotësisht të lidhura janë ato që analizojnë vlerat që përfaqësojnë imazhin dhe mësojnë modelet e mbajtura në ato vlera.

RNN/LSTM

Rrjetet nervore të përsëritura, ose RNN, janë të njohura për detyrat ku renditja e të dhënave ka rëndësi, ku rrjeti duhet të mësojë për një sekuencë të dhënash. RNN-të zakonisht aplikohen për probleme si përpunimi i gjuhës natyrore, pasi renditja e fjalëve ka rëndësi kur deshifrohet kuptimi i një fjalie. Pjesa "përsëritëse" e termit Rrjet nervor i përsëritur vjen nga fakti se dalja për një element të caktuar në një sekuencë varet nga llogaritja e mëparshme si dhe nga llogaritja aktuale. Ndryshe nga format e tjera të rrjeteve nervore të thella, RNN-të kanë "kujtime" dhe informacioni i llogaritur në hapat e ndryshëm kohorë në sekuencë përdoret për të llogaritur vlerat përfundimtare.

Ka shumë lloje të RNN-ve, duke përfshirë RNN-të dydrejtimëshe, të cilat marrin parasysh artikujt e ardhshëm në sekuencë, përveç artikujve të mëparshëm, kur llogaritin vlerën e një artikulli. Një lloj tjetër i RNN është a Kujtesa afatshkurtër e gjatë, ose LSTM, rrjet. LSTM-të janë lloje të RNN që mund të trajtojnë zinxhirë të gjatë të dhënash. RNN-të e rregullta mund të bien viktimë e diçkaje të quajtur "problemi i gradientit në shpërthim". Ky problem ndodh kur zinxhiri i të dhënave hyrëse bëhet jashtëzakonisht i gjatë, por LSTM-të kanë teknika për të luftuar këtë problem.

Autoenkoder

Shumica e arkitekturave të mësimit të thellë të përmendura deri më tani zbatohen për problemet e të mësuarit të mbikëqyrur, në vend të detyrave të të mësuarit të pambikëqyrura. Autoenkoderët janë në gjendje të transformojnë të dhënat e pambikëqyrura në një format të mbikëqyrur, duke lejuar përdorimin e rrjeteve nervore për problemin.

Autoenkoder përdoren shpesh për të zbuluar anomalitë në grupet e të dhënave, një shembull i të mësuarit të pambikëqyrur pasi natyra e anomalisë nuk dihet. Shembuj të tillë të zbulimit të anomalive përfshijnë zbulimin e mashtrimit për institucionet financiare. Në këtë kontekst, qëllimi i një kodifikuesi automatik është të përcaktojë një bazë të modeleve të rregullta në të dhëna dhe të identifikojë anomalitë ose pikat e jashtme.

Struktura e një koduesi automatik është shpesh simetrike, me shtresa të fshehura të renditura në mënyrë që dalja e rrjetit të ngjan me hyrjen. Katër llojet e autoenkoderëve që përdorin shpesh janë:

  • Autoenkoderë të rregullt/të thjeshtë
  • Koduesit me shumë shtresa
  • Koduesit konvolucionalë
  • Kodues të rregulluar

Autoenkoderët e rregullt/të thjeshtë janë vetëm rrjeta nervore me një shtresë të vetme të fshehur, ndërsa autoenkoderët me shumë shtresa janë rrjete të thella me më shumë se një shtresë të fshehur. Autoenkoduesit konvolucionistë përdorin shtresa konvolucionale në vend të, ose si shtesë, shtresave të lidhura plotësisht. Autoenkoderët e rregulluar përdorin një lloj specifik funksioni të humbjes që lejon rrjetin nervor të kryejë funksione më komplekse, funksione të ndryshme nga thjesht kopjimi i hyrjeve në dalje.

Rrjetet kundërshtare gjeneruese

Rrjetet gjeneruese kundërshtare (GAN) janë në fakt rrjete të shumta nervore të thella në vend të vetëm një rrjeti. Dy modele të mësimit të thellë trajnohen në të njëjtën kohë dhe rezultatet e tyre futen në rrjetin tjetër. Rrjetet janë në konkurrencë me njëra-tjetrën dhe duke qenë se ata kanë akses në të dhënat dalëse të njëri-tjetrit, të dy mësojnë nga këto të dhëna dhe përmirësohen. Të dy rrjetet në thelb po luajnë një lojë falsifikimi dhe zbulimi, ku modeli gjenerues përpiqet të krijojë raste të reja që do të mashtrojnë modelin detektiv/diskriminuesin. GAN-et janë bërë të njohura në fushën e vizionit kompjuterik.

Përmbledhje e të mësuarit të thellë

Të mësuarit e thellë zgjeron parimet e rrjeteve nervore për të krijuar modele të sofistikuara që mund të mësojnë modele komplekse dhe t'i përgjithësojnë ato modele në grupet e të dhënave të ardhshme. Rrjetet nervore konvolucionale përdoren për të interpretuar imazhet, ndërsa RNN/LSTM përdoren për të interpretuar të dhënat sekuenciale. Autoenkoderët mund t'i transformojnë detyrat e mësimit të pambikëqyrura në detyra mësimore të mbikëqyrura. Së fundi, GAN-et janë rrjete të shumta të vendosura kundër njëri-tjetrit që janë veçanërisht të dobishëm për detyrat e vizionit kompjuterik.

Bloger dhe programues me specialitete në Mësim Machine Mësim i thellë temave. Daniel shpreson të ndihmojë të tjerët të përdorin fuqinë e AI për të mirën sociale.