stub Kas yra mašininis mokymasis? - Vienykitės.AI
Susisiekti su mumis
AI meistriškumo klasė:

AI 101 m

Kas yra mašinų mokymasis?

mm
Atnaujinta on

Mašininis mokymasis yra viena iš sparčiausiai augančių technologijų sričių, tačiau nepaisant to, kaip dažnai mėtomi žodžiai „mašininis mokymasis“, gali būti sunku tiksliai suprasti, kas yra mašininis mokymasis.

Mašininis mokymasis nenurodo tik vieno dalyko, tai yra bendras terminas, kuris gali būti taikomas daugeliui skirtingų sąvokų ir metodų. Suprasti mašininį mokymąsi reiškia susipažinti su įvairiomis modelių analizės formomis, kintamaisiais ir algoritmais. Pažvelkime į mašininį mokymąsi, kad geriau suprastume, ką jis apima.

Kas yra mašininis mokymasis?

Nors terminas mašininis mokymasis gali būti taikomas daugeliui skirtingų dalykų, apskritai šis terminas reiškia galimybę kompiuteriui atlikti užduotis negaunant aiškių eilučių nurodymų tai padaryti. Mašininio mokymosi specialistas neturi rašyti visų veiksmų, reikalingų problemai išspręsti, nes kompiuteris gali „mokytis“ analizuodamas duomenų šablonus ir apibendrindamas šiuos modelius naujiems duomenims.

Mašininio mokymosi sistemas sudaro trys pagrindinės dalys:

  • Įėjimai
  • Algoritmai
  • Išėjimai

Įvesties duomenys yra duomenys, kurie įvedami į mašininio mokymosi sistemą, o įvesties duomenis galima suskirstyti į etiketes ir funkcijas. Savybės yra atitinkami kintamieji, kintamieji, kurie bus analizuojami, norint sužinoti modelius ir padaryti išvadas. Tuo tarpu etiketės yra klasės/apibūdinimai, suteikiami atskiriems duomenų atvejams.

Funkcijos ir etiketės gali būti naudojamos dviejų skirtingų tipų mašininio mokymosi problemoms spręsti: prižiūrimas mokymasis ir neprižiūrimas mokymasis.

Neprižiūrimas ir prižiūrimas mokymasis

In prižiūrimas mokymasis, įvesties duomenis lydi pagrindinė tiesa. Prižiūrimos mokymosi problemos turi teisingas išvesties reikšmes kaip duomenų rinkinio dalį, todėl numatomos klasės žinomos iš anksto. Tai leidžia duomenų mokslininkui patikrinti algoritmo veikimą, išbandydamas duomenis bandymo duomenų rinkinyje ir matydamas, koks elementų procentas buvo teisingai klasifikuotas.

Priešingai, neprižiūrimas mokymasis problemos nėra priklijuotos tiesos etikečių. Mašininio mokymosi algoritmas, išmokytas atlikti neprižiūrimas mokymosi užduotis, turi sugebėti pats nustatyti atitinkamus duomenų modelius.

Prižiūrimi mokymosi algoritmai paprastai naudojami klasifikavimo problemoms spręsti, kai yra didelis duomenų rinkinys, užpildytas egzemplioriais, kurie turi būti surūšiuoti į vieną iš daugelio skirtingų klasių. Kitas prižiūrimo mokymosi tipas yra regresijos užduotis, kai algoritmo išvesta reikšmė yra ne kategoriška, o tęstinio pobūdžio.

Tuo tarpu neprižiūrimi mokymosi algoritmai naudojami tokioms užduotims kaip tankio įvertinimas, grupavimas ir vaizdavimo mokymasis. Šioms trims užduotims reikia mašininio mokymosi modelio, kad būtų galima nustatyti duomenų struktūrą, modeliui nėra iš anksto nustatytų klasių.

Trumpai pažvelkime į kai kuriuos dažniausiai naudojamus mokymosi be priežiūros ir prižiūrimo algoritmus.

Prižiūrimo mokymosi tipai

Įprasti prižiūrimi mokymosi algoritmai apima:

  • Naivus Bayesas
  • Palaikykite vektorines mašinas
  • Logistinė regresija
  • Atsitiktiniai miškai
  • Dirbtiniai neuroniniai tinklai

Palaikykite vektorines mašinas yra algoritmai, kurie suskirsto duomenų rinkinį į skirtingas klases. Duomenų taškai sugrupuojami į grupes nubrėžiant linijas, kurios skiria klases viena nuo kitos. Vienoje linijos pusėje rasti taškai priklausys vienai klasei, o kitoje linijos pusėje esantys taškai – kitai klasei. Pagalbinės vektoriaus mašinos siekia maksimaliai padidinti atstumą tarp linijos ir taškų, esančių abiejose linijos pusėse, ir kuo didesnis atstumas, tuo labiau įsitikinęs, kad taškas priklauso vienai klasei, o ne kitai klasei.

Logistinė regresija yra algoritmas, naudojamas dvejetainio klasifikavimo užduotyse, kai duomenų taškus reikia klasifikuoti kaip priklausančius vienai iš dviejų klasių. Logistinė regresija pažymi duomenų tašką 1 arba 0. Jei suvokiama duomenų taško reikšmė yra 0.49 arba mažesnė, ji klasifikuojama kaip 0, o jei ji yra 0.5 arba didesnė, ji klasifikuojama kaip 1.

Sprendimų medžio algoritmai veikia dalijant duomenų rinkinius į mažesnius ir mažesnius fragmentus. Tikslius kriterijus, naudojamus skirstant duomenis, nustato mašininio mokymosi inžinierius, tačiau tikslas yra galiausiai padalyti duomenis į atskirus duomenų taškus, kurie vėliau bus klasifikuojami naudojant raktą.

Atsitiktinis miško algoritmas iš esmės yra daug atskirų sprendimų medžio klasifikatorių, sujungtų į galingesnį klasifikatorių.

Šios Naivus Bayes klasifikatorius apskaičiuoja tikimybę, kad įvyko tam tikras duomenų taškas, remiantis ankstesnio įvykio tikimybe. Jis pagrįstas Bayes teorema ir suskirsto duomenų taškus į klases pagal jų apskaičiuotą tikimybę. Diegiant naivų Bayes klasifikatorių, daroma prielaida, kad visi prognozuotojai turi vienodą įtaką klasės rezultatui.

An Dirbtinis neuroninis tinklas, arba daugiasluoksnis perceptronas, yra mašininio mokymosi algoritmai, įkvėpti žmogaus smegenų struktūros ir funkcijų. Dirbtiniai neuroniniai tinklai gavo savo pavadinimą dėl to, kad jie yra sudaryti iš daugybės mazgų / neuronų, sujungtų kartu. Kiekvienas neuronas manipuliuoja duomenimis naudodamas matematines funkcijas. Dirbtiniuose neuroniniuose tinkluose yra įvesties sluoksniai, paslėpti sluoksniai ir išvesties sluoksniai.

Paslėptas neuroninio tinklo sluoksnis yra vieta, kur duomenys iš tikrųjų interpretuojami ir analizuojami modeliams. Kitaip tariant, čia algoritmas mokosi. Daugiau neuronų, sujungtų kartu, sukuria sudėtingesnius tinklus, galinčius išmokti sudėtingesnių modelių.

Neprižiūrimo mokymosi tipai

Neprižiūrimi mokymosi algoritmai apima:

  • K reiškia grupavimą
  • Automatiniai kodavimo įrenginiai
  • Pagrindinių komponentų analizė

K reiškia grupavimą yra neprižiūrimas klasifikavimo metodas, kuris veikia skirstant duomenų taškus į grupes arba grupes pagal jų ypatybes. K-means klasterizavimas analizuoja duomenų taškuose esančias ypatybes ir išskiria juose šablonus, dėl kurių tam tikros klasės klasteryje rasti duomenų taškai yra panašesni vienas į kitą nei į grupes, kuriose yra kiti duomenų taškai. Tai pasiekiama pateikiant galimus klasterio centrus arba centroidus į duomenų grafiką ir iš naujo priskiriant centroido padėtį, kol bus rasta padėtis, sumažinanti atstumą tarp centroido ir taškų, priklausančių to centroido klasei. Tyrėjas gali nurodyti norimą klasterių skaičių.

Pagrindinių komponentų analizė yra metodas, kuris sumažina didelį funkcijų / kintamųjų skaičių į mažesnę funkcijų erdvę / mažiau funkcijų. Duomenų taškų „pagrindiniai komponentai“ parenkami išsaugoti, o kitos funkcijos suspaudžiamos į mažesnę atvaizdą. Ryšys tarp pradinių duomenų gėrimų išsaugomas, tačiau kadangi duomenų taškų sudėtingumas yra paprastesnis, duomenis lengviau kiekybiškai įvertinti ir apibūdinti.

Automatiniai kodavimo įrenginiai yra neuroninių tinklų versijos, kurios gali būti taikomos atliekant neprižiūrimas mokymosi užduotis. Automatiniai kodavimo įrenginiai gali paimti nepažymėtus, laisvos formos duomenis ir paversti juos duomenimis, kuriuos gali naudoti neuroninis tinklas, iš esmės sukurdami savo pažymėtus mokymo duomenis. Automatinio kodavimo įrenginio tikslas yra konvertuoti įvesties duomenis ir kuo tiksliau juos atkurti, todėl tinklas yra skatinamas nustatyti, kurios funkcijos yra svarbiausios, ir jas išskirti.

Tinklaraštininkas ir programuotojas, turintis specialybių Mašininis mokymasis ir Gilus mokymasis temomis. Danielis tikisi padėti kitiems panaudoti AI galią socialinei gerovei.