Conectează-te cu noi
Masterclass AI:

AI 101

Ce este învățarea automată?

mm
Actualizat on

Învățarea automată este unul dintre domeniile tehnologice cu cea mai rapidă creștere, dar în ciuda cât de des sunt aruncate cuvintele „învățare automată”, poate fi dificil de înțeles ce este învățarea automată, mai exact.

Invatare mecanica nu se referă la un singur lucru, este un termen umbrelă care poate fi aplicat la multe concepte și tehnici diferite. Înțelegerea învățării automate înseamnă a fi familiarizat cu diferite forme de analiză a modelului, variabile și algoritmi. Să aruncăm o privire atentă asupra învățării automate pentru a înțelege mai bine ce cuprinde aceasta.

Ce este Machine Learning?

În timp ce termenul de învățare automată poate fi aplicat la multe lucruri diferite, în general, termenul se referă la a permite unui computer să îndeplinească sarcini fără a primi instrucțiuni explicite rând cu linie pentru a face acest lucru. Un specialist în învățarea automată nu trebuie să scrie toți pașii necesari pentru a rezolva problema, deoarece computerul este capabil să „învețe” analizând tiparele din datele și generalizând aceste modele la date noi.

Sistemele de învățare automată au trei părți de bază:

  • Intrări
  • Algoritmi
  • ieşiri

Intrările sunt datele care sunt introduse în sistemul de învățare automată, iar datele de intrare pot fi împărțite în etichete și caracteristici. Caracteristicile sunt variabilele relevante, variabilele care vor fi analizate pentru a învăța tipare și a trage concluzii. Între timp, etichetele sunt clase/descrieri date instanțelor individuale ale datelor.

Caracteristicile și etichetele pot fi utilizate în două tipuri diferite de probleme de învățare automată: învățarea supravegheată și învățarea nesupravegheată.

Învățare nesupravegheată vs

In învățare supravegheată, datele de intrare sunt însoțite de un adevăr de bază. Problemele de învățare supravegheată au valorile de ieșire corecte ca parte a setului de date, astfel încât clasele așteptate sunt cunoscute în avans. Acest lucru face posibil ca cercetătorul de date să verifice performanța algoritmului testând datele dintr-un set de date de testare și văzând ce procent de articole au fost clasificate corect.

In contrast, învățare nesupravegheată problemele nu au etichete de adevăr de bază atașate. Un algoritm de învățare automată antrenat să efectueze sarcini de învățare nesupravegheată trebuie să fie capabil să deducă singur modelele relevante din date.

Algoritmii de învățare supravegheată sunt utilizați în mod obișnuit pentru probleme de clasificare, în care există un set mare de date plin cu instanțe care trebuie sortate într-una dintre multele clase diferite. Un alt tip de învățare supravegheată este o sarcină de regresie, în care valoarea rezultată de către algoritm este de natură continuă în loc de categoric.

Între timp, algoritmii de învățare nesupravegheați sunt utilizați pentru sarcini precum estimarea densității, gruparea și învățarea reprezentării. Aceste trei sarcini au nevoie de modelul de învățare automată pentru a deduce structura datelor, nu există clase predefinite date modelului.

Să aruncăm o scurtă privire asupra unora dintre cei mai obișnuiți algoritmi utilizați atât în ​​învățarea nesupravegheată, cât și în învățarea supervizată.

Tipuri de învățare supravegheată

Algoritmii obișnuiți de învățare supravegheată includ:

  • Bayes naiv
  • Suporta mașini vectoriale
  • Regresie logistică
  • Păduri aleatorii
  • Rețele neuronale artificiale

Suporta mașini vectoriale sunt algoritmi care împart un set de date în diferite clase. Punctele de date sunt grupate în grupuri prin trasarea unor linii care separă clasele unele de altele. Punctele găsite pe o parte a liniei vor aparține unei clase, în timp ce punctele de pe cealaltă parte a liniei sunt o clasă diferită. Mașinile vectoriale de suport au scopul de a maximiza distanța dintre linie și punctele aflate de ambele părți ale liniei și, cu cât distanța este mai mare, cu atât clasificatorul este mai sigur că punctul aparține unei clase și nu unei alte clase.

Regresie logistică este un algoritm utilizat în sarcinile de clasificare binară atunci când punctele de date trebuie clasificate ca aparținând uneia dintre cele două clase. Regresia logistică funcționează prin etichetarea punctului de date cu 1 sau cu 0. Dacă valoarea percepută a punctului de date este 0.49 sau mai mică, este clasificată ca 0, în timp ce dacă este 0.5 sau mai mare este clasificată ca 1.

Algoritmi de arbore de decizie funcționează prin împărțirea seturilor de date în fragmente din ce în ce mai mici. Criteriile exacte utilizate pentru a împărți datele sunt la latitudinea inginerului de învățare automată, dar scopul este de a împărți datele în puncte de date unice, care vor fi apoi clasificate folosind o cheie.

Un algoritm de pădure aleatorie este, în esență, mulți clasificatori unici de arbore de decizie legați împreună într-un clasificator mai puternic.

Clasificator Naive Bayes calculează probabilitatea ca un anumit punct de date să fi avut loc pe baza probabilității ca un eveniment anterior să se producă. Se bazează pe teorema Bayes și plasează punctele de date în clase pe baza probabilității lor calculate. La implementarea unui clasificator Naive Bayes, se presupune că toți predictorii au aceeași influență asupra rezultatului clasei.

An Retele neuronale artificiale, sau perceptronul cu mai multe straturi, sunt algoritmi de învățare automată inspirați de structura și funcția creierului uman. Rețelele neuronale artificiale își iau numele de la faptul că sunt formate din mulți noduri/neuroni legați între ele. Fiecare neuron manipulează datele cu o funcție matematică. În rețelele neuronale artificiale, există straturi de intrare, straturi ascunse și straturi de ieșire.

Stratul ascuns al rețelei neuronale este locul în care datele sunt de fapt interpretate și analizate pentru modele. Cu alte cuvinte, este locul în care algoritmul învață. Mai mulți neuroni uniți fac rețele mai complexe capabile să învețe modele mai complexe.

Tipuri de învățare nesupravegheată

Algoritmii de învățare nesupravegheată includ:

  • K-înseamnă grupare
  • Autoencoderi
  • Analiza componentelor principale

K-înseamnă grupare este o tehnică de clasificare nesupravegheată și funcționează prin separarea punctelor de date în grupuri sau grupuri în funcție de caracteristicile lor. K-means clustering analizează caracteristicile găsite în punctele de date și distinge modele în ele care fac punctele de date găsite într-un anumit cluster de clasă mai asemănătoare între ele decât sunt cu clusterele care conțin celelalte puncte de date. Acest lucru se realizează prin plasarea centrelor posibile pentru cluster, sau centroizi, într-un grafic al datelor și reatribuirea poziției centroidului până când se găsește o poziție care minimizează distanța dintre centroid și punctele care aparțin clasei acelui centroid. Cercetatorul poate specifica numarul dorit de clustere.

Analiza componentelor principale este o tehnică care reduce un număr mare de caracteristici/variabile într-un spațiu mai mic de caracteristici/mai puține caracteristici. „Componentele principale” ale punctelor de date sunt selectate pentru conservare, în timp ce celelalte caracteristici sunt strânse într-o reprezentare mai mică. Relația dintre poțiunile de date originale este păstrată, dar deoarece complexitatea punctelor de date este mai simplă, datele sunt mai ușor de cuantificat și descris.

Autoencoderi sunt versiuni ale rețelelor neuronale care pot fi aplicate sarcinilor de învățare nesupravegheate. Codificatoarele automate sunt capabile să preia date neetichetate, în formă liberă și să le transforme în date pe care o rețea neuronală este capabilă să le folosească, creând, practic, propriile lor date de antrenament etichetate. Scopul unui autoencoder este de a converti datele de intrare și de a le reconstrui cât mai precis posibil, așa că este încurajarea rețelei să determine care caracteristici sunt cele mai importante și să le extragă.

Blogger și programator cu specialități în Invatare mecanica și Invatare profunda subiecte. Daniel speră să-i ajute pe alții să folosească puterea AI pentru binele social.