IA 101

Ce este învățarea automată?

Publicat 5 octombrie 2019

Actualizat 25 mai 2026

Daniel Nelson

Învățarea automată este unul dintre cele mai rapide domenii tehnologice în creștere, dar în ciuda frecvenței cu care se folosesc cuvintele “învățarea automată”, poate fi dificil să se înțeleagă ce este exact învățarea automată.

Învățarea automată nu se referă la o singură lucrare, ci la un termen generic care poate fi aplicat la multe concepte și tehnici diferite. Înțelegerea învățării automate presupune familiarizarea cu diferite forme de analiză a modelului, variabile și algoritmi. Să aruncăm o privire mai atentă asupra învățării automate pentru a înțelege mai bine ce cuprinde.

Ce este învățarea automată?

În timp ce termenul de învățare automată poate fi aplicat la multe lucruri diferite, în general, termenul se referă la capacitatea unui computer de a efectua sarcini fără a primi instrucțiuni explicite, linie cu linie, pentru a face acest lucru. Un specialist în învățare automată nu trebuie să scrie toți pașii necesari pentru a rezolva problema, deoarece computerul este capabil să “învețe” prin analiza modelelor din date și generalizarea acestor modele la date noi.

Sistemele de învățare automată au trei părți de bază:

Intrări
Algoritmi
Ieșiri

Intrările sunt datele care sunt introduse în sistemul de învățare automată, iar datele de intrare pot fi împărțite în etichete și caracteristici. Caracteristicile sunt variabilele relevante, variabilele care vor fi analizate pentru a învăța modele și a trage concluzii. În timp ce etichetele sunt clase/descrieri date instanțelor de date.

Caracteristicile și etichetele pot fi utilizate în două tipuri de probleme de învățare automată: învățarea supravegheată și învățarea nesupravegheată.

Învățarea nesupravegheată vs. Învățarea supravegheată

În învățarea supravegheată, datele de intrare sunt însoțite de o adevăr de bază. Problemele de învățare supravegheată au valorile de ieșire corecte ca parte a setului de date, astfel încât clasele așteptate sunt cunoscute dinainte. Acest lucru face posibilă pentru specialistul în date să verifice performanța algoritmului prin testarea datelor pe un set de test și să vadă ce procentaj de articole a fost corect clasificat.

În contrast, învățarea nesupravegheată nu are etichete de adevăr de bază atașate. Un algoritm de învățare automată instruit pentru a efectua sarcini de învățare nesupravegheată trebuie să poată infera modelele relevante din date de la sine.

Algoritmii de învățare supravegheată sunt utilizați în mod normal pentru probleme de clasificare, unde există un set de date mare plin cu instanțe care trebuie să fie sortate în una dintre multe clase diferite. Un alt tip de învățare supravegheată este o sarcină de regresie, unde valoarea de ieșire a algoritmului este continuă în natură, și nu categorică.

În timp ce algoritmii de învățare nesupravegheată sunt utilizați pentru sarcini precum estimarea densității, clustering și învățarea reprezentării. Aceste trei sarcini necesită ca modelul de învățare automată să inferă structura datelor, nu există clase predefinite date modelului.

Să aruncăm o privire scurtă asupra unora dintre cele mai comune algoritmi utilizați în ambele învățarea nesupravegheată și învățarea supravegheată.

Tipurile de învățare supravegheată

Algoritmii comuni de învățare supravegheată includ:

Naive Bayes
Mașini de suport vectorial
Regresie logistică
Păduri aleatorii
Rețele neuronale artificiale

Mașinile de suport vectorial sunt algoritmi care împart un set de date în clase diferite. Punctele de date sunt grupate în cluster prin desenarea de linii care separă clasele una de alta. Punctele găsite pe o parte a liniei vor aparține unei clase, în timp ce punctele de pe cealaltă parte a liniei sunt o clasă diferită. Mașinile de suport vectorial își propun să maximizeze distanța dintre linie și punctele găsite pe ambele părți ale liniei, și cu cât distanța este mai mare, cu atât clasificatorul este mai sigur că punctul aparține unei clase și nu alteia.

Regresia logistică este un algoritm utilizat în sarcini de clasificare binară atunci când punctele de date trebuie să fie clasificate ca aparținând uneia dintre două clase. Regresia logistică funcționează prin etichetarea punctului de date cu 1 sau 0. Dacă valoarea percepută a punctului de date este 0,49 sau mai mică, este clasificat ca 0, în timp ce dacă este 0,5 sau mai mare, este clasificat ca 1.

Algoritmii de arbore de decizie funcționează prin împărțirea setului de date în fragmente din ce în ce mai mici. Criteriile exacte utilizate pentru a împărți datele sunt la latitudinea inginerului de învățare automată, dar scopul este de a împărți în cele din urmă datele în puncte de date individuale, care vor fi apoi clasificate utilizând o cheie.

Un algoritm de pădure aleatorie este, în esență, mulți clasificatori de arbore de decizie individuali legați împreună într-un clasificator mai puternic.

Clasificatorul Naive Bayes calculează probabilitatea ca un punct de date dat să apară pe baza probabilității unui eveniment anterior. Se bazează pe teorema lui Bayes și plasează punctele de date în clase pe baza probabilității calculate. Atunci când se implementează un clasificator Naive Bayes, se presupune că toți predictorii au aceeași influență asupra rezultatului clasei.

O rețea neuronală artificială, sau un perceptron multi-strat, sunt algoritmi de învățare automată inspirați de structura și funcția creierului uman. Rețelele neuronale artificiale își primesc numele de la faptul că sunt alcătuite din multe noduri/neuroni legați împreună. Fiecare neuron manipulează datele cu o funcție matematică. În rețelele neuronale artificiale, există straturi de intrare, straturi ascunse și straturi de ieșire.

Stratul ascuns al rețelei neuronale este unde datele sunt de fapt interpretate și analizate pentru modele. Cu alte cuvinte, este unde algoritmul învață. Cu cât mai mulți neuroni sunt legați împreună, cu atât rețelele mai complexe sunt capabile să învețe modele mai complexe.

Tipurile de învățare nesupravegheată

Algoritmii de învățare nesupravegheată includ:

Clustering K-means
Autoencoder
Analiză a componentelor principale

Clusteringul K-means este o tehnică de clasificare nesupravegheată, și funcționează prin separarea punctelor de date în cluster sau grupuri pe baza caracteristicilor lor. Clusteringul K-means analizează caracteristicile găsite în punctele de date și distinge modele în ele care fac punctele de date găsite într-o clasă cluster mai similare unele cu altele decât sunt cu cluster care conțin punctele de date ale altor clase. Acest lucru se realizează prin plasarea centrelor posibile pentru cluster, sau centroizii, într-un grafic al datelor și reasignarea poziției centroidului până când se găsește o poziție care minimizează distanța dintre centroid și punctele care aparțin clasei centroidului. Cercetătorul poate specifica numărul dorit de cluster.

Analiza componentelor principale este o tehnică care reduce un număr mare de caracteristici/variabile la un spațiu de caracteristici mai mic/mai puține caracteristici. “Componentele principale” ale punctelor de date sunt selectate pentru a fi păstrate, în timp ce celelalte caracteristici sunt comprimate într-o reprezentare mai mică. Relația dintre porțiunile originale de date este păstrată, dar deoarece complexitatea punctelor de date este mai mică, datele sunt mai ușor de cuantificat și de descris.

Autoencoderii sunt versiuni ale rețelelor neuronale care pot fi aplicate la sarcini de învățare nesupravegheată. Autoencoderii sunt capabili să ia date nelabelate, libere, și să le transforme în date pe care o rețea neuronală poate să le utilizeze, creând practic propriul lor set de date de antrenament etichetate. Scopul unui autoencoder este de a converti datele de intrare și de a le reconstrui cât mai exact posibil, astfel încât este în interesul rețelei să determine care caracteristici sunt cele mai importante și să le extragă.

Daniel Nelson

Blogger și programator cu specializări în Machine Learning și Deep Learning subiecte. Daniel speră să ajute pe alții să folosească puterea inteligenței artificiale pentru binele social.

Unite.AI

Ce este învățarea automată?

Ce este învățarea automată?

Învățarea nesupravegheată vs. Învățarea supravegheată

Tipurile de învățare supravegheată

Tipurile de învățare nesupravegheată

You may like