Cele mai bune

Cele 10 Algoritmi de Învățare Automată (Machine Learning) Cele Mai Bune

mm

Deși trăim într-o perioadă de inovație extraordinară în domeniul învățării automate accelerate de GPU, cercetările recente prezintă frecvent (și în mod evident) algoritmi care au fost creați cu zeci de ani în urmă, în unele cazuri chiar și cu 70 de ani în urmă.

Unii ar putea susține că multe dintre aceste metode mai vechi se încadrează mai degrabă în categoria “analize statistice” decât în cea de învățare automată și preferă să dateze apariția acestui domeniu începând cu anul 1957, odată cu inventarea Perceptronului.

Având în vedere măsura în care acești algoritmi mai vechi susțin și sunt implicați în tendințele și dezvoltările actuale din domeniul învățării automate, această poziție este discutabilă. Să aruncăm o privire asupra unor “blocuri clasice” care stau la baza inovațiilor recente, precum și asupra unor intrări mai noi care își fac drum spre faima în domeniul inteligenței artificiale.

1: Transformatori

În 2017, cercetătorii de la Google au condus o colaborare care a culminat cu publicarea lucrării “Attention Is All You Need”. Lucrarea a prezentat o arhitectură nouă care a promovat mecanismele de atenție din modelele de rețele neuronale recurente și encoder/decoder către o tehnologie centrală de transformare.

Abordarea a fost denumită Transformator și a devenit o metodologie revoluționară în procesarea limbajului natural (NLP), alimentând, printre altele, modelul de limbaj autoregresiv GPT-3.

Transformatorii au rezolvat elegant problema transducției secvențiale, cunoscută și sub numele de “transformare”, care se ocupă de prelucrarea secvențelor de intrare în secvențe de ieșire. Un transformator primește și gestionează datele în mod continuu, și nu în loturi secvențiale, permițând “persistența memoriei” pe care arhitecturile RNN nu sunt proiectate să o obțină.

2: Rețele Adversative Generative (GANs)

Deși transformatorii au obținut o acoperire media extraordinară prin lansarea și adoptarea GPT-3, Rețeaua Adversativă Generativă (GAN) a devenit o marcă recunoscută în sine și ar putea ajunge să se alăture lui “deepfake” ca verb.

Propusă pentru prima dată în 2014 și utilizată în principal pentru sinteza de imagini, o arhitectură GAN este compusă dintr-un Generator și un Discriminator. Generatorul parcurge mii de imagini dintr-un set de date, încercând să le reconstruiască în mod iterativ.

3: Mașini de Vectors Suport (SVM)

Originară în 1963, Mașina de Vectors Suport (SVM) este un algoritm de bază care apare frecvent în cercetările noi. Sub SVM, vectorii hartă dispoziția relativă a punctelor de date într-un set de date, în timp ce vectorii de suport delimitează granițele dintre diferite grupuri, caracteristici sau trăsături.

4: Clustering K-Medie

Clusteringul în general este o abordare de învățare nesupravegheată care își propune să categorizeze datele prin estimarea densității, creând o hartă a distribuției datelor studiate.

5: Pădurea Aleatoare

Pădurea Aleatoare este o metodă de învățare ensemble care mediază rezultatul dintr-o matrice de arbori de decizie pentru a stabili o previziune generală pentru rezultat.

6: Naiv Bayes

Cuplată cu estimarea densității (a se vedea 4, mai sus), un clasificator Naiv Bayes este un algoritm puternic, dar relativ ușor, capabil să estimeze probabilități pe baza caracteristicilor calculate ale datelor.

7: Vecinii Ceilalți (KNN)

Propus pentru prima dată în 1951, Vecinii Ceilalți (KNN) este un algoritm slab care apare încă frecvent în articolele academice și inițiativele de cercetare private din domeniul învățării automate.

8: Proces Decizional Markov (MDP)

Un cadru matematic introdus de matematicianul american Richard Bellman în 1957, Procesul Decizional Markov (MDP) este una dintre cele mai de bază componente ale arhitecturilor de învățare prin întărire.

9: Frecvență-Term – Frecvență-Inversă a Documentului

Frecvența Termenului (TF) împarte numărul de ori când un cuvânt apare într-un document la numărul total de cuvinte din acel document.

10: Coborârea Gradientului Stochastic

Coborârea Gradientului Stochastic (SGD) este o metodă din ce în ce mai populară pentru optimizarea antrenării modelelor de învățare automată.

Scriitor pe machine learning, specialist în domeniul sintezei de imagini umane. Foster head of research content la Metaphysic.ai.