Inteligență artificială
Este Traditional Machine Learning Încă Relevant?

În ultimii ani, Inteligența Artificială Generativă a arătat rezultate promițătoare în rezolvarea unor sarcini complexe de inteligență artificială. Modelele moderne de IA, cum ar fi ChatGPT, Bard, LLaMA, DALL-E.3 și SAM, au demonstrat capacități remarcabile în rezolvarea unor probleme multidisciplinare, cum ar fi răspunsurile la întrebări vizuale, segmentarea, raționamentul și generarea de conținut.
Mai mult, tehnicile de învățare multimodală au apărut, capabile să proceseze multiple modalități de date, adică text, imagini, audio și videoclipuri, simultan. Cu aceste progrese, este firesc să ne întrebăm: Ne apropiem de sfârșitul învățării tradiționale a mașinilor (ML)?
În acest articol, vom examina starea peisajului tradițional de învățare a mașinilor în legătură cu inovațiile moderne de IA generativă.
Ce este Învățarea Tradițională a Mașinilor? – Care sunt Limitările Sale?
Învățarea tradițională a mașinilor este un termen larg care acoperă o varietate de algoritmi, în principal conduși de statistici. Cele două tipuri principale de algoritmi de învățare tradițională a mașinilor sunt supravegheați și nesupravegheați. Acești algoritmi sunt proiectați pentru a dezvolta modele din seturi de date structurate.
Algoritmii standard de învățare tradițională a mașinilor includ:
- Algoritmii de regresie, cum ar fi liniar, lasso și ridge.
- Clustering K-means.
- Analiza Componentelor Principale (PCA).
- Mașinile cu Vectori de Suport (SVM).
- Algoritmii bazati pe arbori, cum ar fi arborii de decizie și pădurea aleatoare.
- Modelele de îmbunătățire, cum ar fi gradient boosting și XGBoost.
Limitările Învățării Tradiționale a Mașinilor
Învățarea tradițională a mașinilor are următoarele limitări:
- Scalabilitate Limitată: Aceste modele au nevoie adesea de ajutor pentru a scala cu seturi de date mari și diverse.
- Preprocesarea Datelor și Ingineria Caracteristicilor: Învățarea tradițională a mașinilor necesită o preprocesare extinsă pentru a transforma seturile de date în conformitate cu cerințele modelului. De asemenea, ingineria caracteristicilor poate fi consumatoare de timp și necesită multiple iterații pentru a captura relații complexe între caracteristicile datelor.
- Date de Înaltă Dimensiune și Nestructurate: Învățarea tradițională a mașinilor se luptă cu tipuri complexe de date, cum ar fi imagini, audio, videoclipuri și documente.
- Adaptabilitate la Date Nevizionate: Aceste modele pot să nu se adapteze bine la date din lumea reală care nu au făcut parte din datele de antrenare.
Rețeaua Neuronală: Mutarea de la Învățarea Mașinilor la Învățarea Adâncă și Dincolo

Modelele de rețea neuronală (NN) sunt mult mai complexe decât modelele tradiționale de învățare a mașinilor. Cel mai simplu NN – Perceptronul Multistrat – constă din mai multe neuroni conectați împreună pentru a înțelege informații și a efectua sarcini, similar cu modul în care funcționează creierul uman.
Progresele în tehnica rețelelor neuronale au format baza pentru trecerea de la învățarea mașinilor la învățarea adâncă. De exemplu, NN utilizate pentru sarcini de vedere (detectarea obiectelor și segmentarea imaginilor) sunt numite rețele neuronale convolutive (CNN), cum ar fi AlexNet, ResNet și YOLO.
Astăzi, tehnologia IA generativă duce tehnica rețelelor neuronale un pas mai departe, permițându-i să exceleze în diverse domenii de IA. De exemplu, rețelele neuronale utilizate pentru sarcini de procesare a limbajului natural (cum ar fi rezumarea textului, răspunsurile la întrebări și traducerea) sunt cunoscute sub numele de transformatori. Modelele proeminente de transformatori includ BERT, GPT-4 și T5. Aceste modele au un impact asupra industriilor, de la sănătate, retail, marketing, finanțe etc.
Mai Avem Nevoie de Algoritmi de Învățare Tradițională a Mașinilor?

În timp ce rețelele neuronale și variantele lor moderne, cum ar fi transformatorii, au primit multă atenție, metodele tradiționale de învățare a mașinilor rămân cruciale. Să vedem de ce sunt încă relevante.
1. Cerințe de Date Mai Simple
Rețelele neuronale cer seturi de date mari pentru antrenare, în timp ce modelele de învățare a mașinilor pot obține rezultate semnificative cu seturi de date mai mici și mai simple. Astfel, învățarea mașinilor este preferată în loc de învățarea adâncă pentru seturi de date structurate mici și viceversa.
2. Simplitate și Interpretabilitate
Modelele tradiționale de învățare a mașinilor sunt construite pe baza unor modele statistice și de probabilitate mai simple. De exemplu, o linie de potrivire în regresia liniară stabilește relația intrare-ieșire utilizând metoda celor mai mici pătrate, o operațiune statistică.
Similar, arborii de decizie utilizează principii probabilistice pentru clasificarea datelor. Utilizarea unor astfel de principii oferă interpretabilitate și face ca pentru practicienii de IA să fie mai ușor să înțeleagă funcționarea algoritmilor de învățare a mașinilor.
Arhitecturile moderne de rețea neuronală, cum ar fi transformatorii și modelele de difuzie (de obicei utilizate pentru generarea de imagini, cum ar fi Stable Diffusion sau Midjourney) au o structură de rețea multistrat complexă. Înțelegerea unor astfel de rețele necesită o înțelegere a unor concepte matematice avansate. De aceea, ele sunt numite și “cutii negre”.
3. Eficiență a Resurselor
Rețelele neuronale moderne, cum ar fi Modelele Lingvistice Mari (LLM), sunt antrenate pe cluster de GPU-uri scumpe, conform cerințelor lor computaționale. De exemplu, GPT4 a fost antrenat pe 25000 de GPU-uri Nvidia timp de 90 până la 100 de zile.
Cu toate acestea, hardware-ul scump și timpul de antrenare lung nu sunt fezabile pentru fiecare practician sau echipă de IA. Pe de altă parte, eficiența computațională a algoritmilor de învățare tradițională a mașinilor permite practicienilor să obțină rezultate semnificative chiar și cu resurse limitate.
4. Nu Toate Problemele Necesită Învățarea Adâncă
Învățarea Adâncă nu este soluția absolută pentru toate problemele. Există anumite scenarii în care învățarea mașinilor performează mai bine decât învățarea adâncă.
De exemplu, în diagnosticarea și prognoza medicală cu date limitate, un algoritm de învățare a mașinilor pentru detectarea anomaliilor cum ar fi REMED oferă rezultate mai bune decât învățarea adâncă. Similar, învățarea mașinilor tradițională este semnificativă în scenarii cu capacitate computațională scăzută, ca o soluție flexibilă și eficientă.
În primul rând, alegerea celui mai bun model pentru orice problemă depinde de nevoile organizației sau practicianului și de natura problemei în cauză.
Învățarea Mașinilor în 2023

Imagine Generată Utilizând Leonardo AI
În 2023, învățarea mașinilor tradițională continuă să evolueze și concurează cu învățarea adâncă și IA generativă. Are multiple utilizări în industrie, în special atunci când se lucrează cu seturi de date structurate.
De exemplu, multe companii de bunuri de consum rapide (FMCG) lucrează cu cantități mari de date tabulare, bazându-se pe algoritmi de învățare a mașinilor pentru sarcini critice, cum ar fi recomandări personalizate de produse, optimizarea prețurilor, gestionarea stocurilor și optimizarea lanțului de aprovizionare.
Mai mult, multe modele de vedere și limbaj se bazează încă pe tehnici tradiționale, oferind soluții în abordări hibride și aplicații emergente. De exemplu, un studiu recent intitulat “Oare Chiar Avem Nevoie de Modele de Învățare Adâncă pentru Previziunea Seriilor de Timp?” a discutat cum arborii de regresie cu îmbunătățirea gradientului (GBRT) sunt mai eficienți pentru previziunea seriilor de timp decât rețelele neuronale adânci.
Interpretabilitatea învățării mașinilor rămâne foarte valoroasă, cu tehnici cum ar fi SHAP (Explicații Aditive Shapley) și LIME (Explicații Localizate și Interpretabile ale Modelului). Aceste tehnici explică modele complexe de învățare a mașinilor și oferă insight-uri despre predicțiile lor, ajutând practicienii de IA să înțeleagă mai bine modelele lor.
În final, învățarea mașinilor tradițională rămâne o soluție robustă pentru diverse industrii, abordând scalabilitatea, complexitatea datelor și constrângerile de resurse. Aceste algoritmi sunt de neînlocuit pentru analiza datelor și modelarea predictivă și vor continua să fie o parte a arsenalului unui specialist în date.
Dacă subiecte de acest fel vă intrigă, explorați Unite AI pentru insight-uri suplimentare.












