Inteligența artificială
Învățarea automată tradițională este încă relevantă?

În ultimii ani, IA generativă a arătat rezultate promițătoare în rezolvarea sarcinilor complexe de AI. Modelele moderne de AI cum ar fi Chat GPT, Bard, Lamă, DALL-E.3 și SAM au demonstrat capacități remarcabile în rezolvarea problemelor multidisciplinare precum răspunsul vizual la întrebări, segmentarea, raționamentul și generarea de conținut.
În plus, AI multimodal Au apărut tehnici capabile să prelucreze mai multe modalități de date, adică text, imagini, audio și videoclipuri simultan. Cu aceste progrese, este firesc să ne întrebăm: Ne apropiem de sfârșitul învățarea automată tradițională (ML)?
În acest articol, ne vom uita la starea peisajului tradițional de învățare automată în ceea ce privește inovațiile moderne AI generative.
Ce este învățarea automată tradițională? – Care sunt limitările sale?
Învățarea automată tradițională este un termen larg care acoperă o mare varietate de algoritmi conduși în principal de statistici. Cele două tipuri principale de algoritmi ML tradiționali sunt supravegheat și nesupravegheat. Acești algoritmi sunt proiectați pentru a dezvolta modele din seturi de date structurate.
Algoritmii standard tradiționali de învățare automată includ:
- Algoritmi de regresie precum liniar, lasso și creastă.
- K înseamnă Clustering.
- Analiza componentelor principale (PCA).
- Suport Vector Machines (SVM).
- Algoritmi bazați pe arbori, cum ar fi arbori de decizie și pădure aleatoare.
- Boosting modele, cum ar fi gradient boosting și XGBoost.
Limitările învățării automate tradiționale
ML tradițional are următoarele limitări:
- Scalabilitate limitată: Aceste modele au adesea nevoie de ajutor pentru scalare cu seturi de date mari și diverse.
- Preprocesarea datelor și ingineria caracteristicilor: ML tradițională necesită o preprocesare extinsă pentru a transforma seturile de date conform cerințelor modelului. De asemenea, ingineria caracteristicilor poate consuma mult timp și necesită mai multe iterații pentru a captura relații complexe între caracteristicile datelor.
- Date mari dimensiuni și nestructurate: ML tradițional se luptă cu tipuri de date complexe, cum ar fi imagini, audio, videoclipuri și documente.
- Adaptabilitate la date nevăzute: Este posibil ca aceste modele să nu se adapteze bine la datele din lumea reală care nu făceau parte din ele date de instruire.
Rețea neuronală: Trecerea de la învățare automată la învățare profundă și mai departe
Modelele de rețele neuronale (NN) sunt mult mai complicate decât modelele tradiționale de învățare automată. Cel mai simplu NN - Perceptron multistrat (MLP) constă din mai mulți neuroni conectați împreună pentru a înțelege informații și pentru a îndeplini sarcini, similar cu modul în care funcționează un creier uman.
Progresele în tehnicile rețelelor neuronale au format baza pentru tranziția de la învățarea automată la învățarea profundă. De exemplu, sunt numite NN utilizate pentru sarcini de viziune computerizată (detecția obiectelor și segmentarea imaginii). rețele neuronale convoluționale (CNN), Cum ar fi AlexNet, ResNet și Yolo.
Astăzi, tehnologia AI generativă duce tehnicile rețelelor neuronale cu un pas mai departe, permițându-i să exceleze în diferite domenii ale AI. De exemplu, rețelele neuronale utilizate pentru sarcinile de procesare a limbajului natural (cum ar fi rezumarea textului, răspunsul la întrebări și traducerea) sunt cunoscute ca transformatoare. Modelele de transformatoare proeminente includ OARET, GPT-4 și T5. Aceste modele creează un impact asupra industriilor, de la asistență medicală, retail, marketing, finanţa, Etc
Mai avem nevoie de algoritmi tradiționali de învățare automată?
În timp ce rețelele neuronale și variantele lor moderne, cum ar fi transformatoarele, au primit multă atenție, metodele tradiționale ML rămân cruciale. Să vedem de ce sunt încă relevante.
1. Cerințe de date mai simple
Rețelele neuronale necesită seturi de date mari pentru antrenament, în timp ce modelele ML pot obține rezultate semnificative cu seturi de date mai mici și mai simple. Astfel, ML este favorizată față de învățarea profundă pentru seturi de date structurate mai mici și invers.
2. Simplitate și interpretabilitate
Modelele tradiționale de învățare automată sunt construite pe baza unor modele statistice și de probabilitate mai simple. De exemplu, o linie cea mai potrivită regresie liniara stabilește relația intrare-ieșire folosind metoda celor mai mici pătrate, o operație statistică.
În mod similar, arborii de decizie folosesc principii probabilistice pentru clasificarea datelor. Utilizarea unor astfel de principii oferă interpretabilitate și facilitează pentru practicienii AI înțelegerea funcționării algoritmilor ML.
Arhitecturile NN moderne, cum ar fi modelele de transformare și difuzie (utilizate de obicei pentru generarea de imagini, cum ar fi Difuzie stabilă or Mijlocul călătoriei) au o structură de rețea complexă cu mai multe straturi. Înțelegerea unor astfel de rețele necesită înțelegerea conceptelor matematice avansate. De aceea, sunt denumite și „Cutii negre”.
3. Eficiența resurselor
Rețelele neuronale moderne, cum ar fi modelele de limbaj mari (LLM) sunt antrenate pe grupuri de GPU-uri scumpe în funcție de cerințele lor de calcul. De exemplu, se pare că GPT4 a fost instruit 25000 de GPU-uri Nvidia timp de 90 până la 100 zile.
Cu toate acestea, hardware-ul scump și timpul de pregătire îndelungat nu sunt fezabile pentru fiecare practicant sau echipă AI. Pe de altă parte, eficiența computațională a algoritmilor tradiționali de învățare automată le permite practicienilor să obțină rezultate semnificative chiar și cu resurse limitate.
4. Nu toate problemele au nevoie de învățare profundă
Invatare profunda nu este soluția absolută pentru toate problemele. Există anumite scenarii în care ML depășește învățarea profundă.
De exemplu, în diagnosticul și prognosticul medical cu date limitate, un algoritm ML pentru detectarea anomaliilor precum REMED oferă rezultate mai bune decât învățarea profundă. În mod similar, învățarea automată tradițională este semnificativă în scenariile cu capacitate de calcul scăzută ca a solutie flexibila si eficienta.
În primul rând, selecția celui mai bun model pentru orice problemă depinde de nevoile organizației sau ale practicianului și de natura problemei în cauză.
Învățare automată în 2023
Imagine generată folosind Leonardo A.I.
În 2023, învățarea automată tradițională continuă să evolueze și concurează cu învățarea profundă și cu inteligența artificială generativă. Are mai multe utilizări în industrie, în special atunci când se ocupă cu seturi de date structurate.
De exemplu, mulți Bunuri de larg consum (FMCG) companiile se ocupă cu o cantitate mare de date tabulare bazându-se pe algoritmi ML pentru sarcini critice, cum ar fi recomandări personalizate de produse, optimizarea prețurilor, gestionarea stocurilor și optimizarea lanțului de aprovizionare.
Mai departe, multe modele de viziune și limbaj se bazează încă pe tehnici tradiționale, oferind soluții în abordări hibride și aplicații emergente. De exemplu, un studiu recent intitulat „Avem cu adevărat nevoie de modele de învățare profundă pentru prognoza serii temporale?” a discutat despre modul în care arborii de regresie care stimulează gradientul (GBRT) sunt mai eficienți pentru prognoza serii temporale decât rețelele neuronale profunde.
Interpretabilitatea ML rămâne foarte valoroasă cu tehnici precum SHAP (Shapley Additive Explicații) și LĂMÂIE VERDE (Model interpretabil local-explicații agnostice). Aceste tehnici explică modele complexe de ML și oferă perspective despre predicțiile lor, ajutând astfel practicanții ML să-și înțeleagă și mai bine modelele.
În cele din urmă, învățarea automată tradițională rămâne o soluție robustă pentru diverse industrii care abordează scalabilitatea, complexitatea datelor și constrângerile de resurse. Acești algoritmi sunt de neînlocuit pentru analiza datelor și modelarea predictivă și vor continua să facă parte din a arsenalul omului de știință al datelor.
Dacă subiecte de genul acesta te intrigă, explorează Uniți AI pentru mai multe perspective.