škrbina Je li tradicionalno strojno učenje još uvijek relevantno? - Ujedinite se.AI
Povežite se s nama

Umjetna inteligencija

Je li tradicionalno strojno učenje još uvijek relevantno?

mm

Objavljeno

 on

Je li tradicionalno strojno učenje još uvijek relevantno?

Posljednjih godina Generative AI pokazao je obećavajuće rezultate u rješavanju složenih AI zadataka. Moderni AI modeli poput ChatGPT, Bard, LlaMA, DALL-E.3i SAM pokazali su izvanredne sposobnosti u rješavanju multidisciplinarnih problema poput vizualnog odgovaranja na pitanja, segmentacije, rasuđivanja i generiranja sadržaja.

Osim toga, Multimodalni AI pojavile su se tehnike koje mogu obraditi više modaliteta podataka, tj. tekst, slike, audio i video zapise istovremeno. S ovim napretkom, prirodno je zapitati se: Približavamo li se kraju tradicionalno strojno učenje (ML)?

U ovom ćemo članku pogledati stanje tradicionalnog okruženja strojnog učenja u pogledu modernih generativnih inovacija umjetne inteligencije.

Što je tradicionalno strojno učenje? – Koja su njegova ograničenja?

Tradicionalno strojno učenje širok je pojam koji pokriva široku paletu algoritama prvenstveno vođenih statistikom. Dva su glavna tipa tradicionalnih ML algoritama nadzirani i nenadzirani. Ovi su algoritmi dizajnirani za razvoj modela iz strukturiranih skupova podataka.

Standardni tradicionalni algoritmi strojnog učenja uključuju:

  • Regresijski algoritmi kao što su linearni, laso i grebenski.
  • K-znači grupiranje.
  • Analiza glavnih komponenti (PCA).
  • Support Vector Machines (SVM).
  • Algoritmi temeljeni na stablima kao što su stabla odlučivanja i nasumične šume.
  • Modeli pojačavanja kao što su pojačavanje gradijenta i XGBoost.

Ograničenja tradicionalnog strojnog učenja

Tradicionalni ML ima sljedeća ograničenja:

  1. Ograničena skalabilnost: Ovi modeli često trebaju pomoć za skaliranje s velikim i raznolikim skupovima podataka.
  2. Predobrada podataka i inženjering značajki: Tradicionalni ML zahtijeva opsežnu pretprocesiranje za transformaciju skupova podataka prema zahtjevima modela. Također, inženjering značajki može biti dugotrajan i zahtijeva višestruke iteracije za hvatanje složenih odnosa između značajki podataka.
  3. Visokodimenzionalni i nestrukturirani podaci: Tradicionalni ML se bori sa složenim tipovima podataka kao što su slike, zvuk, video i dokumenti.
  4. Prilagodljivost nevidljivim podacima: Ti se modeli možda neće dobro prilagoditi podacima iz stvarnog svijeta koji nisu dio njih podatke o treningu.

Neuronska mreža: prelazak sa strojnog učenja na dubinsko učenje i šire

Neuronska mreža: prelazak sa strojnog učenja na dubinsko učenje i šire

Modeli neuronske mreže (NN) daleko su kompliciraniji od tradicionalnih modela strojnog učenja. Najjednostavniji NN – Višeslojni perceptron (MLP) sastoji se od nekoliko neurona povezanih zajedno za razumijevanje informacija i obavljanje zadataka, slično funkcioniranju ljudskog mozga.

Napredak u tehnikama neuronskih mreža stvorio je osnovu za prijelaz s strojnog učenja do dubokog učenja. Na primjer, pozivaju se NN koji se koriste za zadatke računalnog vida (detekcija objekata i segmentacija slike). konvolucijske neuronske mreže (CNN), Kao što su AlexNet, ResNeti Yolo.

Današnja generativna AI tehnologija podigla je tehnike neuronskih mreža jedan korak dalje, dopuštajući joj da briljira u raznim domenama AI. Na primjer, neuronske mreže koje se koriste za zadatke obrade prirodnog jezika (poput sažimanja teksta, odgovaranja na pitanja i prijevoda) poznate su kao transformatori. Istaknuti modeli transformatora uključuju BERTI, GPT-4i T5. Ovi modeli stvaraju utjecaj na industrije u rasponu od zdravstva, maloprodaje, marketinga, financije, Itd

Trebamo li još uvijek tradicionalne algoritme strojnog učenja?

Trebamo li još uvijek tradicionalne algoritme strojnog učenja?

Iako su neuronske mreže i njihove moderne varijante poput transformatora dobile veliku pozornost, tradicionalne ML metode ostaju ključne. Pogledajmo zašto su još uvijek relevantni.

1. Jednostavniji zahtjevi za podatke

Neuronske mreže zahtijevaju velike skupove podataka za obuku, dok ML modeli mogu postići značajne rezultate s manjim i jednostavnijim skupovima podataka. Stoga se ML daje prednost u odnosu na duboko učenje za manje strukturirane skupove podataka i obrnuto.

2. Jednostavnost i interpretabilnost

Tradicionalni modeli strojnog učenja izgrađeni su na temelju jednostavnijih statističkih modela i modela vjerojatnosti. Na primjer, linija koja najbolje odgovara Linearna regresija uspostavlja odnos input-output pomoću metode najmanjih kvadrata, statističke operacije.

Slično tome, stabla odlučivanja koriste načela vjerojatnosti za klasifikaciju podataka. Korištenje takvih načela nudi mogućnost tumačenja i olakšava praktičarima umjetne inteligencije razumijevanje rada ML algoritama.

Moderne NN arhitekture poput transformatorskih i difuzijskih modela (obično se koriste za generiranje slike kao što je Stabilna difuzija or Sredina putovanja) imaju složenu višeslojnu strukturu mreže. Razumijevanje takvih mreža zahtijeva razumijevanje naprednih matematičkih koncepata. Zbog toga se nazivaju i 'crnim kutijama'.

3. Učinkovitost resursa

Moderne neuronske mreže poput Large Language Models (LLM) treniraju se na klasterima skupih GPU-ova u skladu s njihovim računalnim zahtjevima. Na primjer, GPT4 je navodno treniran 25000 Nvidia GPU-a 90 do 100 dana.

Međutim, skupi hardver i dugotrajna obuka nisu izvedivi za svakog praktičara ili AI tim. S druge strane, računalna učinkovitost tradicionalnih algoritama strojnog učenja omogućuje praktičarima postizanje značajnih rezultata čak i uz ograničene resurse.

4. Nije za sve probleme potrebno duboko učenje

Duboko učenje nije apsolutno rješenje za sve probleme. Postoje određeni scenariji u kojima ML nadmašuje duboko učenje.

Na primjer, u medicinska dijagnoza i prognoza s ograničenim podacima, ML algoritam za otkrivanje anomalija kao što je REMED daje bolje rezultate od dubokog učenja. Slično tome, tradicionalno strojno učenje značajno je u scenarijima s niskim računalnim kapacitetom kao fleksibilno i učinkovito rješenje.

Prvenstveno, odabir najboljeg modela za bilo koji problem ovisi o potrebama organizacije ili praktičara i prirodi problema koji je u pitanju.

Strojno učenje 2023

Strojno učenje 2023

Slika generirana korištenjem Leonardo A.I.

U 2023. tradicionalno strojno učenje nastavlja se razvijati i natječe se s dubokim učenjem i generativnom umjetnom inteligencijom. Ima nekoliko namjena u industriji, osobito kada se radi sa strukturiranim skupovima podataka.

Na primjer, mnogi Roba široke potrošnje (FMCG) tvrtke se bave velikim brojem tabličnih podataka oslanjajući se na ML algoritme za kritične zadatke kao što su personalizirane preporuke proizvoda, optimizacija cijena, upravljanje zalihama i optimizacija opskrbnog lanca.

Nadalje, mnogi vizija i jezični modeli još uvijek se temelje na tradicionalnim tehnikama, nudeći rješenja u hibridnim pristupima i novim aplikacijama. Na primjer, nedavna studija pod naslovom "Trebamo li doista modele dubokog učenja za predviđanje vremenskih serija?” je raspravljao o tome kako su regresijska stabla s povećanjem gradijenta (GBRT) učinkovitija za predviđanje vremenskih serija nego duboke neuronske mreže.

Interpretabilnost ML-a ostaje vrlo vrijedna s tehnikama poput SHAP (Shapley Additive Explanations) i VAPNENA (Lokalna interpretabilna modela-agnostička objašnjenja). Ove tehnike objašnjavaju složene ML modele i pružaju uvid u njihova predviđanja, pomažući praktičarima ML-a da još bolje razumiju svoje modele.

Konačno, tradicionalno strojno učenje ostaje robusno rješenje za različite industrije koje se bave skalabilnošću, složenošću podataka i ograničenjima resursa. Ovi algoritmi su nezamjenjivi za analizu podataka i prediktivno modeliranje te će i dalje biti dio arsenal podatkovnog znanstvenika.

Ako vas intrigiraju ovakve teme, istražite Ujedinite AI za daljnje uvide.