škrbina Ali je tradicionalno strojno učenje še vedno pomembno? - Združi se.AI
Povežite se z nami

Umetna inteligenca

Ali je tradicionalno strojno učenje še vedno pomembno?

mm

objavljeno

 on

Ali je tradicionalno strojno učenje še vedno pomembno?

V zadnjih letih je Generative AI pokazal obetavne rezultate pri reševanju kompleksnih nalog AI. Sodobni modeli AI, kot so ChatGPT, Bard, Klici, DALL-E.3in SAM so pokazali izjemne sposobnosti pri reševanju multidisciplinarnih problemov, kot so vizualni odgovori na vprašanja, segmentacija, sklepanje in ustvarjanje vsebine.

Poleg tega, Multimodalni AI pojavile so se tehnike, ki so sposobne obdelave več modalitet podatkov, tj. besedila, slik, zvoka in videa hkrati. Ob teh napredkih se je povsem naravno vprašati: ali se bližamo koncu tradicionalno strojno učenje (ML)?

V tem članku si bomo ogledali stanje tradicionalne krajine strojnega učenja glede sodobnih generativnih inovacij AI.

Kaj je tradicionalno strojno učenje? – Kakšne so njegove omejitve?

Tradicionalno strojno učenje je širok izraz, ki zajema široko paleto algoritmov, ki jih v glavnem poganja statistika. Dve glavni vrsti tradicionalnih algoritmov ML sta nadzorovano in nenadzorovano. Ti algoritmi so zasnovani za razvoj modelov iz strukturiranih nizov podatkov.

Standardni tradicionalni algoritmi strojnega učenja vključujejo:

  • Regresijski algoritmi, kot so linearni, laso in grebenski.
  • K-pomeni grozdenje.
  • Analiza glavnih komponent (PCA).
  • Podporni vektorski stroji (SVM).
  • Drevesni algoritmi, kot so odločitvena drevesa in naključni gozd.
  • Modeli povečanja, kot sta gradientno povečanje in XGBoost.

Omejitve tradicionalnega strojnega učenja

Tradicionalno ML ima naslednje omejitve:

  1. Omejena razširljivost: Ti modeli pogosto potrebujejo pomoč pri prilagajanju z velikimi in raznolikimi nabori podatkov.
  2. Predhodna obdelava podatkov in inženiring funkcij: Tradicionalno ML zahteva obsežno predhodno obdelavo za preoblikovanje podatkovnih nizov v skladu z zahtevami modela. Prav tako je inženiring funkcij lahko dolgotrajen in zahteva več iteracij za zajem kompleksnih odnosov med funkcijami podatkov.
  3. Visokodimenzionalni in nestrukturirani podatki: Tradicionalni ML se spopada s kompleksnimi vrstami podatkov, kot so slike, zvok, videi in dokumenti.
  4. Prilagodljivost nevidnim podatkom: Ti modeli se morda ne bodo dobro prilagodili podatkom iz resničnega sveta, ki niso bili del njih podatki o usposabljanju.

Nevronska mreža: prehod od strojnega učenja k globokemu učenju in več

Nevronska mreža: prehod od strojnega učenja k globokemu učenju in več

Modeli nevronske mreže (NN) so veliko bolj zapleteni od tradicionalnih modelov strojnega učenja. Najenostavnejši NN – Večplastni perceptron (MLP) je sestavljen iz več nevronov, povezanih skupaj za razumevanje informacij in opravljanje nalog, podobno kot delujejo človeški možgani.

Napredek v tehnikah nevronske mreže je bil podlaga za prehod iz strojnega učenja do globokega učenja. Imenujejo se na primer NN, ki se uporabljajo za naloge računalniškega vida (zaznavanje objektov in segmentacija slike). konvolucijske nevronske mreže (CNN), Kot je AlexNet, ResNetin YOLO.

Današnja tehnologija generativne umetne inteligence popelje tehnike nevronskih mrež še korak dlje, kar ji omogoča, da blesti na različnih področjih umetne inteligence. Na primer, nevronske mreže, ki se uporabljajo za naloge obdelave naravnega jezika (kot so povzemanje besedila, odgovarjanje na vprašanja in prevajanje), so znane kot transformatorji. Ugledni modeli transformatorjev vključujejo BERTI, GPT-4in T5. Ti modeli ustvarjajo vpliv na industrije, od zdravstva, maloprodaje, trženja, financiranje, Itd

Ali še vedno potrebujemo tradicionalne algoritme strojnega učenja?

Ali še vedno potrebujemo tradicionalne algoritme strojnega učenja?

Medtem ko so nevronske mreže in njihove sodobne različice, kot so transformatorji, prejele veliko pozornosti, tradicionalne metode ML ostajajo ključne. Poglejmo, zakaj so še vedno aktualni.

1. Enostavnejše podatkovne zahteve

Nevronske mreže zahtevajo velike nabore podatkov za usposabljanje, medtem ko lahko modeli ML dosežejo pomembne rezultate z manjšimi in preprostejšimi nabori podatkov. Tako ima ML prednost pred globokim učenjem za manjše strukturirane nize podatkov in obratno.

2. Enostavnost in interpretabilnost

Tradicionalni modeli strojnega učenja so zgrajeni na enostavnejših statističnih in verjetnostnih modelih. Na primer, najbolj primerna linija v linearne regresije vzpostavi input-output razmerje z uporabo metode najmanjših kvadratov, statistične operacije.

Podobno odločitvena drevesa uporabljajo verjetnostna načela za razvrščanje podatkov. Uporaba takšnih principov ponuja interpretabilnost in strokovnjakom za umetno inteligenco olajša razumevanje delovanja algoritmov ML.

Sodobne arhitekture NN, kot so transformatorski in difuzijski modeli (ki se običajno uporabljajo za ustvarjanje slik, kot je Stabilna difuzija or vmesna pot) imajo zapleteno večplastno mrežno strukturo. Razumevanje takih omrežij zahteva razumevanje naprednih matematičnih konceptov. Zato jih imenujemo tudi "črne skrinjice".

3. Učinkovitost virov

Sodobne nevronske mreže, kot so veliki jezikovni modeli (LLM), se usposabljajo na grozdih dragih grafičnih procesorjev glede na njihove računalniške zahteve. Na primer, GPT4 naj bi bil usposobljen 25000 grafičnih procesorjev Nvidia za 90 do 100 dni.

Vendar draga strojna oprema in dolgotrajno usposabljanje nista izvedljiva za vsakega izvajalca ali ekipo AI. Po drugi strani pa računalniška učinkovitost tradicionalnih algoritmov strojnega učenja omogoča strokovnjakom, da dosežejo pomembne rezultate tudi z omejenimi viri.

4. Vse težave ne potrebujejo poglobljenega učenja

Globoko učenje ni absolutna rešitev za vse težave. Obstajajo določeni scenariji, kjer ML prekaša globoko učenje.

Na primer, v medicinska diagnoza in prognoza z omejenimi podatki, algoritem ML za odkrivanje anomalije kot REMED prinaša boljše rezultate kot globoko učenje. Podobno je tradicionalno strojno učenje pomembno v scenarijih z nizko računalniško zmogljivostjo prilagodljiva in učinkovita rešitev.

Predvsem je izbira najboljšega modela za kateri koli problem odvisna od potreb organizacije ali izvajalca in narave problema.

Strojno učenje leta 2023

Strojno učenje leta 2023

Slika, ustvarjena z uporabo Leonardo A.I.

Leta 2023 se tradicionalno strojno učenje še naprej razvija in tekmuje z globokim učenjem in generativno umetno inteligenco. Ima več uporab v industriji, zlasti pri delu s strukturiranimi nabori podatkov.

Na primer, veliko Blago široke porabe (FMCG) podjetja se ukvarjajo z množico tabelarnih podatkov, ki se zanašajo na algoritme ML za kritične naloge, kot so prilagojena priporočila za izdelke, optimizacija cen, upravljanje zalog in optimizacija dobavne verige.

Nadalje, mnogi vid in jezikovni modeli še vedno temeljijo na tradicionalnih tehnikah, ponujajo rešitve v hibridnih pristopih in nastajajočih aplikacijah. Na primer, nedavna študija z naslovom "Ali res potrebujemo modele globokega učenja za napovedovanje časovnih vrst?” je razpravljal o tem, kako so regresijska drevesa s povečanjem gradienta (GBRT) učinkovitejša za napovedovanje časovnih vrst kot globoke nevronske mreže.

Interpretabilnost ML ostaja zelo dragocena s tehnikami, kot je OBLIKA (Shapley Additive Explanations) in LIME (Lokalne interpretabilne modelno-agnostične razlage). Te tehnike pojasnjujejo zapletene modele strojnega jezika in zagotavljajo vpogled v njihove napovedi, s čimer strokovnjakom za strojno učenje pomagajo še bolje razumeti njihove modele.

Nazadnje, tradicionalno strojno učenje ostaja robustna rešitev za različne industrije, ki obravnavajo razširljivost, kompleksnost podatkov in omejitve virov. Ti algoritmi so nenadomestljivi za analizo podatkov in napovedno modeliranje in bodo še naprej del arzenal podatkovnega znanstvenika.

Če vas takšne teme zanimajo, raziščite Združite AI za nadaljnja spoznanja.