Kunstig intelligens
Er tradisjonell maskinlæring fortsatt relevant?

I de senere årene har generativ AI vist lovende resultater i å løse komplekse AI-oppdrag. Moderne AI-modeller som ChatGPT, Bard, LLaMA, DALL-E.3 og SAM har vist bemerkelsesverdige evner i å løse multidisiplinære problemer som visuell spørsmålssvaring, segmentering, resonnering og innholdsgenerering.
I tillegg har multimodal AI-teknikker oppstått, som kan prosessere flere data-modaliteter samtidig, dvs. tekst, bilder, lyd og video. Med disse fremgangene er det naturlig å spørre: Er vi på vei mot slutten av tradisjonell maskinlæring (ML)?
I denne artikkelen vil vi se på tilstanden for den tradisjonelle maskinlæringslandskapet i forhold til moderne generativ AI-innovasjoner.
Hva er tradisjonell maskinlæring? – Hva er dens begrensninger?
Tradisjonell maskinlæring er en bred betegnelse som dekker en rekke algoritmer som i hovedsak drives av statistikk. De to hovedtypene av tradisjonelle ML-algoritmer er overvåket og uovervåket. Disse algoritmene er designet for å utvikle modeller fra strukturerte datasett.
Standard tradisjonelle maskinlæringsalgoritmer inkluderer:
- Regresjonsalgoritmer som lineær, lasso og ridge.
- K-means klastering.
- Principal Component Analysis (PCA).
- Support Vector Machines (SVM).
- Trebaserte algoritmer som beslutningstre og tilfeldig skog.
- Boosting-modeller som gradient boosting og XGBoost.
Begrensninger av tradisjonell maskinlæring
Tradisjonell ML har følgende begrensninger:
- Begrensede skaleringsmuligheter: Disse modellene har ofte vanskelig for å skaleres med store og diverse datasett.
- Dataforberedning og funksjonsutvikling: Tradisjonell ML krever omfattende forberedning for å transformere datasett i henhold til modellkrav. I tillegg kan funksjonsutvikling være tidskrevende og kreve flere iterasjoner for å fange komplekse relasjoner mellom datafunksjoner.
- Høydimensjonale og ustrukturerte data: Tradisjonell ML har vanskelig for å håndtere komplekse datatyper som bilder, lyd, video og dokumenter.
- Tilpasning til ukjent data: Disse modellene kan ikke tilpasse seg godt til virkelige data som ikke var en del av deres treningdata.
Neuralt nettverk: Fra maskinlæring til dypt læring og utover

Neuralt nettverk (NN) modeller er langt mer kompliserte enn tradisjonelle maskinlæringsmodeller. Den enkleste NN – Multilayer perceptron (MLP) består av flere neuroner koblet sammen for å forstå informasjon og utføre oppgaver, likt hvordan et menneskehjerne fungerer.
Fremgangene i neuralt nettverksteknikk har dannet grunnlaget for overgangen fra maskinlæring til dypt læring. For eksempel er NN brukt for datavisningsoppgaver (objektdeteksjon og bilde segmentering) kalt convolutional neural networks (CNNs), som AlexNet, ResNet og YOLO.
I dag tar generativ AI-teknologi neuralt nettverksteknikk ett skritt videre, og lar det utmerke seg i ulike AI-domener. For eksempel er neuralt nettverk brukt for naturlig språkbehandling (som tekstsummering, spørsmålssvaring og oversettelse) kjent som transformatorer. Fremtredende transformator-modeller inkluderer BERT, GPT-4 og T5. Disse modellene har en innvirkning på industrier som helse, detaljhandel, markedsføring, finans osv.
Trenger vi fortsatt tradisjonelle maskinlæringsalgoritmer?

Selv om neuralt nettverk og deres moderne varianter som transformatorer har fått mye oppmerksomhet, er tradisjonelle ML-metoder fortsatt avgjørende. La oss se på hvorfor de fortsatt er relevante.
1. Enklere datakrav
Neuralt nettverk krever store datasett for trening, mens ML-modeller kan oppnå betydelige resultater med mindre og enklere datasett. Derfor er ML foretrukket over dypt læring for mindre strukturerte datasett og vice versa.
2. Enkelhet og tolkbarhet
Tradisjonelle maskinlæringsmodeller er bygget på enklere statistiske og sannsynlighetsmodeller. For eksempel etablerer en best-fit linje i lineær regresjon en inngang-utgangsrelasjon ved hjelp av minste kvadrat-metoden, en statistisk operasjon.
Liknende beslutningstre gjør bruk av probabilistiske prinsipper for å klassifisere data. Bruken av slike prinsipper tilbyr tolkbarhet og gjør det enklere for AI-utøvere å forstå hvordan ML-algoritmene fungerer.
Moderne NN-arkitekturer som transformator og diffusjonsmodeller (typisk brukt for bildegenerering som Stable Diffusion eller Midjourney) har en kompleks flerskiktet nettverksstruktur. For å forstå slike nettverk kreves det en forståelse av avanserte matematiske konsepter. Derfor kalles de også for ‘Black Boxes’.
3. Resurs-effektivitet
Moderne neuralt nettverk som store språkmodeller (LLM) trenes på cluster av dyre GPU-er i henhold til deres beregningskrav. For eksempel ble GPT4 ifølge rapporter trenet på 25000 Nvidia GPU-er i 90 til 100 dager.
Men dyre maskinvare og lang treningstid er ikke gjennomførbare for hver enkelt utøver eller AI-lag. På den andre siden tillater den beregningsmessige effektiviteten til tradisjonelle maskinlæringsalgoritmer at utøvere kan oppnå meningsfulle resultater selv med begrensede ressurser.
4. Ikke alle problemer trenger dypt læring
Dypt læring er ikke den absolutte løsningen for alle problemer. Visse scenarioer finnes der ML overstiger dypt læring.
For eksempel i medisinsk diagnose og prognose med begrensede data, en ML-algoritme for anomalideteksjon som REMED gir bedre resultater enn dypt læring. Liknende er tradisjonell maskinlæring betydelig i scenarioer med lav beregningskapasitet som en flexibel og effektiv løsning.
Primært avhenger valget av den beste modellen for et problem av organisasjonens eller utøverens behov og problemets natur.
Maskinlæring i 2023

Bilde generert med Leonardo AI
I 2023 fortsetter tradisjonell maskinlæring å utvikle seg og konkurrere med dypt læring og generativ AI. Den har flere bruksområder i industrien, særlig når det gjelder strukturerte datasett.
For eksempel håndterer mange Fast-Moving Consumer Goods (FMCG)-selskaper store mengder tabellformet data som avhenger av ML-algoritmer for kritiske oppgaver som personlige produktanbefalinger, prisoptimalisering, lagerstyring og forsyningskjedestyring.
Videre er mange visjon og språkmodeller fortsatt basert på tradisjonelle teknikker og tilbyr løsninger i hybridtilnærming og nye anvendelser. For eksempel har en nylig studie med tittelen «Trenger vi virkelig dypt læringmodeller for tidsserieprognose?» diskutert hvordan gradient-boosting-regresjonstre (GBRT) er mer effektive for tidsserieprognose enn dybe neurale nettverk.
MLs tolkbarhet forblir svært verdifullt med teknikker som SHAP (Shapley Additive Explanations) og LIME (Local Interpretable Model-agnostic Explanations). Disse teknikkene forklarer komplekse ML-modeller og gir innsikt i deres prediksjoner, og hjelper dermed ML-utøvere å forstå modellene enda bedre.
Til slutt forblir tradisjonell maskinlæring en robust løsning for ulike industrier som håndterer skalerbarhet, datakompleksitet og resursbegrensninger. Disse algoritmene er uerstattelige for dataanalyse og prediktiv modellering og vil fortsette å være en del av en data scientist’s arsenal.
Hvis emner som dette fascinerer deg, kan du utforske Unite AI for videre innsikt.












