Artificiell intelligens

Är traditionell maskinlĂ€rning fortfarande relevant?

mm
Is Traditional Machine Learning Still Relevant?

På senare tid har generativ AI visat lovande resultat i att lösa komplexa AI-uppgifter. Moderna AI-modeller som ChatGPT, Bard, LLaMA, DALL-E.3 och SAM har visat imponerande förmågor i att lösa multidisciplinära problem som visuell frågebesvarning, segmentering, resonemang och innehållsgenerering.

Dessutom har multimodala AI-tekniker dykt upp, som kan bearbeta flera datamodaliteter samtidigt, dvs. text, bilder, ljud och videor. Med dessa framsteg är det naturligt att undra: Närmade vi oss slutet på traditionell maskinlärning (ML)?

I den här artikeln kommer vi att undersöka tillståndet för den traditionella maskinlärningslandskapet i förhållande till moderna generativa AI-innovationer.

Vad är traditionell maskinlärning? – Vilka är dess begränsningar?

Traditionell maskinlärning är ett brett begrepp som omfattar en mängd olika algoritmer som i huvudsak drivs av statistik. De två huvudsakliga typerna av traditionella ML-algoritmer är övervakad och oövervakad. Dessa algoritmer är utformade för att utveckla modeller från strukturerade datamängder.

Standardtraditionella maskinlärningsalgoritmer inkluderar:

  • Regressionsalgoritmer som linjär, lasso och ridge.
  • K-means kluster.
  • Principal Component Analysis (PCA).
  • Support Vector Machines (SVM).
  • Trädbaserade algoritmer som beslutsTräd och slumpmässig skog.
  • Boosting-modeller som gradientboosting och XGBoost.

Begränsningar av traditionell maskinlärning

Traditionell ML har följande begränsningar:

  1. Begränsad skalbarhet: Dessa modeller behöver ofta hjälp för att skala med stora och varierade datamängder.
  2. Dataförbehandling och funktionsteknik: Traditionell ML kräver omfattande förbehandling för att omvandla datamängder enligt modellkraven. Dessutom kan funktionsteknik vara tidskrävande och kräva flera iterationer för att fånga komplexa samband mellan datafunktioner.
  3. Högdimensionell och ostrukturerad data: Traditionell ML kämpar med komplexa datatyper som bilder, ljud, videor och dokument.
  4. Anpassning till osedda data: Dessa modeller kan inte anpassa sig väl till verkliga data som inte var en del av deras träningsdata.

Neurala nätverk: Från maskinlärning till djupinlärning och bortom

Neurala nÀtverk: FrÄn maskinlÀrning till djupinlÀrning och bortom

Neurala nätverksmodeller (NN) är betydligt mer komplicerade än traditionella maskinlärningsmodeller. Den enklaste NN – Multilayer-perceptron (MLP) består av flera neuroner som är sammankopplade för att förstå information och utföra uppgifter, liknande hur ett mänskligt hjärna fungerar.

Framsteg inom neurala nätverkstekniker har bildat grunden för övergången från maskinlärning till djupinlärning. Till exempel används NN för datorseendeuppgifter (objektdetektering och bildsegmentering) som kallas konvolutionsneurala nätverk (CNN), såsom AlexNet, ResNet och YOLO.

Idag tar generativ AI-teknologi neurala nätverkstekniker ett steg längre, vilket gör det möjligt för dem att utmärka sig inom olika AI-domäner. Till exempel används neurala nätverk för naturligt språkbehandling (såsom textsummering, frågesvar och översättning) som kallas transformatorer. Framstående transformatormodeller inkluderar BERT, GPT-4 och T5. Dessa modeller har en betydande inverkan på branscher som hälsovård, detaljhandel, marknadsföring, finans etc.

Behöver vi fortfarande traditionella maskinlärningsalgoritmer?

Behöver vi fortfarande traditionella maskinlÀrningsalgoritmer?

Medan neurala nätverk och deras moderna varianter som transformatorer har fått mycket uppmärksamhet, förblir traditionella ML-metoder avgörande. Låt oss se varför de fortfarande är relevanta.

1. Enklare datakrav

Neurala nätverk kräver stora datamängder för träning, medan ML-modeller kan uppnå betydande resultat med mindre och enklare datamängder. Därför föredras ML över djupinlärning för mindre strukturerade datamängder och vice versa.

2. Enkelhet och tolkbarhet

Traditionella maskinlärningsmodeller byggs på enklare statistiska och sannolikhetsmodeller. Till exempel etablerar en bästa anpassningslinje i linjär regression indata-utdata-relationen med hjälp av minsta kvadrat-metoden, en statistisk operation.

På samma sätt använder beslutsTräd sannolikhetsprinciper för att klassificera data. Användningen av sådana principer erbjuder tolkbarhet och gör det lättare för AI-praktiker att förstå hur ML-algoritmer fungerar.

Modern neural nätverksarkitektur som transformator och diffusionsmodeller (vanligtvis används för bildgenerering som Stable Diffusion eller Midjourney) har en komplex, flerskiktad nätverksstruktur. Att förstå sådana nätverk kräver en förståelse för avancerade matematiska begrepp. Därför kallas de också för “svarta lådor”.

3. Resurseffektivitet

Modern neurala nätverk som stora språkmodeller (LLM) tränas på kluster av dyra GPU:er enligt deras beräkningskrav. Till exempel tränades GPT4 på 25000 Nvidia GPU:er under 90 till 100 dagar.

Men dyra hårdvaror och långa träningsperioder är inte möjliga för varje praktiker eller AI-team. Å andra sidan tillåter den beräkningsmässiga effektiviteten hos traditionella maskinlärningsalgoritmer praktiker att uppnå meningsfulla resultat även med begränsade resurser.

4. Inte alla problem behöver djupinlärning

Djupinlärning är inte den absoluta lösningen för alla problem. Vissa scenarier finns där ML överträffar djupinlärning.

Till exempel i medicinsk diagnos och prognos med begränsad data, en ML-algoritm för avvikelsedetektering som REMED ger bättre resultat än djupinlärning. På samma sätt är traditionell maskinlärning betydande i scenarier med låg beräkningsförmåga som en flexibel och effektiv lösning.

Primärt beror valet av den bästa modellen för ett problem på organisationens eller praktikerns behov och problemets natur.

Maskinlärning 2023

MaskinlÀrning 2023

Bild genererad med Leonardo AI

2023 fortsätter traditionell maskinlärning att utvecklas och konkurrerar med djupinlärning och generativ AI. Den har flera användningsområden inom industrin, särskilt när det gäller strukturerade datamängder.

Till exempel hanterar många snabbrörliga konsumentvaror (FMCG) stora mängder tabelldata som förlitar sig på ML-algoritmer för kritiska uppgifter som personliga produkttips, prisoptymiering, lagerhantering och leveranskedjeoptimering.

Ytterligare är många datorseende- och språkmodeller fortfarande baserade på traditionella tekniker, som erbjuder lösningar i hybridtillvägagångssätt och framväxande tillämpningar. Till exempel diskuterar en nylig studie med titeln “Behöver vi verkligen djupinlärningsmodeller för tidsserieprognos?” hur gradientboostade regressionsTräd (GBRT) är mer effektiva för tidsserieprognos än djupa neurala nätverk.

ML:s tolkbarhet förblir mycket värdefull med tekniker som SHAP (Shapley Additive Explanations) och LIME (Local Interpretable Model-agnostic Explanations). Dessa tekniker förklarar komplexa ML-modeller och ger insikt om deras förutsägelser, vilket hjälper ML-praktiker att förstå sina modeller ännu bättre.

Till sist förblir traditionell maskinlärning en robust lösning för olika branscher som hanterar skalbarhet, datakomplexitet och resursbegränsningar. Dessa algoritmer är oumbärliga för dataanalys och prediktiv modellering och kommer att fortsätta att vara en del av en datavetarens arsenal.

Om ämnen som dessa intresserar dig, utforska Unite AI för ytterligare insikter.

Haziqa Àr en Data Scientist med omfattande erfarenhet av att skriva tekniskt innehÄll för AI- och SaaS-företag.