Umělá inteligence

Je tradiční strojové učení stále relevantní?

Zveřejněno

6 měsíci

Listopadu 6, 2023

Je tradiční strojové učení stále relevantní?

Generativní AI v posledních letech vykazuje slibné výsledky při řešení složitých úloh AI. Moderní modely AI jako ChatGPT, Bard, Lama, DALL-E.3, a SAM předvedli pozoruhodné schopnosti při řešení multidisciplinárních problémů, jako je vizuální zodpovězení otázek, segmentace, uvažování a generování obsahu.

Navíc, Multimodální AI objevily se techniky schopné zpracovávat více modalit dat, tj. text, obrázky, zvuk a videa současně. S těmito pokroky je přirozené se ptát: Blížíme se ke konci tradiční strojové učení (ML)?

V tomto článku se podíváme na stav tradičního prostředí strojového učení týkající se moderních generativních inovací AI.

Co je tradiční strojové učení? – Jaká jsou jeho omezení?

Tradiční strojové učení je široký pojem, který pokrývá širokou škálu algoritmů primárně založených na statistikách. Dva hlavní typy tradičních algoritmů ML jsou pod dohledem i bez dozoru. Tyto algoritmy jsou navrženy pro vývoj modelů ze strukturovaných datových sad.

Mezi standardní tradiční algoritmy strojového učení patří:

Regresní algoritmy jako lineární, laso a hřebenové.
K-means Clustering.
Analýza hlavních komponent (PCA).
Podpora vektorových strojů (SVM).
Algoritmy založené na stromech, jako jsou rozhodovací stromy a náhodný les.
Posilovací modely, jako je zesílení gradientu a XGBoost.

Omezení tradičního strojového učení

Tradiční ML má následující omezení:

Omezená škálovatelnost: Tyto modely často potřebují pomoc při škálování s velkými a různorodými datovými sadami.
Předzpracování dat a inženýrství funkcí: Tradiční ML vyžaduje rozsáhlé předběžné zpracování k transformaci datových sad podle požadavků modelu. Také inženýrství funkcí může být časově náročné a vyžaduje více iterací k zachycení složitých vztahů mezi datovými funkcemi.
Vysokorozměrná a nestrukturovaná data: Tradiční ML se potýká se složitými datovými typy, jako jsou obrázky, zvuk, videa a dokumenty.
Adaptabilita na neviditelná data: Tyto modely se nemusí dobře přizpůsobit reálným datům, která nebyla jejich součástí tréninková data.

Neuronová síť: přechod od strojového učení k hlubokému učení a dále

Modely neuronových sítí (NN) jsou mnohem komplikovanější než tradiční modely strojového učení. Nejjednodušší NN – Vícevrstvý perceptron (MLP) sestává z několika neuronů spojených dohromady, aby rozuměly informacím a vykonávaly úkoly, podobně jako funguje lidský mozek.

Pokroky v technikách neuronových sítí vytvořily základ pro přechod z strojového učení až po hluboké učení. Například se nazývají NN používané pro úlohy počítačového vidění (detekce objektů a segmentace obrazu). konvoluční neuronové sítě (CNN), Jako AlexNet, ResNet, a Yolo.

Technologie generativní umělé inteligence dnes posouvá techniky neuronových sítí o krok dále a umožňuje jim vynikat v různých doménách umělé inteligence. Například neuronové sítě používané pro úlohy zpracování přirozeného jazyka (jako je sumarizace textu, odpovídání na otázky a překlad) jsou známé jako transformátory. Mezi prominentní modely transformátorů patří BERTI, GPT-4, a T5. Tyto modely mají dopad na průmyslová odvětví od zdravotnictví, maloobchodu, marketingu, financovat, Etc.

Potřebujeme stále tradiční algoritmy strojového učení?

Zatímco neuronové sítě a jejich moderní varianty, jako jsou transformátory, získaly velkou pozornost, tradiční metody ML zůstávají zásadní. Podívejme se, proč jsou stále relevantní.

1. Jednodušší požadavky na data

Neuronové sítě vyžadují velké datové sady pro trénování, zatímco modely ML mohou dosáhnout významných výsledků s menšími a jednoduššími datovými sadami. ML je tedy upřednostňováno před hlubokým učením pro menší strukturované datové sady a naopak.

2. Jednoduchost a interpretovatelnost

Tradiční modely strojového učení jsou postaveny na jednodušších statistických a pravděpodobnostních modelech. Například nejlépe padnoucí linka in lineární regrese zavádí vztah vstup-výstup pomocí metody nejmenších čtverců, což je statistická operace.

Podobně rozhodovací stromy využívají pro klasifikaci dat pravděpodobnostní principy. Použití těchto principů nabízí interpretovatelnost a usnadňuje praktikům umělé inteligence pochopit fungování algoritmů ML.

Moderní architektury NN, jako jsou transformátorové a difúzní modely (typicky používané pro generování obrazu, např Stabilní difúze or Střední cesta) mají složitou vícevrstvou síťovou strukturu. Pochopení takových sítí vyžaduje pochopení pokročilých matematických konceptů. To je důvod, proč jsou také označovány jako „černé skříňky“.

3. Efektivita zdrojů

Moderní neuronové sítě, jako jsou velké jazykové modely (LLM), jsou trénovány na shlucích drahých GPU podle jejich výpočetních požadavků. Například na GPT4 bylo údajně trénováno 25000 XNUMX GPU Nvidia po dobu 90 až 100 dnů.

Drahý hardware a zdlouhavý tréninkový čas však nejsou proveditelné pro každého praktika nebo tým AI. Na druhou stranu výpočetní efektivita tradičních algoritmů strojového učení umožňuje praktikům dosahovat smysluplných výsledků i s omezenými zdroji.

4. Ne všechny problémy vyžadují hluboké učení

Hluboké učení není absolutním řešením všech problémů. Existují určité scénáře, kdy ML překonává hluboké učení.

Například v lékařská diagnóza a prognóza s omezenými daty, algoritmus ML detekce anomálií jako REMED přináší lepší výsledky než hluboké učení. Podobně je tradiční strojové učení významné ve scénářích s nízkou výpočetní kapacitou jako a flexibilní a efektivní řešení.

Výběr nejlepšího modelu pro jakýkoli problém závisí především na potřebách organizace nebo odborníka a povaze daného problému.

Strojové učení v roce 2023

Obrázek generovaný pomocí Leonardo A.I.

V roce 2023 se tradiční strojové učení nadále vyvíjí a konkuruje hlubokému učení a generativní umělé inteligenci. V průmyslu má několik použití, zejména při práci se strukturovanými datovými soubory.

Například mnoho Rychleobrátkové spotřební zboží (FMCG) společnosti pracují s velkým množstvím tabulkových dat, které se spoléhají na algoritmy ML pro kritické úkoly, jako jsou personalizovaná doporučení produktů, optimalizace cen, řízení zásob a optimalizace dodavatelského řetězce.

Dále, mnoho vize a jazykové modely jsou stále založeny na tradičních technikách a nabízejí řešení v hybridních přístupech a nově vznikajících aplikacích. Například nedávná studie s názvem „Opravdu potřebujeme modely hlubokého učení pro prognózování časových řad?“ diskutoval o tom, jak jsou regresní stromy zvyšující gradient (GBRT) efektivnější prognózování časových řad než hluboké neuronové sítě.

Interpretovatelnost ML zůstává velmi cenná s technikami, jako je SHAP (Shapley Additive Explanations) a LIME (Local Interpretable Model-Agnostic Explanations). Tyto techniky vysvětlují složité modely ML a poskytují náhled na jejich předpovědi, čímž pomáhají praktikům ML ještě lépe porozumět jejich modelům.

A konečně, tradiční strojové učení zůstává robustním řešením pro různá odvětví, která řeší škálovatelnost, složitost dat a omezení zdrojů. Tyto algoritmy jsou nenahraditelné pro analýzu dat a prediktivní modelování a budou i nadále součástí arzenál datových vědců.

Pokud vás podobná témata lákají, prozkoumejte je Sjednotit AI pro další poznatky.