кочан Уместно ли е все още традиционното машинно обучение? - Обединете.AI
Свържете се с нас

Изкуствен интелект

Уместно ли е все още традиционното машинно обучение?

mm

Публикуван

 on

Уместно ли е все още традиционното машинно обучение?

През последните години Generative AI показа обещаващи резултати при решаването на сложни AI задачи. Съвременните AI модели като ChatGPT, Бард, Обаждания, DALL-E.3, и SAM са демонстрирали забележителни способности при решаването на мултидисциплинарни проблеми като визуални отговори на въпроси, сегментиране, разсъждения и генериране на съдържание.

Освен това, Мултимодален AI появиха се техники, способни да обработват множество модалности на данни, т.е. текст, изображения, аудио и видео едновременно. С тези подобрения е естествено да се чудим: Приближаваме ли края на традиционно машинно обучение (ML)?

В тази статия ще разгледаме състоянието на традиционния ландшафт на машинното обучение по отношение на съвременните генеративни иновации на ИИ.

Какво е традиционно машинно обучение? – Какви са неговите ограничения?

Традиционното машинно обучение е широк термин, който обхваща голямо разнообразие от алгоритми, управлявани предимно от статистика. Двата основни типа традиционни ML алгоритми са контролирани и ненадзорни. Тези алгоритми са предназначени за разработване на модели от структурирани набори от данни.

Стандартните традиционни алгоритми за машинно обучение включват:

  • Алгоритми за регресия като линеен, ласо и ръб.
  • K-означава групиране.
  • Анализ на основните компоненти (PCA).
  • Поддържайте векторни машини (SVM).
  • Алгоритми, базирани на дърво, като дървета на решения и произволна гора.
  • Модели за усилване като градиентно усилване и XGBoost.

Ограничения на традиционното машинно обучение

Традиционният ML има следните ограничения:

  1. Ограничена мащабируемост: Тези модели често се нуждаят от помощ за мащабиране с големи и разнообразни масиви от данни.
  2. Предварителна обработка на данни и инженеринг на функции: Традиционният ML изисква обширна предварителна обработка за трансформиране на набори от данни според изискванията на модела. Освен това инженерството на функции може да отнеме много време и да изисква множество итерации за улавяне на сложни връзки между функциите на данните.
  3. Високомерни и неструктурирани данни: Традиционният ML се бори със сложни типове данни като изображения, аудио, видео и документи.
  4. Адаптивност към невидими данни: Тези модели може да не се адаптират добре към данни от реалния свят, които не са част от тях данни за обучение.

Невронна мрежа: Преминаване от машинно обучение към задълбочено обучение и след това

Невронна мрежа: Преминаване от машинно обучение към задълбочено обучение и след това

Моделите на невронни мрежи (NN) са много по-сложни от традиционните модели на машинно обучение. Най-простият NN – Многослоен перцептрон (MLP) се състои от няколко неврона, свързани заедно, за да разбират информация и да изпълняват задачи, подобно на това как функционира човешкият мозък.

Напредъкът в техниките на невронни мрежи формира основата за преход от машинно обучение към дълбоко обучение. Например се извикват NN, използвани за задачи с компютърно зрение (откриване на обекти и сегментиране на изображения). конволюционни невронни мрежи (CNN), Като AlexNet, ResNet, и Йоло.

Днес генеративната AI технология издига техниките на невронните мрежи една крачка напред, което й позволява да се отличава в различни области на AI. Например, невронните мрежи, използвани за задачи за обработка на естествен език (като обобщаване на текст, отговаряне на въпроси и превод), са известни като трансформатори. Известни модели трансформатори включват БЕРТ, GPT-4, и T5. Тези модели създават въздействие върху индустрии, вариращи от здравеопазване, търговия на дребно, маркетинг, финансиИ др

Все още ли имаме нужда от традиционни алгоритми за машинно обучение?

Все още ли имаме нужда от традиционни алгоритми за машинно обучение?

Въпреки че невронните мрежи и техните модерни варианти като трансформатори са получили много внимание, традиционните методи на машинно обучение остават от решаващо значение. Нека да видим защо те все още са актуални.

1. По-прости изисквания за данни

Невронните мрежи изискват големи набори от данни за обучение, докато ML моделите могат да постигнат значителни резултати с по-малки и по-прости набори от данни. По този начин ML се предпочита пред дълбокото обучение за по-малки структурирани набори от данни и обратно.

2. Простота и интерпретируемост

Традиционните модели за машинно обучение са изградени върху по-прости статистически и вероятностни модели. Например, най-подходяща линия в линейна регресия установява връзката вход-изход, използвайки метода на най-малките квадрати, статистическа операция.

По подобен начин дърветата на решенията използват вероятностни принципи за класифициране на данни. Използването на такива принципи предлага интерпретируемост и улеснява практикуващите AI да разберат работата на ML алгоритмите.

Модерни NN архитектури като трансформаторни и дифузионни модели (обикновено използвани за генериране на изображения като Стабилна дифузия or По средата на пътуването) имат сложна многопластова мрежова структура. Разбирането на такива мрежи изисква разбиране на напреднали математически концепции. Ето защо те се наричат ​​още „черни кутии“.

3. Ефективност на ресурсите

Съвременните невронни мрежи като големи езикови модели (LLM) се обучават на клъстери от скъпи графични процесори според техните изчислителни изисквания. Например, според съобщенията GPT4 е обучаван 25000 Nvidia GPU за 90 до 100 дни.

Въпреки това, скъпият хардуер и продължителното време за обучение не са осъществими за всеки практикуващ или AI екип. От друга страна, изчислителната ефективност на традиционните алгоритми за машинно обучение позволява на практикуващите да постигнат значими резултати дори с ограничени ресурси.

4. Не всички проблеми се нуждаят от задълбочено обучение

Дълбоко обучение не е абсолютното решение за всички проблеми. Съществуват определени сценарии, при които ML превъзхожда дълбокото обучение.

Например, в медицинска диагноза и прогноза с ограничени данни, ML алгоритъм за откриване на аномалия като REMED дава по-добри резултати от дълбокото обучение. По подобен начин традиционното машинно обучение е важно в сценарии с нисък изчислителен капацитет като a гъвкаво и ефективно решение.

На първо място, изборът на най-добрия модел за всеки проблем зависи от нуждите на организацията или практикуващия и естеството на проблема.

Машинно обучение през 2023 г

Машинно обучение през 2023 г

Изображение, генерирано с помощта на Леонардо AI

През 2023 г. традиционното машинно обучение продължава да се развива и се конкурира с дълбокото обучение и генеративния AI. Той има няколко приложения в индустрията, особено когато се работи със структурирани масиви от данни.

Например, много Бързооборотни потребителски стоки (FMCG) компаниите работят с масиви от таблични данни, разчитащи на алгоритми за машинно обучение за критични задачи като персонализирани препоръки за продукти, оптимизиране на цените, управление на инвентара и оптимизиране на веригата за доставки.

Освен това много визия и езикови модели все още се основават на традиционни техники, предлагайки решения в хибридни подходи и нововъзникващи приложения. Например скорошно проучване, озаглавено „Наистина ли имаме нужда от модели за задълбочено обучение за прогнозиране на времеви редове?” обсъди как градиентно-усилващите регресионни дървета (GBRT) са по-ефективни за прогнозиране на времеви редове отколкото дълбоките невронни мрежи.

Интерпретируемостта на ML остава много ценна с техники като ШАП (Shapley Additive Explanations) и ВАР (Местни интерпретируеми модели-агностични обяснения). Тези техники обясняват сложни ML модели и предоставят представа за техните прогнози, като по този начин помагат на практикуващите ML да разберат още по-добре своите модели.

И накрая, традиционното машинно обучение остава стабилно решение за различни индустрии, насочено към мащабируемостта, сложността на данните и ограниченията на ресурсите. Тези алгоритми са незаменими за анализ на данни и прогнозно моделиране и ще продължат да бъдат част от арсенал на специалиста по данни.

Ако теми като тази ви заинтригуват, проучете Обединете AI за допълнителни прозрения.