заглушки Традиційне машинне навчання все ще актуальне? - Об'єднуйтесь.AI
Зв'язатися з нами

Штучний Інтелект

Традиційне машинне навчання все ще актуальне?

mm

опублікований

 on

Традиційне машинне навчання все ще актуальне?

За останні роки Generative AI показав багатообіцяючі результати у вирішенні складних завдань AI. Сучасні моделі ШІ, як ChatGPT, Bard, LlaMA, DALL-E.3 та SAM продемонстрували надзвичайні здібності у вирішенні мультидисциплінарних проблем, таких як візуальні відповіді на запитання, сегментація, міркування та генерація вмісту.

Крім того, Мультимодальний ШІ з’явилися методики, здатні обробляти декілька модальностей даних, тобто текст, зображення, аудіо та відео одночасно. З цими досягненнями природно запитувати себе: чи наближаємося ми до кінця традиційне машинне навчання (ML)?

У цій статті ми розглянемо стан традиційного ландшафту машинного навчання щодо сучасних генеративних інновацій ШІ.

Що таке традиційне машинне навчання? – Які його обмеження?

Традиційне машинне навчання — це широкий термін, який охоплює широкий спектр алгоритмів, які в основному керуються статистикою. Існує два основних типи традиційних алгоритмів ML під наглядом і без нагляду. Ці алгоритми призначені для розробки моделей зі структурованих наборів даних.

Стандартні традиційні алгоритми машинного навчання включають:

  • Алгоритми регресії, такі як лінійна, ласо та хребтова.
  • K-означає кластеризацію.
  • Аналіз основних компонентів (PCA).
  • Підтримуючі векторні машини (SVM).
  • Деревоподібні алгоритми, такі як дерева рішень і випадковий ліс.
  • Моделі посилення, такі як градієнтне посилення та XGBoost.

Обмеження традиційного машинного навчання

Традиційний ML має такі обмеження:

  1. Обмежена масштабованість: Ці моделі часто потребують допомоги для масштабування з великими та різноманітними наборами даних.
  2. Попередня обробка даних і розробка функцій: Традиційний ML вимагає значної попередньої обробки для перетворення наборів даних відповідно до вимог моделі. Крім того, розробка функцій може зайняти багато часу та вимагати кількох ітерацій, щоб охопити складні зв’язки між функціями даних.
  3. Багатовимірні та неструктуровані дані: Традиційний ML має проблеми зі складними типами даних, такими як зображення, аудіо, відео та документи.
  4. Можливість адаптації до невидимих ​​даних: Ці моделі можуть погано адаптуватися до даних реального світу, які не були їхньою частиною дані навчання.

Нейронна мережа: перехід від машинного до глибокого навчання та далі

Нейронна мережа: перехід від машинного до глибокого навчання та далі

Моделі нейронних мереж (NN) набагато складніші за традиційні моделі машинного навчання. Найпростіший NN – Багатошаровий перцептрон (MLP) складається з кількох нейронів, з’єднаних між собою для розуміння інформації та виконання завдань, подібно до того, як функціонує людський мозок.

Досягнення в техніці нейронних мереж створили основу для переходу від від машинного навчання до глибокого навчання. Наприклад, називаються НМ, що використовуються для завдань комп’ютерного зору (виявлення об’єктів і сегментація зображення). згорткові нейронні мережі (CNN), Такі, як AlexNet, ResNet та YOLO.

Сьогодні технологія генеративного штучного інтелекту просуває методи нейронної мережі на один крок вперед, дозволяючи їй досягти успіху в різних сферах штучного інтелекту. Наприклад, нейронні мережі, які використовуються для завдань обробки природної мови (як-от резюмування тексту, відповіді на запитання та переклад), відомі як Трансформатори. Відомі моделі трансформаторів включають БЕРТ, GPT-4 та T5. Ці моделі впливають на галузі охорони здоров’я, роздрібної торгівлі, маркетингу, фінансування, І т.д.

Чи потрібні нам традиційні алгоритми машинного навчання?

Чи потрібні нам традиційні алгоритми машинного навчання?

У той час як нейронні мережі та їх сучасні варіанти, такі як трансформатори, привернули велику увагу, традиційні методи машинного навчання залишаються вирішальними. Давайте розберемося, чому вони досі актуальні.

1. Простіші вимоги до даних

Нейронні мережі вимагають великих наборів даних для навчання, тоді як моделі ML можуть досягти значних результатів за допомогою менших і простіших наборів даних. Таким чином, МЛ надається перевага перед глибоким навчанням для менших структурованих наборів даних і навпаки.

2. Простота та зрозумілість

Традиційні моделі машинного навчання побудовані на основі простіших статистичних і ймовірнісних моделей. Наприклад, найкраща лінія в лінійна регресія встановлює співвідношення витрат і випуску за допомогою методу найменших квадратів, статистичної операції.

Так само дерева рішень використовують імовірнісні принципи для класифікації даних. Використання таких принципів забезпечує можливість інтерпретації та полегшує для практиків ШІ розуміння роботи алгоритмів машинного навчання.

Сучасні архітектури мережевих мереж, такі як трансформаторні та дифузійні моделі (зазвичай використовуються для створення зображень, наприклад Стабільна дифузія or Серед подорожі) мають складну багаторівневу структуру мережі. Розуміння таких мереж вимагає розуміння передових математичних концепцій. Ось чому їх також називають «чорними ящиками».

3. Ефективність використання ресурсів

Сучасні нейронні мережі, як-от великі мовні моделі (LLM), навчаються на кластерах дорогих графічних процесорів відповідно до їхніх обчислювальних вимог. Наприклад, як повідомляється, тренувалися на GPT4 25000 графічних процесорів Nvidia протягом 90 - 100 днів.

Однак дороге апаратне забезпечення та тривалий час навчання під силу не кожному практикуючому спеціалісту чи команді ШІ. З іншого боку, обчислювальна ефективність традиційних алгоритмів машинного навчання дозволяє практикам досягати значущих результатів навіть за обмежених ресурсів.

4. Не всі проблеми потребують глибокого вивчення

Глибоке навчання не є абсолютним рішенням усіх проблем. Існують певні сценарії, коли МЛ перевершує глибоке навчання.

Наприклад, у медичний діагноз і прогноз з обмеженими даними, алгоритм ML для виявлення аномалії наприклад, REMED забезпечує кращі результати, ніж глибоке навчання. Так само традиційне машинне навчання має важливе значення в сценаріях з низькою обчислювальною потужністю гнучке та ефективне рішення.

Перш за все, вибір найкращої моделі для будь-якої проблеми залежить від потреб організації або практикуючого лікаря та характеру проблеми.

Машинне навчання в 2023 році

Машинне навчання в 2023 році

Зображення, створене за допомогою Леонардо А.І

У 2023 році традиційне машинне навчання продовжує розвиватися і конкурує з глибоким навчанням і генеративним ШІ. Він має кілька застосувань у промисловості, особливо коли йдеться про структуровані набори даних.

Наприклад, багато Товари широкого вжитку (FMCG) компанії мають справу з масивами табличних даних, покладаючись на алгоритми машинного навчання для критичних завдань, таких як персоналізовані рекомендації щодо продуктів, оптимізація цін, управління запасами та оптимізація ланцюга поставок.

Далі багато бачення та мовні моделі все ще базуються на традиційних методах, пропонуючи рішення в гібридних підходах і нових додатках. Наприклад, нещодавнє дослідження під назвою «Чи справді нам потрібні моделі глибокого навчання для прогнозування часових рядів?” обговорив, як регресійні дерева з посиленням градієнта (GBRT) є більш ефективними для прогнозування часових рядів ніж глибокі нейронні мережі.

Можливість інтерпретації ML залишається дуже цінною для таких методів, як ФОРМА (Пояснення додатків Шеплі) і LIME (Локальні інтерпретовані модельно-агностичні пояснення). Ці методи пояснюють складні моделі машинного навчання та дають уявлення про їхні прогнози, допомагаючи фахівцям з машинного навчання ще краще зрозуміти їх моделі.

Нарешті, традиційне машинне навчання залишається надійним рішенням для різноманітних галузей, що стосується масштабованості, складності даних і обмежень ресурсів. Ці алгоритми є незамінними для аналізу даних і прогнозного моделювання та й надалі будуть частиною арсенал спеціаліста з даних.

Якщо такі теми вас інтригують, досліджуйте Об'єднайте ШІ для подальшого розуміння.