заглушки Традиционное машинное обучение все еще актуально? - Unite.AI
Свяжитесь с нами:

Artificial Intelligence

Традиционное машинное обучение все еще актуально?

mm

опубликованный

 on

Традиционное машинное обучение все еще актуально?

В последние годы генеративный ИИ показал многообещающие результаты в решении сложных задач ИИ. Современные модели искусственного интеллекта, такие как ChatGPT, Bard, ЛАМА, ДАЛЛ-Э.3и SAM продемонстрировали замечательные способности в решении междисциплинарных задач, таких как визуальные ответы на вопросы, сегментация, рассуждение и генерация контента.

Более того, Мультимодальный ИИ появились методы, способные обрабатывать несколько модальностей данных, т.е. текст, изображения, аудио и видео одновременно. Учитывая эти достижения, естественно задаться вопросом: приближаемся ли мы к концу традиционное машинное обучение (МЛ)?

В этой статье мы рассмотрим состояние традиционного машинного обучения в отношении современных инноваций в области генеративного искусственного интеллекта.

Что такое традиционное машинное обучение? – Каковы его ограничения?

Традиционное машинное обучение — это широкий термин, охватывающий широкий спектр алгоритмов, основанных главным образом на статистике. Два основных типа традиционных алгоритмов ML: контролируемый и неконтролируемый. Эти алгоритмы предназначены для разработки моделей на основе структурированных наборов данных.

Стандартные традиционные алгоритмы машинного обучения включают в себя:

  • Алгоритмы регрессии, такие как линейная, лассо и гребень.
  • K-означает кластеризацию.
  • Анализ главных компонентов (PCA).
  • Машины опорных векторов (SVM).
  • Древовидные алгоритмы, такие как деревья решений и случайный лес.
  • Модели повышения, такие как повышение градиента и XGBoost.

Ограничения традиционного машинного обучения

Традиционное машинное обучение имеет следующие ограничения:

  1. Ограниченная масштабируемость: Этим моделям часто требуется помощь в масштабировании с большими и разнообразными наборами данных.
  2. Предварительная обработка данных и разработка функций: Традиционное машинное обучение требует обширной предварительной обработки для преобразования наборов данных в соответствии с требованиями модели. Кроме того, разработка функций может занять много времени и потребовать нескольких итераций для выявления сложных взаимосвязей между функциями данных.
  3. Многомерные и неструктурированные данные: Традиционному машинному обучению приходится нелегко со сложными типами данных, такими как изображения, аудио, видео и документы.
  4. Адаптивность к невидимым данным: Эти модели могут плохо адаптироваться к реальным данным, которые не были частью их модели. данные обучения.

Нейронная сеть: переход от машинного обучения к глубокому обучению и не только

Нейронная сеть: переход от машинного обучения к глубокому обучению и не только

Модели нейронных сетей (NN) намного сложнее традиционных моделей машинного обучения. Простейшая НН – Многослойный перцептрон (MLP) состоит из нескольких нейронов, соединенных вместе для понимания информации и выполнения задач, подобно тому, как функционирует человеческий мозг.

Достижения в области нейронных сетей легли в основу перехода от машинное обучение для глубокого обучения. Например, NN, используемые для задач компьютерного зрения (обнаружение объектов и сегментация изображений), называются сверточные нейронные сети (CNN), Такие, как АлексНет, RESNETи YOLO.

Сегодня технология генеративного искусственного интеллекта выводит методы нейронных сетей на шаг дальше, позволяя им преуспеть в различных областях искусственного интеллекта. Например, нейронные сети, используемые для задач обработки естественного языка (таких как обобщение текста, ответы на вопросы и перевод), известны как трансформеры. Известные модели трансформаторов включают в себя БЕРТ, GPT-4и T5. Эти модели оказывают влияние на самые разные отрасли: здравоохранение, розничную торговлю, маркетинг, финансы, и т.д.

Нужны ли нам традиционные алгоритмы машинного обучения?

Нужны ли нам традиционные алгоритмы машинного обучения?

Хотя нейронным сетям и их современным вариантам, таким как трансформаторы, уделяется много внимания, традиционные методы машинного обучения по-прежнему имеют решающее значение. Давайте посмотрим, почему они все еще актуальны.

1. Упрощенные требования к данным

Нейронным сетям для обучения требуются большие наборы данных, тогда как модели машинного обучения могут достичь значительных результатов с меньшими и простыми наборами данных. Таким образом, машинное обучение предпочтительнее глубокого обучения для небольших структурированных наборов данных и наоборот.

2. Простота и интерпретируемость

Традиционные модели машинного обучения строятся на основе более простых статистических и вероятностных моделей. Например, наиболее подходящая линия в линейная регрессия устанавливает взаимосвязь между входом и выходом с использованием метода наименьших квадратов, статистической операции.

Аналогично, деревья решений используют вероятностные принципы классификации данных. Использование таких принципов обеспечивает интерпретируемость и облегчает специалистам по искусственному интеллекту понимание работы алгоритмов ML.

Современные архитектуры нейронных сетей, такие как модели трансформаторов и диффузии (обычно используемые для генерации изображений, например Стабильная диффузия or Середина пути) имеют сложную многоуровневую сетевую структуру. Понимание таких сетей требует понимания передовых математических концепций. Вот почему их еще называют «черными ящиками».

3. Ресурсоэффективность

Современные нейронные сети, такие как модели большого языка (LLM), обучаются на кластерах дорогих графических процессоров в соответствии с их вычислительными потребностями. Например, сообщается, что GPT4 был обучен на 25000 графических процессоров NVIDIA от 90 до 100 дней.

Однако дорогое оборудование и длительное время обучения доступны не каждому практикующему специалисту или команде ИИ. С другой стороны, вычислительная эффективность традиционных алгоритмов машинного обучения позволяет практикам достигать значимых результатов даже при ограниченных ресурсах.

4. Не все проблемы требуют глубокого обучения

Глубокое обучение не является абсолютным решением всех проблем. Существуют определенные сценарии, в которых ML превосходит глубокое обучение.

Например, в медицинский диагноз и прогноз с ограниченными данными, алгоритм ML для обнаружение аномалии например, REMED дает лучшие результаты, чем глубокое обучение. Аналогичным образом, традиционное машинное обучение имеет важное значение в сценариях с низкой вычислительной мощностью. гибкое и эффективное решение.

Прежде всего, выбор лучшей модели для любой проблемы зависит от потребностей организации или практикующего специалиста и характера рассматриваемой проблемы.

Машинное обучение в 2023 году

Машинное обучение в 2023 году

Изображение, созданное с использованием Леонардо А.И.

В 2023 году традиционное машинное обучение продолжит развиваться и конкурировать с глубоким обучением и генеративным искусственным интеллектом. Он имеет несколько применений в отрасли, особенно при работе со структурированными наборами данных.

Например, многие Быстроходные потребительские товары (FMCG) Компании имеют дело с большими объемами табличных данных, полагаясь на алгоритмы машинного обучения для решения таких важных задач, как персонализированные рекомендации по продуктам, оптимизация цен, управление запасами и оптимизация цепочки поставок.

Далее, многие модели видения и языка по-прежнему основаны на традиционных методах, предлагая решения в гибридных подходах и новых приложениях. Например, недавнее исследование под названием «Действительно ли нам нужны модели глубокого обучения для прогнозирования временных рядов?обсудил, как деревья регрессии, повышающие градиент (GBRT), более эффективны для прогнозирование временных рядов чем глубокие нейронные сети.

Интерпретируемость ML остается очень ценной благодаря таким методам, как ШАП (Пояснения к аддитивам Шепли) и LIME (Локальные интерпретируемые модельно-агностические объяснения). Эти методы объясняют сложные модели МО и дают представление об их прогнозах, тем самым помогая специалистам по МО еще лучше понять свои модели.

Наконец, традиционное машинное обучение остается надежным решением для различных отраслей, связанных с масштабируемостью, сложностью данных и ограничениями ресурсов. Эти алгоритмы незаменимы для анализа данных и прогнозного моделирования и будут продолжать оставаться частью арсенал специалиста по данным.

Если вас интересуют подобные темы, изучите Объединить ИИ для дальнейшего понимания.