Connect with us

Успешное развитие машинного обучения требует нового парадигмы – лидеры мнений

Лидеры мнений

Успешное развитие машинного обучения требует нового парадигмы – лидеры мнений

mm

Виктор Тху, президент, Datatron

Инициативы, использующие машинное обучение, не могут быть behandelt в том же порядке, что и проекты, включающие традиционное программное обеспечение. Необходимо быстро действовать, чтобы протестировать все, исправить проблемы и еще раз протестировать. Другими словами, вы должны быть в состоянии быстро допустить ошибки – и сделать это на ранней стадии процесса. Если ждать до более позднего этапа этого процесса, чтобы обнаружить проблемы, это может оказаться очень дорогим и трудоемким.

ИИ требует нового подхода

При разработке программного обеспечения традиционным методом вы используете логические правила. Чтобы быть как можно более точным, вы включаете логику, которая позволяет программному обеспечению функционировать правильно. Там (обычно) нет необходимости в изменениях после того, как логика приложения была разработана, кроме исправления ошибок. Это очень методичный процесс разработки; вы продвигаетесь постепенно, обеспечивая точность каждого шага в процессе, прежде чем перейти к следующему. Это проверенная стратегия, которая последовательно демонстрирует свою эффективность для разработки программного обеспечения.

Однако вы не можете использовать одну и ту же стратегию для проектов ИИ/МО, поскольку она просто не сработает. Вместо этого вам необходимо иметь возможность быстро и часто итерировать, чтобы добиться успеха в проекте МО. Поскольку МО требует первоначальной тренировки и является процессом, вы должны подойти к этому с знанием того, что это не будет точным с первого раза.

Этот процесс требует множества итераций. Реальность заключается в том, что ваша первая модель столкнется с неожиданными результатами 99% времени. Даже если вы потратите месяцы на тренировку своей модели в лаборатории, она, безусловно, изменится, когда столкнется с реальными данными и трафиком.

Не стремитесь к мгновенному совершенству

Итак, чтобы протестировать модель и определить, какие изменения необходимы, вы должны быть в состоянии быстро ввести ее в производство. Затем вы можете сделать любые необходимые корректировки, выпустить ее снова и усовершенствовать. По этой причине вы не должны тратить слишком много усилий на то, чтобы сделать свою модель идеальной перед тестированием в производстве; первая попытка не будет идеальной, и никто не должен ожидать этого.

Хотя модель разрабатывается в лаборатории, дополнительные улучшения с 92% до 95% точности могут не быть значительными для некоторых случаев использования. Почему? Только небольшая часть обучающих данных была использована для тренировки вашей модели ИИ. Вы можете потратить много времени и денег, чтобы получить дополнительную точность, при этом упуская из виду преимущества, которые ваша модель может предложить вам в meantime.

Эффективные шаги в развертывании МО

Поскольку существует вероятность того, что модель может не сработать или произвести неправильные прогнозы, ученые-исследователи МО иногда неохотно вводят модель в производство. Это имеет смысл до определенной степени. Вам необходима система, которая позволяет вам просматривать события в режиме реального времени. С этим подходом вы можете сразу же отозвать и обновить свою модель, а затем быстро выпустить новую модель. Вместо того, чтобы застрять в “анализе паралича”, это самый эффективный способ ввода моделей машинного обучения в производство.

Гораздо лучше просто запустить модель и позволить ей получить некоторый жизненный опыт. Это не исключает необходимости для ученых-исследователей создать модель как можно более точно с самого начала. Но как только вы закончите эту первоначальную версию, вы должны сразу же начать собирать эти важные данные.

Вы можете хотеть запустить свои модели в режиме тестирования А/Б или тень против реальных данных в рамках этого процесса. Таким образом, вы можете по сути сравнить производительность различных моделей и иметь много данных и доказательств, прежде чем выбрать, какую модель продвигать или понижать.

Создание локальной модели вместо того, чтобы сосредоточиться на создании единой глобальной модели для прогнозирования поведения макроокружения, является еще одной лучшей практикой. С локальной моделью вы можете использовать данные из конкретных ситуаций, чтобы модель работала так, как она должна для каждой из этих ситуаций. Это экономит время, данные и усилия по сравнению с всеобъемлющей моделью, которая потребует значительного количества этих ресурсов, чтобы обеспечить ее работоспособность.

Определение спроса на индивидуальные кроссовки может служить примером здесь. Глобальная модель может быть применима к остальной части Северной Америки, если она основана на населении Нью-Йорка. Однако она, вероятно, не точно представляет спрос в других частях страны. Стратегия локальной модели позволила бы вам получить более высокие прибыльные маржи, которые вы сейчас упускаете.

Модели требуют регулярных обновлений, конечно. Модели требуют постоянных обновлений, поскольку данные окружающей среды всегда меняются, в отличие от традиционного программного обеспечения, которое можно установить один раз и оставить без изменений. Модели МО ухудшаются со временем, если они не итерируются на регулярной основе. Это должно происходить в течение срока службы модели и должно быть тщательно отслеживаться.

Новая парадигма машинного обучения

Сравнение моделей машинного обучения с традиционным программным обеспечением неуместно. Однако эксперты МО получают выгоду от быстрого метода развертывания для моделей ИИ/МО, как и инженеры-программисты сделали с DevOps. Для проектов МО вам необходима система, которая позволяет быстро запускать модели. Вам необходимо быть в состоянии сравнить разные модели, эффективно противопоставляя одну, которая живет, с той, которая нет. Эти и другие лучшие практики, упомянутые выше, помогут вам обойти анализ паралича и быстро допустить ошибки и рано, чтобы масштабировать ваше машинное обучение.

Виктор Тху является президентом Datatron. На протяжении всей своей карьеры Виктор специализировался на маркетинге продукта, выходе на рынок и управлении продуктом на должностях C-level и директора в компаниях таких как Petuum, VMware и Citrix.