Свяжитесь с нами:

Четыре фактора успеха с моделями машинного обучения

Лидеры мысли

Четыре фактора успеха с моделями машинного обучения

mm

Джейсон Ревелл, технический директор, Дататрон

Эксперты, аналитики и те, кто имеет непосредственный опыт внедрения, восхваляют машинное обучение (ML), что приводит к увеличению числа предприятий, использующих ML для различных целей. Его претензия на известность заключается в идее, что он компьютеризирует человеческое познание и в дальнейшем обеспечит цифровую трансформацию. Однако, несмотря на большие перспективы ML, есть и обратная сторона: для команд, которым приходится управлять им в производстве, работа может стать утомительной работой.

Предприятия внедряют машинное обучение для решения множества задач, таких как классификация рисков для здоровья, обработка документов, прогнозирование цен, обнаружение мошенничества, профилактическое обслуживание и многое другое. Команды обучают и оценивают модели на исторических данных до тех пор, пока они не будут соответствовать целевым показателям производительности и точности. Предприятия стремятся воспользоваться ценными преимуществами, которые обещает машинное обучение, предсказывая, классифицируя или предписывая будущие результаты и действуя в соответствии с этими прогнозами.

Однако вся эта ценность для бизнеса связана с высокими эксплуатационными расходами. Как только модель «готова», ее автоматизация с помощью надежных механизмов доставки создает операционные сложности и риски, требующие бдительности. Чтобы сделать эти проекты эффективными и действенными, группы доставки и эксплуатации должны комплексно управлять жизненным циклом машинного обучения. Данные должны быть доступны и иметь ожидаемое качество по сравнению с тем, что использовалось для обучения.

Вскоре становится очевидным, что это не совсем похоже на другие инженерные разработки, и вам нужно начать думать о проблемах по-новому, чтобы действительно стать компанией, основанной на искусственном интеллекте. Вот четыре вещи, которые следует учитывать для успеха машинного обучения и, в частности, моделей машинного обучения.

1. Как быстро развернуть несколько версий за кулисами

Модели машинного обучения требуют итеративного процесса, зависящего от реальных производственных данных. Сделайте целенаправленные инвестиции, чтобы иметь цели развертывания, которые могут запускать и регистрировать результаты без производственных систем или клиентов, которые видят эти результаты. Вам нужна возможность развертывать таким образом легко и плавно, пока у вас не будет модели, которая вам нравится. В долгосрочной перспективе гораздо эффективнее и экономичнее предполагать, что ваши модели будут подвергаться многочисленным настройкам, а также необходимо будет сравнивать текущие версии с новыми кандидатами, обещающими лучшие результаты.

2. Поймите, что то, что обещает ваша команда, обычно не вписывается в традиционные, ориентированные на приложения политики «утвержденного программного обеспечения».

Поскольку машинное обучение быстро растет и диверсифицируется, оно может похвастаться постоянно расширяющимся списком поставщиков технологий, как крупных, так и мелких. Само собой разумеется, что ИТ-отделу необходимо обеспечить надлежащую поддержку, проверку безопасности и средства контроля для вашей операционной среды. Но имейте в виду: применение одних и тех же элементов управления и процессов для управления операционными технологиями или технологиями хостинга продуктов в вашей практике машинного обучения, вероятно, значительно снизит вашу потенциальную прибыль еще до того, как вы пересечете стартовую линию.

Также важно отметить, что специалисты по данным пользуются большим спросом. Им нетрудно найти другую работу, если они чувствуют, что на них оказывают давление, чтобы они добивались все лучших и лучших результатов, не меняя технологии, которую они используют, или того, как они могут ее использовать.

3. Поймите, что жизненный цикл разработки модели машинного обучения отличается от жизненного цикла разработки программного обеспечения.

Разработка программного обеспечения и создание моделей машинного обучения — очень разные процессы; попытка относиться ко второму так же, как к первому, ведет к катастрофе. Предприятия, которые рассматривают доставку моделей как просто еще один выпуск программного обеспечения, в конечном итоге сталкиваются с пробелами в сквозных возможностях, таких как мониторинг и анализ, и высокими накладными расходами на передачу знаний между создателями и операторами с последовательными, расширенными временными рамками. Специалисты, которые развертывают и поддерживают ваши модели, должны понимать, как работают модели и данные, а не только проверять надежность служб и коды ошибок. Подходящие специалисты, гибридные команды, состоящие из специалистов по данным и эксплуатации, а также правильные инструменты позволят вам тестировать и интерпретировать не только то, работает ли программное обеспечение, но и насколько точными и объяснимыми являются ответы.

Также важно взять на себя подход, основанный на успехе к аудиту моделей машинного обучения, потому что они подвержены ошибкам. Если вы хотите, чтобы специалисты по данным вашей компании доверяли своим прогнозам моделей машинного обучения, даже если что-то пойдет не так (понимая, что это произойдет), тогда процесс аудита машинного обучения должен быть разработан таким образом, чтобы модели машинного обучения могли повторяться и улучшаться.

4. Планируйте масштаб.

Вам потребуется развернуть инструменты искусственного интеллекта с автоматизированной системой развертывания, такие как Kubernetes или Docker Swarm. Это поможет вам достичь нескольких целей. Вы сможете динамически запускать рабочие нагрузки машинного обучения и автоматически отслеживать задачи в кластерах на предмет сбоев с помощью алгоритмов искусственного интеллекта, предупреждая операторов о любых потенциальных проблемах до их возникновения. Вы также сможете объединять аналитические отчеты из нескольких источников в одну централизованную панель мониторинга, чтобы убедиться, что модели машинного обучения работают должным образом.

Освойте кривую обучения

Прежде чем приступить к проекту машинного обучения, важно понять, что, хотя модели машинного обучения могут предложить вашей организации огромные преимущества и эффективность, они могут жить своей собственной жизнью, если ими не управлять должным образом. Знайте риски и операционные сложности с самого начала, помня о четырех приведенных выше советах. Имея прочную основу, вы сможете создавать и легко изменять свои модели машинного обучения, чтобы они соответствовали вашим бизнес-целям.

Джейсон является техническим руководителем в Дататрон, он является технологическим лидером с опытом управления гибридными продуктами в создании решений и платформ, занимая различные должности в области проектирования и разработки, начиная от небольших технологических компаний и заканчивая крупными предприятиями, включая Boeing и MasterCard.