Entre em contato

Líderes de pensamento

O desenvolvimento de aprendizado de máquina bem-sucedido requer um novo paradigma – líderes de pensamento

mm

Publicado

 on

Por Victor Thu, presidente, datatron

Iniciativas que utilizam aprendizado de máquina não podem ser tratadas da mesma forma que projetos que envolvem software convencional. É fundamental agir rapidamente para que você possa testar as coisas, corrigir problemas e testá-las novamente. Em outras palavras, você deve ser capaz de falhar rapidamente – e fazê-lo logo no início do processo. Esperar até mais tarde neste processo para encontrar problemas pode acabar sendo muito caro e demorado.

A IA requer uma nova abordagem

Ao desenvolver software usando o método tradicional, você usa a lógica de decisão. Para ser o mais preciso possível, você incorpora a lógica que permite que o software funcione corretamente. Não há (normalmente) necessidade de alterações após o desenvolvimento da lógica do aplicativo, além de correções de bugs. É um processo de desenvolvimento muito metódico; você avança gradualmente, certificando-se de que cada etapa do processo seja precisa antes de passar para a próxima. É uma estratégia testada e comprovada que demonstrou consistentemente sua eficácia para o desenvolvimento de software.

No entanto, você não pode usar a mesma estratégia para projetos AI/ML porque simplesmente não funcionará. Em vez disso, você precisa ter a capacidade de iterar com rapidez e frequência para obter sucesso com um projeto de ML. Como o ML requer treinamento inicial e é um processo, você deve abordá-lo com o conhecimento de que não será preciso na primeira vez que for implantado.

Esse processo exige várias iterações. A realidade é que seu primeiro modelo encontrará resultados inesperados 99% das vezes. Mesmo que você passe meses treinando seu modelo no laboratório, sem dúvida ele mudará assim que encontrar dados e tráfego do mundo real.

Não almeje a perfeição imediata

Então, para testar um modelo e determinar quais modificações são necessárias, você deve ser capaz de colocá-lo em produção rapidamente. Você pode então fazer quaisquer ajustes, liberá-lo novamente e refiná-lo. Por esse motivo, você não deve se esforçar muito para tentar tornar seu modelo impecável antes de testá-lo na produção; a tentativa inicial não será perfeita e ninguém deve esperar que seja.

Enquanto o modelo está sendo desenvolvido no laboratório, as melhorias adicionais de 92% para 95% de precisão podem não ser significativas para alguns casos de uso. Por que não? Apenas uma pequena parte dos dados de treinamento foi usada para treinar seu modelo de IA. Você pode acabar investindo muito tempo e dinheiro para obter um pouco mais de precisão, abrindo mão das vantagens que seu modelo pode oferecer nesse meio tempo.

Etapas eficazes na implantação de ML

Como há uma chance de um modelo falhar ou produzir previsões incorretas, os cientistas de ML às vezes relutam em colocar um modelo em produção. Faz sentido, até certo ponto. Você precisa de um sistema que permita visualizar os eventos conforme eles acontecem em tempo real. Com essa abordagem, você pode obter e atualizar imediatamente seu modelo e liberar rapidamente um novo modelo. Em vez de ficar atolado na “paralisia da análise”, esse é o método mais eficiente para colocar modelos de aprendizado de máquina em produção.

É muito preferível apenas lançar o modelo e deixá-lo ganhar alguma experiência de vida. Isso não elimina a necessidade de os cientistas de dados criarem o modelo com a maior precisão possível desde o início. Mas assim que terminar essa versão inicial, você deve começar a coletar esses dados importantes imediatamente.

Você pode querer executar seus modelos no modo de teste A/B ou modo de sombra em dados do mundo real como parte desse processo. Dessa forma, você pode basicamente comparar os desempenhos dos vários modelos e ter muitos dados e provas antes de escolher qual modelo promover ou rebaixar.

Construir um modelo localizado em vez de se concentrar na criação de um único modelo global para prever o comportamento do ambiente macro é outra prática recomendada. Com um modelo local, você pode usar dados de situações específicas para que o modelo se comporte como deveria para cada um desses cenários. Isso economiza tempo, dados e esforço em comparação com um modelo abrangente que exigiria uma quantidade significativa desses recursos para garantir seu funcionamento.

Determinar a demanda por tênis personalizados servirá como ilustração aqui. O modelo global poderia ser aplicável ao restante da América do Norte se fosse baseado na população da cidade de Nova York. No entanto, provavelmente não representaria com precisão a demanda em outras partes do país. Uma estratégia de modelo localizado teria permitido que você ganhasse margens de lucro mais altas, que agora você está perdendo.

Os modelos requerem atualização regular, é claro. Os modelos exigem atualizações contínuas porque os dados do ambiente estão sempre mudando, em contraste com o software tradicional que pode ser definido uma vez e deixado sozinho. Os modelos de ML se deterioram com o tempo se não forem iterados regularmente. Isso deve ocorrer durante a vida útil do modelo e deve ser cuidadosamente monitorado.

O novo paradigma do aprendizado de máquina

Comparar modelos de aprendizado de máquina com software convencional é imprudente. No entanto, os especialistas em ML ganham com uma técnica de implantação rápida para modelos AI/ML, assim como os engenheiros de software fizeram com o DevOps. Para projetos de ML, você precisa de um sistema que possibilite o lançamento rápido de modelos. Você deve ser capaz de comparar diferentes modelos, contrastando efetivamente um que está vivo com outro que não está. Essas e outras práticas recomendadas mencionadas acima ajudarão você a contornar a paralisia da análise e a falhar rapidamente e no início, para que você possa dimensionar seu aprendizado de máquina.

Victor Thu é presidente da datatron. Ao longo de sua carreira, Victor se especializou em marketing de produtos, go-to-market e gerenciamento de produtos em posições de C-level e diretoria em empresas como Petuum, VMware e Citrix.