IA 101
Modelos de aprendizaje automático personalizados vs. modelos estándar

¿Cuándo es mejor construir que comprar una solución estándar?
Las empresas pueden adoptar diferentes enfoques para el desarrollo de modelos. Desde servicios de ML completamente administrados hasta modelos personalizados. Dependiendo de los requisitos comerciales, la experiencia disponible y las limitaciones de planificación, deben tomar una decisión: ¿deben desarrollar soluciones personalizadas desde cero? ¿O deben elegir un servicio estándar?
En todas las etapas de las cargas de trabajo de ML, se debe tomar una decisión sobre cómo encajan las diferentes piezas del rompecabezas. Desde la recopilación de datos, la preparación y la visualización, hasta la ingeniería de características, el entrenamiento de modelos y la evaluación, los ingenieros de aprendizaje automático se preguntan una y otra vez la misma pregunta: ¿será una solución implementada personalizada, escrita y desarrollada desde cero? ¿O será un servicio estándar?
Pero, ¿cuándo es mejor construir que comprar una solución estándar? Los principales factores diferenciales entre los dos enfoques son: esfuerzos de preprocesamiento, velocidad de desarrollo y experiencia requerida.
¿Qué debe considerar al determinar el uso de modelos de aprendizaje automático personalizados o estándar?
Esfuerzos de preprocesamiento
Los proyectos de ML enfrentan todo tipo de desafíos, pero quizás el mayor desafío es la disponibilidad de datos de entrenamiento. La falta de datos de entrenamiento puede detener un proyecto antes de que incluso comience. Antes de que un proyecto comience, puede enfrentar costos de preprocesamiento significativos al recopilar datos, etiquetar datos, limpiar y esfuerzos de preprocesamiento. Esta es la trampa bien conocida en la que muchos proyectos de ML fallan: el preprocesamiento termina tomando el 80% de los recursos asignados, mientras que pocos recursos quedan para el entrenamiento y evaluación del modelo real.
Las soluciones estándar alivian las tensiones y dolores de los esfuerzos de preprocesamiento. Están diseñadas para realizar las operaciones más comunes con solo una pequeña configuración requerida. Lo mejor de ellas es: las soluciones estándar existen para todas las etapas de las cargas de trabajo de ML.
Por otro lado, las implementaciones personalizadas generalmente requieren más esfuerzos de preprocesamiento. Eso no significa que deban ser descartadas por completo: todavía son necesarias para ajustar una determinada etapa de ML a las especificaciones del problema que se está resolviendo. Un conjunto de datos especialmente sucio puede requerir algunas reglas de limpieza especiales. Al mismo tiempo, un conjunto de características específico puede requerir ingeniería de características personalizadas, al igual que las arquitecturas neuronales pueden requerir ajustes ligeramente diferentes. En este caso, las soluciones personalizadas construidas desde cero probablemente cubran todas las necesidades.
Velocidad de desarrollo
Las soluciones estándar se centran en la configuración en lugar de la implementación. En lugar de asignar recursos para averiguar qué debe hacerse, los equipos de ML se centrarán en cómo encajan las diferentes piezas del rompecabezas. Este enfoque permite a las empresas, investigadores y ingenieros implementar rápidamente prototipos y pruebas de concepto. En lugar de reinventar la rueda, las soluciones estándar hacen posible aprovechar el conocimiento existente, lo que ahorra tiempo de desarrollo.
Las soluciones personalizadas implementadas desde cero son conocidas por ser mucho más lentas en términos de velocidad de desarrollo. Esto se debe a sus necesidades de mantenimiento aumentadas: los ingenieros deben averiguar tanto el qué como el cómo de la solución. De la misma manera, cuanto más compleja sea la solución, más tiempo y recursos se requieren para asegurar su escalabilidad y disponibilidad mientras está en producción. Desde esta perspectiva, las soluciones personalizadas y los esfuerzos de tiempo son directamente proporcionales: cuanto más compleja sea una solución, más tiempo requerirá.
Por lo general, sin embargo, la verdad está en algún punto intermedio: una base de código existente se refactorizará y adaptará a las necesidades del proyecto actual. Tal es el caso del conocido enfoque de transferencia de aprendizaje para el entrenamiento de modelos.
Experiencia
Al igual que hay múltiples capas en las que se realiza el aprendizaje automático, hay múltiples niveles de experiencia en los que se pueden desarrollar modelos de ML, que van desde interfaces sin código hasta la construcción de modelos desde cero.
Las soluciones estándar existen para las que se requiere muy poca experiencia en aprendizaje automático. Al utilizar interfaces intuitivas e incluso enfoques de arrastrar y soltar, ha sido extremadamente simple para cualquier persona (desde analistas de negocios hasta ingenieros de software) construir y implementar algún tipo de modelo de aprendizaje automático. Si bien este enfoque simple para el desarrollo de modelos puede funcionar para fines de prototipado, es poco probable que cumpla con los requisitos de los sistemas de producción.
La experiencia todavía es necesaria para configurar, configurar y mantener correctamente las soluciones estándar en producción. Los trabajos, los parches de código, la conexión a diferentes interfaces de API y el manejo de problemas de implementación son tareas comunes necesarias para garantizar el rendimiento de los modelos en entornos de producción.
Las soluciones personalizadas generalmente se implementan a nivel de infraestructura y no hay forma de evitarlo: se requiere experiencia. Dependiendo del tamaño de la empresa y los objetivos del proyecto, pueden ser necesarios equipos multidisciplinarios para mantener sistemas de producción. Los científicos de datos, los ingenieros de ML y los analistas de negocios se unen para dar sentido a los resultados de inferencia y mantener modelos de producción.
¿Qué debe usar: un modelo de aprendizaje automático estándar o personalizado?
Una solución de ML se construirá de muchos componentes y servicios individuales que necesitan unirse como una solución cohesiva. Nunca se trata de ir al 100% personalizado o al 100% estándar, ya que diferentes problemas comerciales requieren diferentes soluciones. Con mucha frecuencia, las soluciones basadas en ML se construyen con una mezcla de ambos: servicios estándar para extraer información general, combinados con modelos personalizados para una mayor precisión y modelado de conocimientos específicos del dominio.
El truco es saber cuándo implementar soluciones personalizadas desde cero y qué partes del proyecto pueden aprovechar los beneficios de los servicios estándar. Esto depende en gran medida del tipo de problema que se está abordando, los requisitos comerciales, los datos disponibles y las limitaciones generales del entorno de desarrollo.
Para más información sobre tendencias de IA y tecnología, consulte Josh Miramant, CEO de Blue Orange Digital, sobre soluciones impulsadas por datos para cadenas de suministro, automatización de documentos de atención médica y más.
También podría gustarle:
