Líderes de opinión

La Evolución del Entrenamiento de Modelos de Inteligencia Artificial: Más allá del Tamaño hacia la Eficiencia

mm

En el paisaje en rápida evolución de la inteligencia artificial, el enfoque tradicional para mejorar los modelos de lenguaje a través de simples aumentos en el tamaño del modelo está experimentando una transformación pivotal. Este cambio subraya un enfoque más estratégico y centrado en los datos, como se ejemplifica en los desarrollos recientes en modelos como Llama3.

Datos son todo lo que necesitas

Históricamente, la creencia predominante en el avance de las capacidades de la inteligencia artificial ha sido que más grande es mejor.

En el pasado, hemos presenciado un aumento dramático en las capacidades del aprendizaje profundo simplemente agregando más capas a las redes neuronales. Algoritmos y aplicaciones como el reconocimiento de imágenes, que antes eran solo teóricamente posibles antes del advenimiento del aprendizaje profundo, rápidamente se convirtieron en ampliamente aceptados. El desarrollo de tarjetas gráficas amplió aún más esta tendencia, permitiendo que los modelos más grandes se ejecuten con una eficiencia creciente. Esta tendencia se ha extendido a la actual hipería de los grandes modelos de lenguaje.

Periódicamente, nos encontramos con anuncios de grandes empresas de inteligencia artificial que lanzan modelos con decenas o incluso cientos de miles de millones de parámetros. Es fácil entender la lógica: cuanto más parámetros tenga un modelo, más competente se vuelve. Sin embargo, este método de escalado por la fuerza ha alcanzado un punto de rendimientos decrecientes, particularmente cuando se considera la rentabilidad de dichos modelos en aplicaciones prácticas. El anuncio reciente de Meta sobre el enfoque Llama3, que utiliza 8 mil millones de parámetros pero se enriquece con 6-7 veces la cantidad de datos de entrenamiento de alta calidad, coincide con -y en algunos escenarios supera- la eficacia de modelos anteriores como GPT3.5, que cuentan con más de 100 mil millones de parámetros. Esto marca un cambio significativo en la ley de escalabilidad para los modelos de lenguaje, donde la calidad y la cantidad de datos comienzan a tener prioridad sobre el tamaño puro.

Costo vs. Rendimiento: Un Equilibrio Delicado

A medida que los modelos de inteligencia artificial (IA) pasan del desarrollo al uso práctico, su impacto económico, particularmente los altos costos operativos de los modelos a gran escala, se está volviendo cada vez más significativo. Estos costos a menudo superan los gastos iniciales de capacitación, enfatizando la necesidad de un enfoque de desarrollo sostenible que priorice el uso eficiente de los datos sobre la expansión del tamaño del modelo. Estrategias como la ampliación de datos y el aprendizaje de transferencia pueden mejorar los conjuntos de datos y reducir la necesidad de una re capacitación extensa. La optimización de los modelos a través de la selección de características y la reducción de dimensionalidad mejora la eficiencia computacional y reduce los costos. Técnicas como el abandono y la detención temprana mejoran la generalización, permitiendo que los modelos funcionen de manera efectiva con menos datos. Estrategias de implementación alternativas como la computación de borde reducen la dependencia de la infraestructura en la nube costosa, mientras que la computación sin servidor ofrece un uso de recursos escalable y rentable. Al centrarse en el desarrollo centrado en los datos y explorar métodos de implementación económicos, las organizaciones pueden establecer un ecosistema de inteligencia artificial más sostenible que equilibre el rendimiento con la eficiencia de costo.

Los Rendimientos Decrecientes de los Modelos Más Grandes

El panorama del desarrollo de la inteligencia artificial está experimentando un cambio de paradigma, con un énfasis creciente en la utilización eficiente de los datos y la optimización de los modelos. Las empresas de inteligencia artificial centralizadas han confiado tradicionalmente en la creación de modelos cada vez más grandes para lograr resultados de vanguardia. Sin embargo, esta estrategia se está volviendo cada vez más insostenible, tanto en términos de recursos computacionales como de escalabilidad.

Por otro lado, la inteligencia artificial descentralizada presenta un conjunto diferente de desafíos y oportunidades. Las redes descentralizadas de blockchain, que forman la base de la inteligencia artificial descentralizada, tienen un diseño fundamentalmente diferente en comparación con las empresas de inteligencia artificial centralizadas. Esto hace que sea un desafío para las empresas de inteligencia artificial descentralizadas competir con las entidades centralizadas en términos de escalabilidad de modelos más grandes mientras se mantiene la eficiencia en las operaciones descentralizadas.

Es aquí donde las comunidades descentralizadas pueden maximizar su potencial y abrirse un nicho en el paisaje de la inteligencia artificial. Al aprovechar la inteligencia colectiva y los recursos, las comunidades descentralizadas pueden desarrollar y desplegar modelos de inteligencia artificial sofisticados que sean a la vez eficientes y escalables. Esto les permitirá competir eficazmente con las empresas de inteligencia artificial centralizadas y impulsar el futuro del desarrollo de la inteligencia artificial.

Mirando Hacia Adelante: El Camino Hacia el Desarrollo Sostenible de la Inteligencia Artificial

La trayectoria para el desarrollo futuro de la inteligencia artificial debería centrarse en crear modelos que no solo sean innovadores, sino también integrativos y económicos. El énfasis debería cambiar hacia sistemas que puedan lograr altos niveles de precisión y utilidad con costos y uso de recursos manejables. Esta estrategia no solo garantizará la escalabilidad de las tecnologías de inteligencia artificial, sino también su accesibilidad y sostenibilidad a largo plazo.

A medida que el campo de la inteligencia artificial madura, las estrategias para desarrollar la inteligencia artificial deben evolucionar en consecuencia. El cambio de valorar el tamaño a priorizar la eficiencia y la rentabilidad en el entrenamiento de modelos no es solo una elección técnica, sino un imperativo estratégico que definirá la próxima generación de aplicaciones de inteligencia artificial. Este enfoque probablemente catalizará una nueva era de innovación, donde el desarrollo de la inteligencia artificial esté impulsado por prácticas inteligentes y sostenibles que prometan una adopción más amplia y un mayor impacto.​​​​​​​​​​​​​​​​

Jiahao Sun, el fundador y CEO de FLock.io, es un exalumno de Oxford y es un experto en inteligencia artificial y blockchain. Con roles anteriores como Director de Inteligencia Artificial para el Royal Bank of Canada y como Investigador de Inteligencia Artificial en el Imperial College London, fundó FLock.io para centrarse en soluciones de inteligencia artificial centradas en la privacidad. A través de su liderazgo, FLock.io está pionero en avances en el entrenamiento y despliegue de modelos de inteligencia artificial seguros y colaborativos, lo que muestra su dedicación a utilizar la tecnología para el avance social.