Líderes de opinión

Enfrentando el dominio de Nvidia: estrategias de desarrollo de ML ágil para jugadores no Big Tech (en medio de desafíos de suministro y costo)

Publicado el 15 de marzo de 2024

Actualizado el 22 de mayo de 2026

Por

Sergey Cheparukhin

Construir un negocio en el juego entre los grandes jugadores nunca ha sido una tarea fácil. En 2023, la competencia en el sector de la IA alcanzó alturas sin precedentes, impulsada por avances reales y sorprendentes. El lanzamiento de GPT-4 de OpenAI, la integración de ChatGPT con Bing, el lanzamiento de Bard de Google y el lanzamiento controvertido de “código abierto” de Meta Llama 2. Suena como una larga lista de nombres importantes, ¿verdad? Tan emocionante como pueda sonar, la mayoría de la innovación se encuentra donde fluye el dinero, y la competencia que deben superar los jugadores más pequeños se vuelve más intensa cada día.

En el paisaje en constante evolución de la industria tecnológica, Nvidia continúa consolidando su posición como el jugador clave en la infraestructura de IA. Durante una conferencia telefónica de informe financiero de agosto, Jensen Huang, presidente de NVIDIA, destacó la creciente demanda de procesadores Nvidia. Esta afirmación está respaldada por la confirmación de los datos de ingresos de la presentación de Nvidia Q3, que revela un impresionante récord de desempeño año tras año, evidente ya en noviembre. Mientras tanto, las proyecciones de Gartner indican un aumento significativo en el gasto en chips en los próximos cuatro años. Actualmente, el conjunto de software y procesadores de Nvidia es insuperable, lo que deja a la industria incierta sobre cuándo podría surgir un competidor creíble.

Informes recientes de Bloomberg y el Financial Times arrojan luz sobre las negociaciones de Sam Altman, CEO de OpenAI, con inversores del Medio Oriente para iniciar la producción de chips, con el objetivo de reducir la dependencia del sector de IA de los chips Nvidia. Desafiar a Nvidia, con su capitalización de mercado de casi 1,5 billones de dólares, probablemente costará a Altman entre 5 y 7 billones de dólares y tomará varios años.

Sin embargo, abordar la rentabilidad de los modelos de ML para las empresas es algo que las empresas deben hacer ahora. Para las empresas más allá de los límites de Big Tech, desarrollar modelos de ML rentables es más que un proceso empresarial: es una estrategia de supervivencia vital. Este artículo explora cuatro estrategias pragmáticas que permiten a las empresas de todos los tamaños desarrollar sus modelos sin inversiones de I+D extensas y permanecer flexibles para evitar el bloqueo de proveedores.

Por qué Nvidia domina el mercado de IA

En resumen, Nvidia ha creado el flujo de trabajo de entrenamiento de modelos ideal al lograr la sinergia entre GPUs de alto rendimiento y su conjunto de software de entrenamiento de modelos proprietario, el ampliamente aclamado kit de herramientas CUDA.

CUDA (introducido en 2007) es un kit de herramientas de computación paralela integral y API para utilizar óptimamente los procesadores GPU Nvidia. La razón principal por la que es tan popular es su capacidad insuperable para acelerar cálculos matemáticos complejos, cruciales para el aprendizaje profundo. Además, ofrece un ecosistema rico como cuDNN para redes neuronales profundas, mejorando el rendimiento y la facilidad de uso. Es esencial para los desarrolladores debido a su integración sin problemas con los principales marcos de aprendizaje profundo, lo que permite un desarrollo y iteración de modelos rápidos.

La combinación de un conjunto de software tan robusto con hardware muy eficiente ha demostrado ser la clave para capturar el mercado. Si bien algunos argumentan que el dominio de Nvidia puede ser un fenómeno temporal, es difícil hacer tales predicciones en el panorama actual.

La pesada carga del dominio de Nvidia

El hecho de que Nvidia tenga la ventaja en el campo del desarrollo de ML ha generado numerosas preocupaciones, no solo en el ámbito ético, sino también en cuanto a las crecientes disparidades en los presupuestos de investigación y desarrollo, que son una de las razones por las que entrar en el mercado se ha vuelto exponencialmente más difícil para los jugadores más pequeños, por no hablar de las startups. Agregue la disminución del interés de los inversores debido a los mayores riesgos, y la tarea de adquirir inversiones de I+D (como las de Nvidia) se vuelve directamente imposible, creando un campo de juego muy desigual.

Sin embargo, esta fuerte dependencia del hardware de Nvidia ejerce aún más presión sobre la consistencia de la cadena de suministro y abre el riesgo de interrupciones y bloqueo de proveedores, reduciendo la flexibilidad del mercado y escalando las barreras de entrada al mercado.

“Algunos están reuniendo dinero para asegurarse de que no dejarán a los usuarios en la estacada. En todas partes, términos de ingeniería como ‘optimización’ y ‘tamaño de modelo más pequeño’ están de moda, ya que las empresas tratan de reducir sus necesidades de GPU, e inversores este año han apostado cientos de millones de dólares a startups cuyo software ayuda a las empresas a hacer lo que pueden con las GPU que tienen.

La escasez de chips Nvidia deja a las startups de IA luchando por la potencia de cómputo Por Paresh Dave

Ahora es el momento de adoptar enfoques estratégicos, ya que esto puede ser lo que dará a su empresa la oportunidad de prosperar en medio de la influencia de Nvidia en el desarrollo de ML.

Estrategias que los jugadores no Big Tech pueden adaptar al dominio de Nvidia:

1. Comience a explorar RocM de AMD

AMD ha estado activamente reduciendo la brecha de desarrollo de IA con NVIDIA, un logro logrado a través de su apoyo constante a Rocm en las bibliotecas principales de PyTorch durante el último año. Este esfuerzo en curso ha resultado en una mejor compatibilidad y rendimiento, destacado prominentemente por el chip MI300, el lanzamiento más reciente de AMD. El MI300 ha demostrado un rendimiento robusto en tareas de inferencia de LLM, particularmente destacándose con modelos como LLama-70b. Este éxito subraya los avances significativos en el poder de procesamiento y la eficiencia logrados por AMD.

2. Encuentre otras alternativas de hardware

Además de los avances de AMD, Google ha introducido Unidades de Procesamiento de Tensor (TPU), hardware especializado diseñado explícitamente para acelerar las cargas de trabajo de ML, ofreciendo una alternativa robusta para entrenar modelos de IA a gran escala.

Más allá de estos gigantes de la industria, jugadores más pequeños pero impactantes como Graphcore y Cerebras están haciendo contribuciones notables al espacio de hardware de IA. La Unidad de Procesamiento de Inteligencia (IPU) de Graphcore, diseñada para la eficiencia en cálculos de IA, ha llamado la atención por su potencial en tareas de alto rendimiento, como se demuestra en la experimentación de Twitter. Cerebras, por otro lado, está empujando los límites con sus chips avanzados, enfatizando la escalabilidad y la potencia de cómputo cruda para aplicaciones de IA.

Los esfuerzos colectivos de estas empresas significan un cambio hacia un ecosistema de hardware de IA más diverso. Esta diversificación presenta estrategias viables para reducir la dependencia de Nvidia, brindando a los desarrolladores y investigadores una gama más amplia de plataformas para el desarrollo de IA.

3. Comience a invertir en la optimización del rendimiento

Además de explorar alternativas de hardware, la optimización del software resulta ser un factor crucial para disminuir el impacto del dominio de Nvidia. Al utilizar algoritmos eficientes, reducir cálculos innecesarios y aplicar técnicas de procesamiento paralelo, los jugadores no Big Tech pueden maximizar el rendimiento de sus modelos de ML en hardware existente, ofreciendo un enfoque pragmático para cerrar la brecha sin depender únicamente de mejoras de hardware costosas.

Un ejemplo de este enfoque se encuentra en la tecnología AutoNAC de Deci Ai. Esta innovación ha demostrado la capacidad de acelerar la inferencia de modelos por un factor de 3 a 10 veces, como se sustancia en el Benchmark MLPerf ampliamente reconocido. Al mostrar tales avances, se hace evidente que la optimización del software puede mejorar significativamente la eficiencia del desarrollo de ML, presentando una alternativa viable para mitigar la influencia del dominio de Nvidia en el campo.

4. Comience a colaborar con otras organizaciones para crear clusters descentralizados

Este enfoque colaborativo puede involucrar el intercambio de hallazgos de investigación, la inversión conjunta en opciones de hardware alternativas y el fomento del desarrollo de nuevas tecnologías de ML a través de proyectos de código abierto. Al descentralizar la inferencia y utilizar recursos de cómputo distribuidos, los jugadores no Big Tech pueden nivelar el campo de juego y crear un paisaje más competitivo en la industria de desarrollo de ML.

Hoy en día, la estrategia de compartir recursos de cómputo está ganando impulso en toda la industria tecnológica. El Motor de Kubernetes de Google (GKE) ejemplifica esto al admitir la multi-tenencia de clústeres, permitiendo una utilización eficiente de recursos e integración con servicios de terceros. Esta tendencia se evidencia aún más en iniciativas comunitarias como Petals, que ofrece una red distribuida para ejecutar modelos de IA, haciendo que la computación de alta potencia sea accesible sin una gran inversión. Además, plataformas como Together.ai brindan acceso servidorless a una amplia gama de modelos de código abierto, simplificando el desarrollo y fomentando la colaboración. Considerar estas plataformas puede permitirle acceder a recursos computacionales y oportunidades de desarrollo colaborativo, ayudándole a optimizar su proceso de desarrollo y reducir costos, independientemente del tamaño de la organización.

Conclusión

A escala global, la necesidad de las estrategias mencionadas se vuelve aparente. Cuando una entidad domina el mercado, sofoca el desarrollo y obstaculiza el establecimiento de precios razonables.

Los jugadores no Big Tech pueden contrarrestar el dominio de Nvidia explorando alternativas como RocM de AMD, invirtiendo en la optimización del rendimiento a través de algoritmos eficientes y procesamiento paralelo, y fomentando la colaboración con otras organizaciones para crear clusters descentralizados. Esto promueve un paisaje más diverso y competitivo en la industria de hardware y desarrollo de IA, permitiendo que los jugadores más pequeños tengan voz en el futuro del desarrollo de IA.

Estas estrategias apuntan a disminuir la dependencia de los precios y suministros de Nvidia, mejorando así el atractivo para la inversión, minimizando el riesgo de ralentización del desarrollo empresarial en medio de la competencia de hardware y fomentando el crecimiento orgánico en toda la industria.

Sergey Cheparukhin

Con más de 8 años de experiencia en el desarrollo de soluciones de inteligencia artificial y gestión de equipos en líderes de la industria como Meta y VK.com, Sergey aporta un sólido historial de innovación. Su compromiso con el campo también se evidencia por su contribución al campo académico con más de 6 años de docencia en instituciones de primer nivel en el mundo, incluyendo la Universidad Estatal de Moscú Lomonosov y la Universidad Técnica Estatal Bauman de Moscú, entre otras. Con experiencia que abarca la estrategia de ML, los grandes datos y las operaciones en la nube, las contribuciones de Sergey se basan en logros y reconocimientos sustanciales, tanto en el ámbito profesional como en los esfuerzos educativos.

Unite.AI

Enfrentando el dominio de Nvidia: estrategias de desarrollo de ML ágil para jugadores no Big Tech (en medio de desafíos de suministro y costo)

Por qué Nvidia domina el mercado de IA

La pesada carga del dominio de Nvidia

Estrategias que los jugadores no Big Tech pueden adaptar al dominio de Nvidia:

1. Comience a explorar RocM de AMD

2. Encuentre otras alternativas de hardware

3. Comience a invertir en la optimización del rendimiento

4. Comience a colaborar con otras organizaciones para crear clusters descentralizados

Conclusión

Descubre más