Entrevistas
Alex Yeh, Fundador y CEO de GMI Cloud – Serie de Entrevistas

Alex Yeh es el Fundador y CEO de GMI Cloud, una empresa de infraestructura digital con respaldo de capital de riesgo que tiene como misión empoderar a cualquier persona para implementar inteligencia artificial de manera eficiente y simplificar la forma en que las empresas construyen, implementan y escalan la inteligencia artificial a través de soluciones de hardware y software integradas.
¿Qué te inspiró a crear GMI Cloud, y cómo ha influido tu experiencia en la construcción de la empresa?
GMI Cloud se fundó en 2021, centrando su atención principalmente en sus dos primeros años en la construcción y operación de centros de datos para proporcionar nodos de computación de Bitcoin. Durante este período, establecimos tres centros de datos en Arkansas y Texas.
En junio del año pasado, notamos una fuerte demanda de inversores y clientes de potencia de computación de GPU. Dentro de un mes, tomé la decisión de cambiar el enfoque hacia la infraestructura de nube de inteligencia artificial. El rápido desarrollo de la inteligencia artificial y la ola de nuevas oportunidades comerciales que conlleva son impredecibles o difíciles de describir. Al proporcionar la infraestructura esencial, GMI Cloud busca mantenerse estrechamente alineada con las emocionantes y a menudo inimaginables oportunidades en inteligencia artificial.
Antes de GMI Cloud, fui socio de una firma de capital de riesgo, interactuando regularmente con industrias emergentes. Veo la inteligencia artificial como la última “fiebre del oro” del siglo XXI, con las GPU y los servidores de inteligencia artificial como los “picores” para los “prospectores” modernos, impulsando un crecimiento rápido para las empresas de nube especializadas en alquiler de potencia de computación de GPU.
Puedes contarnos sobre la misión de GMI Cloud para simplificar la infraestructura de inteligencia artificial y por qué este enfoque es tan crucial en el mercado actual?
Simplificar la infraestructura de inteligencia artificial es esencial debido a la complejidad y fragmentación actuales de la pila de inteligencia artificial, lo que puede limitar la accesibilidad y la eficiencia para las empresas que buscan aprovechar el potencial de la inteligencia artificial. Los entornos de inteligencia artificial actuales a menudo involucran varias capas desconectadas, desde la preprocesamiento de datos y el entrenamiento de modelos hasta la implementación y escalabilidad, que requieren un tiempo significativo, habilidades especializadas y recursos para gestionarlos de manera efectiva. Muchas empresas pasan semanas e incluso meses identificando las capas más adecuadas de la infraestructura de inteligencia artificial, un proceso que puede extenderse a semanas o incluso meses, afectando la experiencia del usuario y la productividad.
- Acelerar la implementación: Una infraestructura simplificada permite un desarrollo y una implementación más rápidos de soluciones de inteligencia artificial, lo que ayuda a las empresas a mantenerse competitivas y adaptables a las necesidades cambiantes del mercado.
- Reducir costos y recursos: Al minimizar la necesidad de hardware especializado y integraciones personalizadas, una pila de inteligencia artificial optimizada puede reducir significativamente los costos, lo que la hace más accesible, especialmente para las pequeñas empresas.
- Habilitar la escalabilidad: Una infraestructura bien integrada permite una gestión eficiente de los recursos, lo que es esencial para escalar aplicaciones a medida que crece la demanda, garantizando que las soluciones de inteligencia artificial sigan siendo robustas y responsivas a mayor escala.
- Mejorar la accesibilidad: La infraestructura simplificada hace que sea más fácil para una amplia gama de organizaciones adoptar la inteligencia artificial sin requerir una amplia experiencia técnica. Esta democratización de la inteligencia artificial promueve la innovación y crea valor en más industrias.
- Apoiar la innovación rápida: A medida que avanza la tecnología de inteligencia artificial, una infraestructura menos compleja hace que sea más fácil incorporar nuevas herramientas, modelos y métodos, lo que permite a las organizaciones mantenerse ágiles y innovar rápidamente.
La misión de GMI Cloud de simplificar la infraestructura de inteligencia artificial es esencial para ayudar a las empresas y startups a aprovechar al máximo los beneficios de la inteligencia artificial, haciéndola accesible, rentable y escalable para organizaciones de todos los tamaños.
Recientemente obtuviste $82 millones en financiación de Serie A. ¿Cómo se utilizará esta nueva capital y cuáles son tus objetivos de expansión inmediatos?
GMI Cloud utilizará la financiación para abrir un nuevo centro de datos en Colorado y principalmente invertir en GPU H200 para construir un cluster de GPU adicional a gran escala. GMI Cloud también está desarrollando activamente su propia plataforma de gestión de recursos nativa en la nube, Cluster Engine, que se integra perfectamente con nuestro hardware avanzado. Esta plataforma proporciona capacidades sin precedentes en virtualización, contenerización y orquestación.
GMI Cloud ofrece acceso a GPU a 2 veces la velocidad en comparación con los competidores. ¿Qué enfoques o tecnologías únicas hacen posible esto?
Un aspecto clave del enfoque único de GMI Cloud es aprovechar el NCP de NVIDIA, lo que proporciona a GMI Cloud acceso prioritario a GPU y otros recursos de vanguardia. Esta adquisición directa de los fabricantes, combinada con opciones de financiación sólidas, garantiza la eficiencia de costos y una cadena de suministro altamente segura.
Con GPU H100 de NVIDIA disponibles en cinco ubicaciones globales, ¿cómo apoya esta infraestructura las necesidades de los clientes de inteligencia artificial en EE. UU. y Asia?
GMI Cloud ha establecido una presencia global, sirviendo a múltiples países y regiones, incluyendo Taiwán, Estados Unidos y Tailandia, con una red de centros de datos de Internet (IDC) en todo el mundo. Actualmente, GMI Cloud opera miles de tarjetas de GPU basadas en NVIDIA Hopper, y está en una trayectoria de expansión rápida, con planes para multiplicar sus recursos en los próximos seis meses. Esta distribución geográfica permite a GMI Cloud ofrecer un servicio sin interrupciones, de baja latencia, a los clientes en diferentes regiones, optimizando la eficiencia de transferencia de datos y brindando un soporte de infraestructura robusto para las empresas que amplían sus operaciones de inteligencia artificial en todo el mundo.
Además, las capacidades globales de GMI Cloud permiten que la empresa comprenda y satisfaga las diversas demandas del mercado y los requisitos regulatorios en diferentes regiones, brindando soluciones personalizadas adaptadas a las necesidades únicas de cada ubicación. Con una creciente reserva de recursos de computación, GMI Cloud aborda la creciente demanda de potencia de computación de inteligencia artificial, ofreciendo a los clientes una amplia capacidad computacional para acelerar el entrenamiento de modelos, mejorar la precisión y mejorar el rendimiento del modelo para una amplia gama de proyectos de inteligencia artificial.
Como líder en servicios de nube nativos de inteligencia artificial, ¿qué tendencias o necesidades de los clientes te enfocas para impulsar la tecnología de GMI hacia adelante?
Desde las GPU hasta las aplicaciones, GMI Cloud impulsa la transformación inteligente para los clientes, satisfaciendo las demandas del desarrollo de la tecnología de inteligencia artificial.
Arquitectura de hardware:
- Arquitectura de clúster físico: Instancias como el 1250 H100 incluyen bastidores de GPU, bastidores de hoja y bastidores de columna vertebral, con configuraciones optimizadas de servidores y equipos de red que brindan una gran potencia de computación.
- Estructura de topología de red: Diseñada con un tejido de IB eficiente y un tejido de Ethernet, garantizando una transmisión y comunicación de datos sin interrupciones.
Software y servicios:
- Cluster Engine: Utilizando un motor desarrollado en casa para gestionar recursos como metal desnudo, contenedores/ Kubernetes y HPC Slurm, permitiendo una asignación óptima de recursos para los usuarios y administradores.
- Plataforma de nube propietaria: El CLUSTER ENGINE es un sistema de gestión de nube propietario que optimiza la programación de recursos, proporcionando una solución de gestión de clústeres flexible y eficiente.
Agregar hoja de ruta del motor de inferencia:
- Computación continua, garantizar alta SLA.
- Compartir tiempo para uso de tiempo fraccionado.
- Instancia de oportunidad
Consultoría y servicios personalizados: Ofrece consultoría, informes de datos y servicios personalizados como contenerización, recomendaciones de entrenamiento de modelos y plataformas de MLOps personalizadas.
Características de seguridad y monitoreo robustas: Incluye control de acceso basado en roles (RBAC), gestión de grupos de usuarios, monitoreo en tiempo real, seguimiento histórico y notificaciones de alerta.
En tu opinión, ¿cuáles son algunos de los mayores desafíos y oportunidades para la infraestructura de inteligencia artificial en los próximos años?
Desafíos:
- Escalabilidad y costos: A medida que los modelos se vuelven más complejos, mantener la escalabilidad y la asequibilidad se convierte en un desafío, especialmente para las empresas más pequeñas.
- Energía y sostenibilidad: El alto consumo de energía exige soluciones más ecológicas a medida que aumenta la adopción de la inteligencia artificial.
- Seguridad y privacidad: La protección de datos en infraestructuras compartidas requiere una evolución de la seguridad y el cumplimiento normativo.
- Interoperabilidad: Las herramientas fragmentadas en la pila de inteligencia artificial complican la implementación y la integración sin problemas. Complica la implementación de cualquier inteligencia artificial, de hecho. Ahora podemos reducir el tiempo de desarrollo en 2x y reducir el número de empleados para un proyecto de inteligencia artificial en 3x.
Oportunidades:
- Crecimiento de la inteligencia artificial en el borde: El procesamiento de inteligencia artificial más cerca de las fuentes de datos ofrece una reducción de la latencia y la conservación de la banda ancha.
- Operaciones de MLOps automatizadas: Las operaciones optimizadas reducen la complejidad de la implementación, lo que permite a las empresas centrarse en las aplicaciones.
- Hardware de eficiencia energética: Las innovaciones pueden mejorar la accesibilidad y reducir el impacto ambiental.
- Nube híbrida: La infraestructura que opera en entornos de nube y locales es adecuada para la flexibilidad empresarial.
- Gestión impulsada por inteligencia artificial: Utilizar la inteligencia artificial para optimizar de manera autónoma la infraestructura reduce el tiempo de inactividad y mejora la eficiencia.
¿Puedes compartir perspectivas sobre tu visión a largo plazo para GMI Cloud? ¿Qué papel crees que desempeñará en la evolución de la inteligencia artificial y la inteligencia artificial general?
Quiero construir la inteligencia artificial de Internet. Quiero construir la infraestructura que impulsa el futuro en todo el mundo.
Para crear una plataforma accesible, similar a Squarespace o Wix, pero para la inteligencia artificial. Cualquiera debería poder construir su aplicación de inteligencia artificial.
En los próximos años, la inteligencia artificial experimentará un crecimiento sustancial, particularmente con casos de uso de inteligencia artificial generativa, a medida que más industrias integren estas tecnologías para mejorar la creatividad, automatizar procesos y optimizar la toma de decisiones. La inferencia desempeñará un papel central en este futuro, permitiendo aplicaciones de inteligencia artificial en tiempo real que pueden manejar tareas complejas de manera eficiente y a gran escala. Los casos de uso empresariales a empresariales (B2B) dominarán, con empresas cada vez más enfocadas en aprovechar la inteligencia artificial para impulsar la productividad, optimizar las operaciones y crear nuevo valor. La visión a largo plazo de GMI Cloud se alinea con esta tendencia, con el objetivo de proporcionar infraestructura avanzada y confiable que apoye a las empresas en maximizar la productividad y el impacto de la inteligencia artificial en toda su organización.
A medida que escalas las operaciones con el nuevo centro de datos en Colorado, ¿qué objetivos estratégicos o hitos te propones lograr en el próximo año?
A medida que escalamos las operaciones con el nuevo centro de datos en Colorado, nos centramos en varios objetivos estratégicos y hitos en el próximo año. EE. UU. es el mercado más grande para la inteligencia artificial y el cómputo de inteligencia artificial, lo que hace imperativo para nosotros establecer una presencia sólida en esta región. La ubicación estratégica de Colorado, combinada con su ecosistema tecnológico robusto y un entorno empresarial favorable, nos permite servir mejor a una base de clientes en crecimiento y mejorar nuestras ofertas de servicio.
¿Qué consejo le darías a las empresas o startups que buscan adoptar infraestructura de inteligencia artificial avanzada?
Para las startups centradas en la innovación impulsada por la inteligencia artificial, la prioridad debería ser construir y perfeccionar sus productos, no gastar tiempo valioso en la gestión de la infraestructura. Asocíese con proveedores de tecnología de confianza que ofrezcan soluciones de GPU confiables y escalables, evitando a los proveedores que recortan esquinas con alternativas de marca blanca. La confiabilidad y la implementación rápida son fundamentales; en las primeras etapas, la velocidad a menudo es el único foso competitivo que una startup tiene contra los jugadores establecidos. Elija opciones basadas en la nube y flexibles que respalden el crecimiento, y centrándose en la seguridad y el cumplimiento sin sacrificar la agilidad. Al hacerlo, las startups pueden integrarse sin problemas, iterar rápidamente y canalizar sus recursos hacia lo que realmente importa: entregar un producto destacado en el mercado.
Gracias por la gran entrevista, los lectores que desean aprender más pueden visitar GMI Cloud,












