Contáctenos

El espejismo de la IA china: cómo el “código abierto” oculta lo que más importa

Líderes del pensamiento

El espejismo de la IA china: cómo el “código abierto” oculta lo que más importa

mm

Publicado

 on

Con grandes actores tecnológicos como Google, Microsoft y Meta compitiendo por dominar el mercado de IA, High Flyer de China, Baidu, Moonshot y Alibaba han sido noticia por lanzar sus búsqueda profundaERNIE 4.5Kimi K2Qwen3 Los modelos de lenguaje de gran tamaño, respectivamente, se publican como código abierto. Este cambio en la publicación de modelos GenAI protegidos y propietarios se ha percibido como una señal de que la industria china de IA está aprovechando el potencial del código abierto para democratizar el desarrollo de la IA e impulsar la innovación.

Sin embargo, al igual que muchos actores que promocionan sus ofertas como de código abierto e incluso lo incluyen en sus nombres de empresa, High Flyer, Baidu y Moonshot no han compartido elementos cruciales, como los conjuntos de datos que constituyen la base de sus modelos. A medida que estos grandes modelos buscan convertirse en productos básicos en los que los desarrolladores confíen, la transparencia de un código abierto auténtico, que pueda probarse, investigarse e iterarse, es crucial para crear tecnología imparcial, ética y beneficiosa en la que todos podamos confiar. Todos estos modelos de "código abierto" son, en realidad, de "peso abierto", lo que significa que pueden descargarse y usarse, pero no pueden inspeccionarse de forma significativa sin los datos.

Como les gusta a los jugadores estadounidenses AI abierto y  Meta Aunque parecen estar alejándose del código abierto, la invitación abierta de Baidu a aprovechar su conjunto gratuito de modelos ERNIE 4.5 puede, sin duda, impulsar la innovación y la colaboración con desarrolladores que buscan crear aplicaciones más pequeñas y potentes. Al mismo tiempo, la compañía, similar a la china Google, se ha ganado una ventaja competitiva al fomentar la adopción y consolidar sus modelos en el floreciente ecosistema de la IA.

Lo mismo puede decirse de DeepSeek, el económico Kimi K2 y el actualizado Qwen3, que cuenta con puntos de referencia que desafían a modelos cerrados como Claude Opus 4 y GPT-4o-0327.

Estos jugadores de IA se han posicionado bien en la carrera para convertirse en el modelo de producto preferido y la última actualización innovadora de Qwen3 incluso se inspiró en los comentarios de la comunidad de código abierto.

Sin embargo, al igual que muchos que promocionan su gran modelo de IA como de código abierto, la comunidad china de IA no comparte los datos ni otros componentes críticos de sus sistemas. En cambio, pide a los desarrolladores globales que depositen su fe ciega en modelos que no pueden comprender ni investigar plenamente.

Apostando por el futuro con modelos de IA de código abierto

Cuando el iPhone irrumpió en el mercado en 2007, algunos asumieron que Mac dominaría el juego de los teléfonos inteligentes con iOS, pero La participación en código abierto es fundamental para las empresas emergentes, al tiempo que estimulaba el crecimiento empresarial y económico en todo el mundo, y Android, una empresa emergente adquirida por Google en 2005, siguió este camino hacia la victoria.

Al lanzar software de código abierto que podía visualizarse, modificarse, adoptarse y compartirse, Android invitó a académicos, desarrolladores e incluso a la competencia a colaborar en el software. Esto aceleró el proceso de innovación, democratizó el campo de juego y, en última instancia, redujo los precios. Android llegó al mercado un año después del primer iPhone y, a principios de este año, iOS poseía el 71.88 por ciento del mercado mundial, frente al 27.65 por ciento.

En una revolución tecnológica que pareció ocurrir de la noche a la mañana, los teléfonos inteligentes se volvieron omnipresentes. A pesar de las continuas mejoras en software, hardware e interfaz de usuario, la industria ha crecido mucho más allá de intentar revolucionar el funcionamiento de los teléfonos inteligentes. Con los teléfonos celulares convertidos en un producto básico, la innovación actual reside en las aplicaciones que se ejecutan en ellos, y para competir, los proveedores de teléfonos inteligentes deben mantener un ecosistema que invite a los desarrolladores.

Apenas tres años después del lanzamiento de ChatGPT, la industria de la IA se encuentra al borde de un abismo similar. Todos los actores de la industria global de la IA aspiran a que sus modelos se conviertan en el próximo Android o incluso iOS, y al optar por el código abierto con los modelos DeepSeek, ERNIE 4.5 y Kimi K2, los innovadores chinos buscan consolidar su posición en un ecosistema emergente.

Si bien esto podría funcionar a su favor, no fomenta la verdadera transparencia del código abierto que ha sido esencial no solo para generar innovación, sino para generar innovación en la que podamos confiar.

Los datos son la pieza que falta en la mayoría de las IA de código abierto

Dado que los modelos de IA son mucho más complejos de crear y compartir que el software tradicional, la necesidad de una IA de código abierto es una tarea compleja. En lugar de un simple código fuente, los sistemas de IA se componen de... siete componentes—incluido el código fuente, los parámetros del modelo, el conjunto de datos, los hiperparámetros, el código fuente de entrenamiento, la generación de números aleatorios y los marcos de software.

Cada componente debe funcionar en conjunto para que un modelo ofrezca los resultados deseados, lo que significa que los desarrolladores necesitan visibilidad completa para compartir, modificar y adoptar un sistema y comprender qué está sucediendo. Sin embargo, dado que la reproducibilidad es la base del método científico, la industria de la IA tiene... hábito de utilizar el término código abierto para referirse a versiones gratuitas o de bajo precio que se ponen a disposición con acceso a algunas piezas del rompecabezas.

Baidu, por ejemplo, puso a disposición gratuitamente diez modelos ERNIE 4.5. Además de compartir el modelo y los parámetros, la empresa también publicó en código abierto ERNIEKit y los kits de herramientas de implementación FastDeploy. Estos permiten a los desarrolladores crear potentes aplicaciones de IA al proporcionar capacidades de nivel industrial, flujos de trabajo de entrenamiento e inferencia que ahorran recursos, y compatibilidad con múltiples hardware.

En otras palabras, Baidu ha proporcionado a los desarrolladores herramientas interesantes que les permiten liberar la innovación más rápidamente, lo que esperan que, a su vez, los motive a elegir ERNIE 4.5 en lugar de la competencia.

Sin embargo, a los desarrolladores que utilizan ERNIE 4.5 se les pide que confíen ciegamente en el modelo, porque Baidu ha mantenido mucho oculto, incluidos los conjuntos de datos que informan y enseñan sus modelos.

El poder de los modelos de IA transparentes de código abierto

Si bien cada pieza del rompecabezas de la IA es fundamental para que un modelo funcione, El 80 por ciento de los proyectos de IA fracasan y los datos son el núcleo del problemaLos conjuntos de datos inexactos, incompletos y sesgados conducen a modelos que no se comportan de manera predecible o como se desea.

Los Vídeo publicado recientemente del accidente fatal del Tesla Full-Autónomo (FSD) 2023Por ejemplo, expuso el peor escenario posible cuando un conjunto de datos y un modelo fallan. Mientras el Tesla Model Y aceleraba hacia un sol brillante al atardecer, el sistema parcialmente automatizado no pudo comprender ni reaccionar adecuadamente a lo que sus cámaras veían, o no veían. Mientras los vehículos conducidos por humanos reducían la velocidad y se detenían, la confusión del FSD provocó la muerte de una mujer.

Este fallo devastador reflejó datos visuales incompletos, así como la falta de un mecanismo de seguridad que considerara estos puntos ciegos. Cuando los desarrolladores no pueden ver sus datos, no pueden ver cómo interactúan con el modelo, lo que significa que no pueden detectar estos errores ni iterar para lograr un rendimiento robusto.

Lo que es aún más preocupante es que, sin los datos que alimentan el modelo, se ven obligados a confiar en él ciegamente.

Sin embargo, cuando los conjuntos de datos son de código abierto, la comunidad de IA ha demostrado que puede erradicar problemas problemáticos, como lo hizo al descubrir Más de 1,000 URL que contienen material verificado sobre abuso sexual infantil en LAION 5BDado que el conjunto de datos utilizado para los modelos de generación de texto a imagen con IA es fundamental para la creación de aplicaciones como Stable Diffusion y Midjourney, habría sido devastador para la industria de la IA si los usuarios hubieran comenzado a producir imágenes fotorrealistas ilícitas. En cambio, la naturaleza abierta de este conjunto de datos permitió a la comunidad descubrir el contenido peligroso y promover una solución, Liaison B.

Además, gran parte de ese primer conjunto de datos se basó en el web scraping realizado por el enorme Common Crawl, que también se aprovechó para los modelos ChatGPT y LLAMA. Incluso cuando Los rastreadores de IA siguen generando inquietudes sobre la redacción de textos, la privacidad y el etiquetado sesgado y racista.Sin embargo, los desarrolladores de la comunidad de IA son Trabajando en formas de limpiar partes del creciente conjunto de datos de código abierto de Common Crawl para un uso más seguro.

Como los desarrolladores apuntan no solo a crear una IA poderosa, sino también una IA en la que podamos confiar, tanto los usuarios como la industria están protegidos por la transparencia y la colaboración del verdadero código abierto.

Adoptar el camino del código abierto

Mientras muchos aún desconfían de esta tecnología en auge, la carrera para convertirse en el iOS o Android de los grandes modelos de productos básicos de IA está en marcha, y como la comunidad global de IA construye literalmente lo que se convertirá en el estándar para el futuro y los sistemas de IA ya están conduciendo automóviles y ofreciendo evaluaciones médicas, generar confianza mediante la creación de una IA imparcial, confiable y segura nunca ha sido más crítico.

Mientras la comunidad china de IA intenta posicionarse como líder de la innovación abierta, el camino hacia una IA segura solo se encuentra en la transparencia del código abierto auténtico, comprobada durante décadas de innovación de software. Aplicar el término a sistemas que no comparten elementos críticos como los datos impide a los desarrolladores investigar, replicar e iterar. Si bien el atractivo de modelos fácilmente disponibles como DeepSeek, ERNIE 4.5, Kimi K2 y Qwen3 es innegable, los desarrolladores que los aprovechan sacrifican la transparencia que fomenta la colaboración y la innovación por la comodidad.

La comunidad de IA debe elegir: adoptar una transparencia radical a través de un código abierto genuino o arriesgarse a construir los sistemas críticos del mañana sobre las cajas negras de hoy.

El Dr. Jason Corso es cofundador y director científico de Voxel51Profesor de Robótica, Ingeniería Eléctrica e Informática en la Universidad de Michigan. Con amplia experiencia en el campo de la visión artificial, el Dr. Corso ha dedicado más de 20 años a la investigación académica en los campos de la comprensión de video, la robótica y la ciencia de datos.