Inteligencia artificial

Cómo Google redujo los requisitos de entrenamiento de IA en 10,000x

Published August 14, 2025

Updated April 26, 2026

Dr. Tehseen Zia

La industria de la inteligencia artificial se enfrenta a una paradoja fundamental. Mientras que las máquinas pueden procesar datos a escalas masivas, el aprendizaje sigue siendo sorprendentemente ineficiente, enfrentando el desafío de los rendimientos decrecientes. Los enfoques tradicionales de aprendizaje automático exigen conjuntos de datos masivos y etiquetados que pueden costar millones de dólares y tomar años en crearse. Estos enfoques suelen operar bajo la creencia de que más datos conducen a mejores modelos de IA. Sin embargo, los investigadores de Google han introducido recientemente un método innovador que desafía esta creencia de larga data. Demuestran que se puede lograr un rendimiento de IA similar con hasta 10,000 veces menos datos de entrenamiento. Este desarrollo tiene el potencial de cambiar fundamentalmente la forma en que abordamos la IA. En este artículo, exploraremos cómo los investigadores de Google lograron este avance, el impacto potencial futuro del desarrollo y los desafíos y direcciones por delante.

El desafío de los grandes datos en IA

Durante décadas, el mantra “más datos igual a mejor IA” ha impulsado el enfoque de la industria hacia la IA. Los grandes modelos de lenguaje como GPT-4 consumen billones de tokens durante el entrenamiento. Este enfoque ávido de datos crea una barrera significativa para las organizaciones que carecen de recursos extensos o conjuntos de datos especializados. Primero, el costo de la etiquetación humana es significativamente alto. Los annotadores expertos cobran tarifas altas, y el volumen masivo de datos necesarios hace que los proyectos sean costosos. Segundo, la mayoría de los datos recopilados suelen ser redundantes y no podrían desempeñar un papel crucial en el proceso de aprendizaje. El método tradicional también lucha con los requisitos cambiantes. Cuando las políticas cambian o surgen nuevos tipos de contenido problemático, las empresas deben comenzar el proceso de etiquetado desde cero. Este proceso crea un ciclo constante de recopilación de datos costosa y retramientamiento de modelos.

Abordar los desafíos de los grandes datos con aprendizaje activo

Una de las formas conocidas de abordar estos desafíos de datos es mediante el empoderamiento del aprendizaje activo. Este enfoque se basa en un proceso de curación cuidadoso que identifica los ejemplos de entrenamiento más valiosos para la etiquetación humana. La idea subyacente es que los modelos aprenden mejor de los ejemplos que les resultan más confusos, en lugar de consumir pasivamente todos los datos disponibles. A diferencia de los métodos de IA tradicionales, que requieren grandes conjuntos de datos, el aprendizaje activo adopta un enfoque más estratégico al centrarse en recopilar solo los ejemplos más informativos. Este enfoque ayuda a evitar la ineficiencia de etiquetar datos obvios o redundantes que aportan poco valor al modelo. En cambio, el aprendizaje activo se centra en los casos límite y los ejemplos inciertos que tienen el potencial de mejorar significativamente el rendimiento del modelo.

Al concentrar el esfuerzo de los expertos en estos ejemplos clave, el aprendizaje activo permite que los modelos aprendan más rápido y de manera más efectiva con mucho menos puntos de datos. Este enfoque tiene el potencial de abordar tanto el cuello de botella de datos como las ineficiencias de los enfoques de aprendizaje automático tradicionales.

El enfoque de aprendizaje activo de Google

El equipo de investigación de Google ha empleado con éxito este paradigma. Su nueva metodología de aprendizaje activo demuestra que los ejemplos cuidadosamente curados y de alta calidad pueden reemplazar cantidades masivas de datos etiquetados. Por ejemplo, muestran que los modelos entrenados con menos de 500 ejemplos etiquetados por expertos igualan o superan el rendimiento de los sistemas entrenados con 100,000 etiquetas tradicionales.

El proceso funciona a través de lo que Google llama un sistema “LLM-as-Scout”. El gran modelo de lenguaje primero escanea vastas cantidades de datos no etiquetados, identificando casos en los que se siente más incierto. Estos casos límite representan exactamente los escenarios en los que el modelo necesita la guía humana para mejorar su toma de decisiones. El proceso comienza con un modelo inicial que etiqueta grandes conjuntos de datos utilizando prompts básicos. El sistema luego agrupa ejemplos por sus clasificaciones predichas e identifica regiones donde el modelo muestra confusión entre diferentes categorías. Estos clusters superpuestos revelan los puntos precisos donde el juicio humano experto puede ser más valioso.

La metodología se centra explícitamente en pares de ejemplos que se encuentran más juntos pero llevan diferentes etiquetas. Estos casos límite representan exactamente los escenarios en los que la experiencia humana es más importante. Al concentrar los esfuerzos de etiquetado experto en estos ejemplos confusos, el sistema logra ganancias de eficiencia notables.

Cualidad sobre cantidad

La investigación revela un hallazgo clave sobre la calidad de los datos que desafía una suposición común en IA. Demuestra que las etiquetas de expertos, con su alta fidelidad, superan consistentemente las anotaciones a gran escala de crowdsourcing. Medieron esto utilizando Cohen’s Kappa, una herramienta estadística que evalúa cómo se alinean las predicciones del modelo con las opiniones de los expertos, más allá de lo que ocurriría por casualidad. En los experimentos de Google, los annotadores expertos lograron puntajes de Cohen’s Kappa por encima de 0,8, superando significativamente lo que el crowdsourcing suele proporcionar.

Esta mayor consistencia permite que los modelos aprendan de manera efectiva con mucho menos ejemplos. En pruebas con Gemini Nano-1 y Nano-2, los modelos igualaron o superaron la alineación con expertos utilizando solo 250-450 ejemplos cuidadosamente seleccionados en comparación con alrededor de 100,000 etiquetas aleatorias de crowdsourcing. Eso es una reducción de tres a cuatro órdenes de magnitud. Sin embargo, los beneficios no se limitan solo a utilizar menos datos. Los modelos entrenados con este enfoque a menudo superan a aquellos entrenados con métodos tradicionales. Para tareas complejas y modelos más grandes, las mejoras en el rendimiento alcanzaron del 55-65% sobre la línea de base, lo que muestra una alineación más sustancial y confiable con los expertos en políticas.

Por qué este avance es importante ahora

Este desarrollo llega en un momento crítico para la industria de la IA. A medida que los modelos crecen en tamaño y sofisticación, el enfoque tradicional de escalar los datos de entrenamiento se ha vuelto cada vez más insostenible. El costo ambiental de entrenar modelos masivos sigue creciendo, y las barreras económicas para entrar siguen siendo altas para muchas organizaciones.

El método de Google aborda múltiples desafíos de la industria al mismo tiempo. La reducción dramática en los costos de etiquetado hace que el desarrollo de IA sea más accesible para equipos de investigación y organizaciones más pequeños. Los ciclos de iteración más rápidos permiten una adaptación rápida a los requisitos cambiantes, lo cual es esencial en campos dinámicos como la moderación de contenido o la ciberseguridad.

El enfoque también tiene implicaciones más amplias para la seguridad y la confiabilidad de la IA. Al centrarse en los casos en los que los modelos son más inciertos, el método identifica naturalmente los modos de falla potenciales y los casos límite. Este proceso crea sistemas más robustos que mejor comprenden sus limitaciones.

Las implicaciones más amplias para el desarrollo de IA

Este avance sugiere que podemos estar entrando en una nueva fase del desarrollo de IA donde la eficiencia es más importante que la escala. El enfoque tradicional de “más es mejor” para los datos de entrenamiento puede dar paso a métodos más sofisticados que prioricen la calidad de los datos y la selección estratégica.

Las implicaciones ambientales solas son significativas. Entrenar grandes modelos de IA requiere actualmente enormes recursos computacionales y consumo de energía. Si se puede lograr un rendimiento similar con dramáticamente menos datos, la huella de carbono del desarrollo de IA podría disminuir sustancialmente.

El efecto democratizador podría ser igualmente importante. Los equipos de investigación más pequeños y las organizaciones que anteriormente no podían costear esfuerzos masivos de recopilación de datos ahora tienen un camino hacia sistemas de IA competitivos. Este desarrollo podría acelerar la innovación y crear perspectivas más diversas en el desarrollo de IA.

Limitaciones y consideraciones

A pesar de sus resultados prometedores, la metodología enfrenta varios desafíos prácticos. El requisito de annotadores expertos con puntajes de Cohen’s Kappa por encima de 0,8 puede limitar la aplicabilidad en dominios que carecen de suficiente experiencia o criterios de evaluación claros. La investigación se centra principalmente en tareas de clasificación y aplicaciones de seguridad de contenido. Si las mejoras dramáticas se aplican a otros tipos de tareas de IA, como la generación de lenguaje o el razonamiento, queda por verse.

La naturaleza iterativa del aprendizaje activo también introduce complejidad en comparación con los enfoques de procesamiento por lotes tradicionales. Las organizaciones deben desarrollar nuevos flujos de trabajo e infraestructura para respaldar los ciclos de consulta-respuesta que permiten la mejora continua del modelo.

La investigación futura probablemente explorará enfoques automatizados para mantener la calidad de anotación de expertos y desarrollar adaptaciones específicas del dominio de la metodología principal. La integración de los principios de aprendizaje activo con otras técnicas de eficiencia, como ajuste fino eficiente de parámetros, podría producir ganancias de rendimiento adicionales.

La parte inferior

La investigación de Google muestra que los datos dirigidos y de alta calidad pueden ser más efectivos que los conjuntos de datos masivos. Al centrarse en etiquetar solo los ejemplos más valiosos, redujeron las necesidades de entrenamiento en hasta 10,000 veces mientras mejoraban el rendimiento. Este enfoque reduce los costos, acelera el desarrollo, reduce el impacto ambiental y hace que la IA avanzada sea más accesible. Marca un cambio significativo hacia el desarrollo de IA eficiente y sostenible.

Dr. Tehseen Zia

El Dr. Tehseen Zia es un profesor asociado titular en la Universidad COMSATS de Islamabad, con un doctorado en Inteligencia Artificial de la Universidad Técnica de Viena, Austria. Especializado en Inteligencia Artificial, Aprendizaje Automático, Ciencia de Datos y Visión por Computadora, ha hecho contribuciones significativas con publicaciones en revistas científicas reputadas. El Dr. Tehseen también ha liderado varios proyectos industriales como investigador principal y ha servido como consultor de Inteligencia Artificial.