Inteligencia artificial

El AI que se enseña a sí mismo ya no es ciencia ficción

mm

Los marcos de AI emergentes están avanzando hacia un salto radical: máquinas que se auto-mejoran, sin necesidad de insight humano.

Durante años, incluso los modelos de AI más avanzados permanecieron como motores pasivos, prediciendo respuestas basadas en datos de entrenamiento que no podían modificar. Pero hoy en día, no es el tamaño del modelo lo que define el próximo capítulo de la inteligencia artificial, sino si el modelo puede evolucionar por sí mismo.

Recientemente, los investigadores del MIT presentaron un nuevo marco de AI llamado Self-Adapting LLMs (SEAL). Este enfoque permite que los grandes modelos de lenguaje (LLM) se mejoren a sí mismos de manera autónoma, lo que permite que la IA diagnostique sus limitaciones y actualice permanentemente sus propios pesos neuronales a través de un bucle de retroalimentación interno impulsado por el aprendizaje por refuerzo. En lugar de requerir que los investigadores detecten errores, escriban nuevos prompts o alimenten ejemplos adicionales, el modelo asume la plena propiedad de su evolución.

“Los grandes modelos de lenguaje (LLM) son potentes pero estáticos; carecen de mecanismos para adaptar sus pesos en respuesta a nuevas tareas, conocimientos o ejemplos”, escribieron los investigadores del MIT en una publicación de blog. “Los experimentos sobre incorporación de conocimientos y generalización de pocos disparos muestran que SEAL es un paso prometedor hacia modelos de lenguaje capaces de adaptación auto-dirigida en respuesta a nuevos datos”.

En pruebas tempranas, este bucle de auto-edición permitió que los modelos pasaran de un fracaso completo a un éxito en rompecabezas de razonamiento abstracto complejos, superando incluso a modelos más grandes como GPT-4.1 con una tasa de éxito del 72,5%, donde los métodos tradicionales fracasaron. Además, SEAL reduce la supervisión humana en un 85% mientras aumenta la precisión y la adaptabilidad.

El surgimiento de los marcos de AI auto-enseñados

SEAL es parte de una tendencia más amplia hacia la inteligencia artificial autónoma. Los investigadores de Sakana AI, por ejemplo, han introducido la Máquina de Darwin-Gödel—un agente de IA que reescribe su propio código utilizando estrategias evolutivas de código abierto.

“Crea diversas auto-mejoras, como una validación de parches, una mejor visualización de archivos, herramientas de edición mejoradas, generación y clasificación de múltiples soluciones para elegir la mejor, y agregar un historial de lo que se ha intentado antes (y por qué falló) al hacer nuevos cambios”, escribió Sakana AI en una publicación de blog.

De manera similar, los agentes de IA de Anthropic, impulsados por Claude 4, pueden ahora orquestar flujos de trabajo de manera autónoma en código y herramientas de negocio.

“Un sistema que se reconfigura según el tipo de activo, su entorno y su historia permite pasar de una respuesta reactiva a una estrategia de prevención continua”, me dijo Christian Struve, CEO y cofundador de Fracttal. “No se trata de más capas o más parámetros, sino de sistemas más autónomos y más útiles”.

Lo que une estos esfuerzos es una creencia fundamental: la IA no necesita ser más grande para ser más inteligente. Necesita volverse más adaptable.

“La escalabilidad ha traído ganancias importantes, pero estamos llegando a los límites de lo que el tamaño solo puede lograr. Los modelos de aprendizaje auto-adaptables como SEAL ofrecen un paso siguiente convincente al permitir que los sistemas crezcan y se mejoren con el tiempo”, me dijo Jorge Riera, fundador y CEO de la plataforma de consultoría de datos full-stack Dataco. “Los modelos auto-evolutivos también cambian las métricas de progreso de benchmarks estáticos a medidas de adaptabilidad, eficiencia de aprendizaje y mejora a largo plazo segura. En lugar de probar solo lo que un modelo sabe en la implementación, podemos evaluar cómo aprende, retiene y evoluciona con el tiempo”.

Impacto en el ecosistema de IA y la carrera global hacia la autonomía

Este nivel de autonomía también reescribe la economía de la implementación de IA. Imagina sistemas de detección de fraude que se actualizan a sí mismos instantáneamente para contrarrestar nuevas amenazas, o tutores de IA que cambian su estilo de enseñanza según el comportamiento de un estudiante. En robótica, los marcos auto-adaptativos podrían conducir a máquinas autónomas que aprenden nuevos patrones de movimiento sin necesidad de ser reprogramadas.

En todo el Medio Oriente, países como los Emiratos Árabes Unidos y Arabia Saudita están construyendo rápidamente modelos fundamentales diseñados para la adaptación. El Falcon de los Emiratos Árabes Unidos y el Jais de G42 son LLM de código abierto construidos con relevancia regional en mente, mientras que el ALLaM de Arabia Saudita y el Metabrain de Aramco Digital están avanzando en el ámbito de los agentes de IA autónomos para ciudades inteligentes, atención médica y logística.

Estos esfuerzos no son equivalentes al SEAL del MIT en términos de capacidad de auto-edición, pero reflejan una trayectoria compartida: desde sistemas de IA pasivos a agentes activos y evolutivos que pueden navegar la complejidad con una guía humana limitada. Y al igual que SEAL, estas iniciativas están respaldadas por marcos de gobernanza robustos, destacando la creciente conciencia de que la autonomía de la IA debe ir acompañada de responsabilidad.

“Este es un primer paso hacia sistemas auto-administrados que modifican su lógica sin intervención constante”, dice Struve. “Creo que la inteligencia artificial no redefine qué es la inteligencia, pero sí nos obliga a replantearnos nuestra relación con ella. Lo importante no es que un modelo evolucione, sino que lo haga en alineación con los objetivos que definimos como humanos”.

Jeff Townes, CTO de Gorilla Logic, también destaca la importancia de la gobernanza que mantiene el ritmo con la evolución de la IA: “La pregunta no es si la IA puede evolucionar, sino si la empresa puede evolucionar con ella. La gobernanza debe anclar cada adaptación de la IA a resultados claros y KPI que los líderes puedan medir y confiar, para que la innovación se escale con confianza en lugar de riesgo”.

¿Estamos listos para la IA que se reescribe a sí misma?

La pregunta más provocativa que plantea SEAL no es técnica, sino que si los modelos pueden decidir cómo enseñarse a sí mismos, ¿cuál es el papel que desempeñamos en la configuración de sus valores, prioridades y dirección?

Los expertos advierten que a medida que los sistemas de IA auto-adaptativos ganan autonomía, la carrera hacia la auto-mejora no debe superar el establecimiento de guardias éticas. “Creo que todos los sistemas de IA deben incorporar al menos tres principios éticos básicos”, dice Jacob Evans, CTO en Kryterion.

“Primero, y esto puede parecer obvio, pero las IA necesitan identificarse como IA. Segundo, las IA deben ser centradas en el ser humano, aumentando y no reemplazando el juicio humano. Y finalmente, deben reconocer sus limitaciones y incertidumbres, y negarse a proporcionar información que pueda facilitar un daño grave. Sin estas salvaguardas, la IA puede convertirse en una herramienta de manipulación en lugar de un apoyo confiable”.

“Para permitir que los modelos se auto-mejoren en producción, necesitan un bucle de retroalimentación dinámico, no solo un entrenamiento estático. Un método poderoso es utilizar un ‘gemelo digital’ o un entorno de sandbox sofisticado donde la IA pueda probar y validar sus propias mejoras auto-generadas antes de que se desplieguen a los usuarios”, compartió Ganesh Vanama, ingeniero de visión por computadora en Automotus.

En cuanto a la gobernanza, Vanama agregó que “el control no negociable es la supervisión ‘humano en el bucle’”. Dijo que mientras queremos que los modelos se adapten, “debes tener una supervisión continua para detectar ‘desviación de alineación’ donde el modelo se desvía de sus objetivos o restricciones de seguridad previstos. Este sistema debe dar a un auditor humano el poder de vetar o revertir cualquier actualización autónoma que no supere una revisión de seguridad o rendimiento”.

Pero otros expertos creen que todavía hay tiempo para desarrollar estas salvaguardas, argumentando que construir una IA auto-mejorada robusta y general propósito sigue siendo un desafío monumental.

“Estos modelos todavía carecen de la capacidad de reprogramarse a sí mismos de manera confiable en tiempo real. Los desafíos clave siguen siendo, incluyendo la prevención del refuerzo de errores, la evitación del olvido catastrófico, la garantía de estabilidad durante las actualizaciones y el mantenimiento de la transparencia sobre los cambios internos”, dice Riera. “Hasta que se aborden, la adaptación auto-dirigida completa sigue siendo una frontera en lugar de una realidad”.

Los investigadores del MIT ven SEAL como una evolución necesaria. Como lo expresó uno de los científicos líderes del MIT, este marco actualmente solo refleja el aprendizaje humano de manera más cercana que cualquier cosa que haya venido antes.

“Estos sistemas sugieren un cambio de modelos estáticos y de un solo disparo a arquitecturas adaptativas que pueden aprender de la experiencia, gestionar la memoria y perseguir objetivos con el tiempo. La dirección es clara: hacia una inteligencia modular y consciente del contexto que puede ajustarse continuamente”, me dijo Riera. “Aunque todavía está en la fase experimental, este enfoque marks a meaningful step toward more autonomous and resilient AI systems.”

Ya sea que esto conduzca a sistemas más personalizados o a nuevas formas de agencia de máquina, queda por verse. La era de la IA auto-enseñada ha llegado, y no solo está reescribiendo su propio código, sino que también está reescribiendo las reglas de lo que las máquinas pueden llegar a ser.

Victor Dey es un editor y escritor de tecnología que cubre A.I., criptomonedas, ciencia de datos, metaverso y ciberseguridad en el ámbito empresarial. Cuenta con medio decenio de experiencia en medios y A.I. trabajando en medios de comunicación conocidos como VentureBeat, Metaverse Post, Observer y otros. Victor ha mentorizado a fundadores de empresas estudiantiles en programas de aceleración en universidades líderes como la Universidad de Oxford y la Universidad del Sur de California, y tiene un título de maestría en ciencia y análisis de datos.