Inteligencia artificial

El método COCONUT de Meta: El método de IA que piensa sin lenguaje

mm

Cuando los investigadores descubrieron por primera vez que los grandes modelos de lenguaje (LLM) podían “pensar” paso a paso a través de la secuencia de pensamiento, fue un momento de avance – finalmente, podíamos vislumbrar el proceso de razonamiento de estas cajas negras. Pero, ¿qué pasa si te digo que hacer que los modelos de IA piensen en lenguaje natural podría estar frenándolos?

Eso es lo que los investigadores de Meta y la Universidad de California en San Diego han descubierto con su nuevo método COCONUT (Secuencia de pensamiento continuo).

Imagina que intentas resolver un problema de matemáticas complejo mientras te obligan a narrar cada paso en voz alta. ¿Te resulta molesto? Ahora estás cerca de entender el desafío fundamental que enfrentan los modelos de lenguaje.

Cuando hacemos que los modelos de IA razonen a través del lenguaje natural:

  • La mayoría de los tokens que generan son solo pegamento lingüístico – palabras como “por lo tanto”, “siguiente” y “en consecuencia” que no aportan valor de razonamiento
  • Los puntos críticos de decisión se bloquean debido a la necesidad de comprometerse con palabras específicas
  • El modelo dedica un esfuerzo computacional significativo a mantener la coherencia gramatical en lugar de resolver problemas reales

Los investigadores encontraron algo interesante en sus estudios de neuroimagen: cuando los humanos abordan tareas de razonamiento complejas, los centros del lenguaje de nuestro cerebro a menudo permanecen sorprendentemente callados. Sin embargo, hemos estado construyendo sistemas de IA que hacen lo contrario – obligándolos a traducir cada paso de razonamiento en palabras.

Piensa en cómo resuelves un rompecabezas. Tu mente probablemente explora múltiples posibilidades simultáneamente, mantiene hipótesis difusas y solo cristaliza tus pensamientos en lenguaje cuando compartes la solución. Pero los enfoques tradicionales de secuencia de pensamiento obligan a los modelos de IA a verbalizar cada paso intermedio, creando un “cuello de botella lingüístico”.

Esta idea llevó a una pregunta convincente: ¿Qué pasa si pudiéramos dejar que los modelos de IA razonen en su “lenguaje” nativo – el espacio continuo y de alta dimensión de sus estados ocultos – en lugar de obligarlos a traducir todo en tokens?

Entendiendo la innovación de COCONUT

Imagina la diferencia entre expresar tus pensamientos en voz alta y el proceso mental real que ocurre en tu cerebro. Esa brecha – entre pensamientos verbalizados y actividad neural – es exactamente lo que los investigadores de Meta aprovecharon con COCONUT.

El verdadero avance de COCONUT radica en cómo permite que los modelos de IA piensen de dos maneras distintas, al igual que los humanos. Piensa en cuando resuelves un rompecabezas complejo – no narras cada movimiento posible en tu cabeza, ¿verdad? En su lugar:

  1. Absorbe el problema: Toma la información (como leer las reglas del rompecabezas)
  2. Piensa en silencio: Tu cerebro explora múltiples posibilidades sin expresarlas en palabras
  3. Comparte la solución: Solo entonces explicas tu pensamiento a los demás

COCONUT da a los modelos de IA esta misma flexibilidad natural. En lugar de obligarlos a “hablar” cada pensamiento en voz alta (como los métodos tradicionales), les permite pensar en su espacio neural natural – lo que los investigadores llaman “espacio latente”.

El modelo cambia suavemente entre dos modos:

  • Cuando necesita entender preguntas o dar respuestas, utiliza el lenguaje regular
  • Pero para el proceso de pensamiento real, utiliza patrones neuronales puros, libres de las limitaciones de las palabras

Imagen: Meta

El viaje de capacitación

Uno de los aspectos más fascinantes de COCONUT es su plan de estudios de capacitación. Lo que lo hace especial es cómo refleja la progresión natural del aprendizaje. Piensa en cómo enseñamos habilidades complejas – no lanzas a alguien al agua profundamente de inmediato. Construyes gradualmente, agregando complejidad a medida que dominan cada nivel.

Los investigadores adoptaron este enfoque exacto con COCONUT:

Etapa 1: La fundación

Primero, el modelo aprende como cualquier otro de IA – a través de la razonamiento tradicional de secuencia de pensamiento. Esto le da una base sólida de comprensión.

Etapa 2: La transición

Aquí es donde se vuelve interesante. Gradualmente, los pasos de razonamiento escritos se reemplazan con pensamientos continuos. Imagina retirar lentamente las ruedas de entrenamiento, permitiendo que el modelo desarrolle sus propios patrones de pensamiento internos.

Etapa 3: El equilibrio

Finalmente, el modelo aprende a cambiar sin esfuerzo entre el pensamiento profundo en el espacio latente y la comunicación de sus ideas en lenguaje claro.

Durante la capacitación, el modelo desarrolló habilidades que nadie programó explícitamente – como considerar múltiples caminos de razonamiento simultáneamente. Este comportamiento emergente es particularmente emocionante porque sugiere que podríamos estar acercándonos a formas más naturales de razonamiento de IA. Son estos desarrollos inesperados los que a menudo conducen a los mayores avances.

Recuerda esos estudios de neuroimagen que mencioné anteriormente? Mostraron que los cerebros humanos a menudo procesan tareas de razonamiento complejas sin involucrar en gran medida los centros del lenguaje. COCONUT parece estar desarrollando patrones similares – pensando profundamente en su espacio neural nativo y solo convirtiéndolo en lenguaje cuando es necesario para la comunicación.

Los números cuentan una historia

Algunos hallazgos clave destacan de la investigación:

  • Problemas de matemáticas con palabras (GSM8k): Aquí, COCONUT logró una precisión del 34,1%. Si bien esto es inferior a la secuencia de pensamiento tradicional (42,9%), es significativamente mejor que los enfoques básicos.
  • Deducción lógica (ProntoQA): COCONUT alcanzó una precisión del 99,8%, superando ligeramente la secuencia de pensamiento tradicional (98,8%). Pero aquí está la sorpresa – lo hizo utilizando solo 9 tokens en comparación con los 92,5 de CoT.
  • Planificación compleja (ProsQA): Los resultados más impresionantes provinieron de esta prueba de razonamiento avanzada. COCONUT logró una precisión del 97% mientras que los métodos tradicionales solo alcanzaron el 77,5%. Y nuevamente, lo hizo con una notable eficiencia – 14,2 tokens versus 49,4.

Lo que hace que estos resultados sean prometedores no es solo la cifras brutos – es lo que revelan sobre diferentes tipos de pensamiento. Mientras que COCONUT puede seguir encontrando su lugar en el razonamiento matemático, sobresale en tareas que requieren planificación lógica y deducción complejas.

COCONUT representa una reevaluación fundamental de cómo los sistemas de IA pueden razonar, y nos acerca a formas más naturales, eficientes y poderosas de inteligencia artificial. El viaje desde el razonamiento basado en lenguaje al pensamiento continuo es un paso hacia sistemas de IA más capaces y eficientes.

Alex McFarland es un periodista y escritor de inteligencia artificial que explora los últimos desarrollos en inteligencia artificial. Ha colaborado con numerosas startups y publicaciones de inteligencia artificial en todo el mundo.