Líderes de opinión

Por qué la Industria 5.0 necesita Inteligencia Artificial General

Published October 31, 2022

Updated April 28, 2026

Bas Steunebrink

Por: Bas Steunebrink, Co-fundador y Director de Inteligencia Artificial General, Eric Nivel, Ingeniero Principal de AGI y Jerry Swan, Científico de Investigación en NNAISENSE.

Damos por sentado la automatización en nuestro mundo moderno, beneficiándonos cada día de cadenas de suministro que abarcan el globo, entregando una vasta selección de bienes a nuestras estanterías. Pero detrás de las escenas, la producción y el movimiento de bienes generan muchos desafíos de optimización, como el embalaje, la programación, la ruta y la automatización de la línea de montaje. Estos desafíos de optimización son dinámicos y cambian constantemente en conjunto con el mundo real. Por ejemplo, las rutas de suministro esperadas pueden volverse repentinamente intransitables debido a circunstancias imprevistas, como el bloqueo del Canal de Suez; las rutas aéreas pueden cambiar debido a erupciones volcánicas; países enteros pueden ser inaccesibles debido a conflictos. Los cambios en la legislación, el colapso de la moneda y los recursos escasos también son ejemplos de variables del lado de la oferta que están constantemente en flujo.

Para proporcionar otro ejemplo, a veces es necesario incorporar un componente nuevo en una máquina o flujo de trabajo (los usuarios pueden querer materiales o colores diferentes, por ejemplo). Actualmente, se requiere mano de obra humana experta para hacer cambios en el sistema, o, en el caso del aprendizaje automático, para volver a entrenar y desplegar la solución. De manera similar, los “gemelos digitales” de la Industria 4.0 aún dependen en gran medida de la idea de que la descripción del problema y la distribución de las entradas se pueden especificar de una vez por todas en el momento del diseño inicial del sistema.

La reciente pandemia destaca la fragilidad de la planificación de la cadena de suministro “justo a tiempo”. Se hace más evidente que, en un mundo cada vez más complejo y incierto, la industria ya no puede permitirse tal inflexibilidad. En la actualidad, la fabricación debe hacer una elección fija entre “Baja Mezcla Alta Volumen” (BMHV) y “Alta Mezcla Baja Volumen” (AMBV). La Industria 5.0 anticipa la perspectiva de “Alta Mezcla Alta Volumen” (AMAV), en la que el flujo de trabajo se puede reconfigurar a bajo costo para satisfacer requisitos fluidos. Para lograr esto, es necesario “automatizar la automatización”, para eliminar la necesidad de intervención humana y/o tiempo de inactividad del sistema cuando el problema o el entorno cambian. Esto requiere sistemas que “funcionen bajo orden”, reaccionando a dichos cambios, mientras aún tienen una perspectiva razonable de completar sus tareas asignadas dentro de los límites de tiempo del mundo real. Considere, por ejemplo, instruir a un robot de línea de montaje, actualmente ocupado con la tarea X, de la siguiente manera:

“Detener la ensambladura de X de inmediato: aquí está la especificación de Y, y aquí están la mayoría de sus antiguos y algunos nuevos efectores. Ahora comience a ensamblar Y, evitando tales y cuales defectos y desperdicio”.

A pesar de las conversaciones recientes sobre la llegada inminente de la “Inteligencia Artificial General” (IAG) a través de los llamados Grandes Modelos de Lenguaje como GPT-3, ninguno de los enfoques propuestos es genuinamente capaz de “funcionar bajo orden”. Es decir, no pueden ser asignados a algo completamente fuera de su conjunto de entrenamiento sin el tiempo de inactividad de la reentrenación, verificación y redepliegue fuera de línea.

Está claro que cualquier noción real del mundo de la inteligencia está inextricablemente asociada con la respuesta al cambio. Un sistema que permanece sin cambios, no importa cuántos eventos inesperados esté expuesto, no es autónomo ni inteligente. Esto no disminuye las innegables fortalezas de tales enfoques de aprendizaje profundo (AP), que han disfrutado de un gran éxito como medio de sintetizar programas para problemas que son difíciles de especificar explícitamente.

Entonces, ¿qué tipo de funcionalidad del sistema podría permitir que la IA se mueva más allá de este paradigma de entrenar, congelar y desplegar, hacia uno que sea capaz de aprendizaje adaptativo sin interrupciones? Considere la necesidad de reemplazar un componente defectuoso en un flujo de trabajo de fabricación con uno de un proveedor diferente, que podría disfrutar de diferentes tolerancias. Con el modelado de caja negra de extremo a extremo de la IA contemporánea, el proceso de creación de gemelos digitales debe hacerse de nuevo. Para abordar las limitaciones de los enfoques contemporáneos, se requiere un cambio radical: un modelo que pueda razonar directamente sobre las consecuencias de un cambio de componente, e incluso escenarios contrarios más generales “¿qué pasaría si?”. Descomponer un flujo de trabajo en componentes con propiedades conocidas y recombinarlos según sea necesario requiere lo que se conoce como “composicionalidad”.

La composicionalidad ha eludido a la IA contemporánea, donde a menudo se confunde con la noción más débil de modularidad. La modularidad se ocupa de la capacidad de “pegar” componentes, pero esto no logra capturar la esencia de la composicionalidad, que es la capacidad de razonar sobre el comportamiento del flujo de trabajo resultante para determinar y garantizar la preservación de alguna propiedad deseada. Esta capacidad es vital por razones de verificación y seguridad: por ejemplo, la capacidad del sistema para razonar que “adoptar un motor de un fabricante alternativo aumentará la potencia de salida general de la planta mientras que todos sus demás componentes permanecen dentro de los márgenes de temperatura”.

Aunque los enfoques de redes neuronales contemporáneas destacan en el aprendizaje de reglas a partir de datos, carecen de razonamiento composicional. Como alternativa a esperar que el razonamiento composicional surja desde dentro de las arquitecturas de redes neuronales, es posible hacer un uso directo de las construcciones de la teoría de categorías, el estudio matemático de la composicionalidad. En particular, su subcampo de la cibernética categórica se ocupa de los controladores bidireccionales como elementos representacionales fundamentales. La bidireccionalidad es la capacidad de realizar inferencia tanto directa como inversa: predicción desde causas a efectos y viceversa. La inferencia inversa composicional es particularmente importante porque permite la incorporación de retroalimentación del entorno a cualquier escala de representación estructural, lo que facilita el aprendizaje rápido a partir de un pequeño número de ejemplos.

Dado algún comportamiento del sistema deseado, la tarea de aprendizaje es entonces construir una estructura de control agregada que cumpla con él. Las estructuras aprendidas inicialmente actúan como un esqueleto para el aprendizaje posterior.

A medida que aumenta el conocimiento del sistema, este esqueleto se puede decorar con propiedades composicionales aprendidas, similar a cómo una molécula de H2O se puede determinar que tiene propiedades diferentes a las de sus átomos constituyentes. Además, al igual que “lanzar una pelota” y “golpear una raqueta de tenis” se pueden ver como acciones musculoesqueléticas relacionadas para un ser humano, así las tareas relacionadas pueden compartir una estructura de control esquelética que se embellece de manera específica de la tarea a través de la retroalimentación del entorno. Esta desacoplación de la estructura causal de los detalles de la tarea puede facilitar el aprendizaje de nuevas tareas sin el olvido catastrófico que afecta a los enfoques contemporáneos. Por lo tanto, un enfoque híbrido numérico-simbólico de la forma descrita anteriormente puede combinar las fortalezas de ambos enfoques neuronales y simbólicos, al tener una noción explícita de estructura y la capacidad de aprender adaptativamente cómo se componen las propiedades. El razonamiento sobre las propiedades composicionales se basa en una base continua por el trabajo que el sistema está actualmente comandado a realizar.

En conclusión, está claro que se requiere un nuevo enfoque para crear sistemas verdaderamente autónomos: sistemas capaces de acomodar cambios significativos y/o operar en entornos desconocidos. Esto requiere aprendizaje adaptativo sin interrupciones y generalización a partir de lo que ya se conoce. A pesar de su nombre, los enfoques de aprendizaje profundo tienen solo una representación superficial del mundo que no puede ser manipulada a un nivel alto por el proceso de aprendizaje. En contraste, proponemos que los sistemas de IAG que surgen en la próxima generación incorporarán el aprendizaje profundo dentro de una arquitectura más amplia, equipada con la capacidad de razonar directamente sobre lo que sabe.

La capacidad de un sistema para razonar simbólicamente sobre su propia representación confiere beneficios significativos para la industria: con una representación explícitamente composicional, el sistema puede ser auditado, ya sea por humanos o internamente por el sistema mismo, para cumplir con requisitos vitales de seguridad y equidad. Mientras que ha habido mucha preocupación académica sobre el llamado riesgo-x de la IAG, el enfoque adecuado es más bien el problema de ingeniería concreto de volver a asignar un sistema de control mientras se mantienen estos requisitos vitales, un proceso que denominamos alineación interactiva. Solo a través de la adopción de este tipo de sistemas de control, que son fiables y eficientes en el aprendizaje continuo, podremos realizar la próxima generación de autonomía prevista por la Industria 5.0.

Unite.AI

Por qué la Industria 5.0 necesita Inteligencia Artificial General

You may like