Líderes de pensamento

Por que a Indústria 5.0 Precisa de Inteligência Artificial Geral

Publicado em 31 de outubro de 2022

Atualizado em 23 de maio de 2026

Por

Bas Steunebrink

Por: Bas Steunebrink, Co-fundador e Diretor de Inteligência Artificial Geral, Eric Nivel, Líder de Engenharia de AGI e Jerry Swan, Cientista de Pesquisa da NNAISENSE.

Costumamos levar a automação como certa em nosso mundo moderno, beneficiando-nos todos os dias de cadeias de suprimentos que abrangem o globo, entregando uma vasta seleção de mercadorias em nossas prateleiras. Mas, por trás dos cenários, a produção e o movimento de mercadorias geram muitos desafios de otimização, como embalagem, programação, roteamento e automação de linha de montagem. Esses desafios de otimização são dinâmicos e mudam constantemente em conjunto com o mundo real. Por exemplo, rotas de suprimento esperadas podem ser repentinamente comprometidas devido a circunstâncias imprevistas – por exemplo, o Canal de Suez pode ser bloqueado; rotas aéreas podem mudar devido a erupções vulcânicas; países inteiros podem ser inacessíveis devido a conflitos. Mudanças na legislação, colapsos de moeda e recursos escassos também são exemplos de variáveis do lado da oferta que estão constantemente em fluxo.

Para dar outro exemplo, às vezes um componente novo deve ser incorporado a uma máquina ou fluxo de trabalho (os usuários podem querer materiais ou cores diferentes, por exemplo). Atualmente, é necessário trabalho humano especializado para fazer alterações no sistema, ou – no caso do aprendizado de máquina – adicionalmente re-treinar e reimplantar a solução. De maneira semelhante, os “gêmeos digitais” da Indústria 4.0 ainda dependem fortemente da noção de que a descrição do problema e a distribuição de entradas podem ser especificadas uma vez por todas no ponto de design inicial do sistema.

A pandemia recente destaca a fragilidade do planejamento de cadeia de suprimentos “just-in-time”. Torna-se mais aparente que, em um mundo cada vez mais complexo e incerto, a indústria não pode mais se dar ao luxo de tal inflexibilidade. Atualmente, a manufatura tem que fazer uma escolha fixa entre “Baixa-Mistura Alta-Volume” (BMHV) e “Alta-Mistura Baixa-Volume” (AMBV). A Indústria 5.0 antecipa a perspectiva de “Alta-Mistura Alta-Volume” (AMAV), na qual o fluxo de trabalho pode ser reconfigurado a baixo custo para atender a requisitos fluidos. Para alcançar isso, é necessário “automatizar a automação”, a fim de eliminar a necessidade de intervenção humana e/ou tempo de inatividade do sistema quando o problema ou o ambiente muda. Isso requer sistemas que “funcionem sob comando”, reagindo a tais mudanças, enquanto ainda têm uma perspectiva razoável de concluir suas tarefas atribuídas dentro de restrições de tempo do mundo real. Considere, por exemplo, instruir um robô de linha de montagem, atualmente engajado na tarefa X, da seguinte forma:

“Pare de montar X imediatamente: aqui está uma especificação de Y, e aqui estão a maioria dos seus antigos e alguns novos efeitos. Agora comece a montar Y, evitando tais e tais tipos de defeitos e desperdício.”

Apesar da ampla discussão recente sobre a iminente chegada da “Inteligência Artificial Geral” (IAG) por meio de modelos de linguagem grandes, como o GPT-3, nenhuma das abordagens propostas é realmente capaz de “funcionar sob comando”. Ou seja, elas não podem ser atribuídas a algo completamente fora de seu conjunto de treinamento sem o tempo de inatividade de re-treinamento offline, verificação e reimplantação.

Certamente está claro que qualquer noção real de inteligência está inextricavelmente associada à resposta às mudanças. Um sistema que permanece inalterado – não importa quantos eventos inesperados ele é exposto – não é autônomo nem inteligente. Isso não diminui as forças comprovadas das abordagens de aprendizado profundo (AP), que desfrutaram de grande sucesso como meio de sintetizar programas para problemas difíceis de especificar explicitamente.

Então, que tipo de funcionalidade do sistema poderia permitir que a IA vá além desse paradigma de treinar, congelar e implantar, em direção a um que seja capaz de aprendizado adaptativo ininterrupto? Considere a necessidade de substituir um componente defeituoso em um fluxo de trabalho de manufatura por um de um fornecedor diferente, que pode ter tolerâncias diferentes. Com a modelagem de caixa-preta de ponta a ponta da IA contemporânea, o processo de gêmeos digitais deve ser feito novamente. Para abordar as limitações das abordagens contemporâneas, uma mudança radical é necessária: um modelo que possa raciocinar diretamente sobre as consequências de uma mudança de componente – e, de fato, cenários contrafatuais mais gerais “e se”. Decompor um fluxo de trabalho em componentes com propriedades conhecidas e recombiná-los conforme necessário requer o que é conhecido como “composicionalidade”.

A composicionalidade até agora escapou da IA contemporânea, onde é frequentemente confundida com a noção mais fraca de modularidade. A modularidade está preocupada com a capacidade de ‘colar’ componentes juntos, mas isso falha em capturar a essência da composicionalidade, que é a capacidade de raciocinar sobre o comportamento do fluxo de trabalho resultante para determinar e garantir a preservação de alguma propriedade desejada. Essa capacidade é vital por razões de verificação e segurança: por exemplo, a capacidade do sistema de raciocinar que “adotar um motor de um fabricante alternativo aumentará a saída de energia geral da usina enquanto todos os seus outros componentes permanecem dentro das margens de temperatura”.

Embora as abordagens de rede neural contemporâneas sejam excelentes em aprender regras a partir de dados, elas carecem de raciocínio composicional. Como alternativa à esperança de que o raciocínio composicional emergirá de dentro das arquiteturas de rede neural, é possível fazer uso direto das construções da teoria das categorias, o estudo matemático da composicionalidade. Em particular, sua subárea cibernética categorial está preocupada com controladores bidirecionais como elementos representacionais fundamentais. A bidirecionalidade é a capacidade de realizar inferência direta e inversa: previsão a partir de causas para efeitos e vice-versa. A inferência inversa composicional é particularmente importante porque permite a incorporação de feedback do ambiente em qualquer escala de representação estrutural – isso facilita o aprendizado rápido a partir de poucos exemplos.

Dado algum comportamento desejado do sistema, a tarefa de aprendizado é então construir uma estrutura de controle agregada que atenda a ele. Estruturas inicialmente aprendidas atuam como um esqueleto para o aprendizado subsequente.

À medida que o conhecimento do sistema aumenta, esse esqueleto pode ser decorado com propriedades compostas aprendidas, semelhantes à forma como uma molécula de H2O pode ser determinada ter propriedades diferentes das de seus átomos constituintes. Além disso, assim como “lançar uma bola” e “girar uma raquete de tênis” podem ser vistos como ações musculoesqueléticas relacionadas para um ser humano, tarefas relacionadas podem compartilhar uma estrutura de controle esquelética que é embelezada de maneira específica da tarefa por meio de feedback do ambiente. Essa desvinculação da estrutura causal dos detalhes específicos da tarefa pode facilitar o aprendizado de novas tarefas sem a esquecimento catastrófico que aflige as abordagens contemporâneas. Portanto, uma abordagem híbrida numérica-simbólica da forma descrita acima pode combinar as forças de ambas as abordagens neurais e simbólicas, tendo tanto uma noção explícita de estrutura quanto a capacidade de aprender adaptativamente como as propriedades são compostas. O raciocínio sobre propriedades compostas é fundamentado em uma base contínua pelo trabalho que o sistema está atualmente comandado a realizar.

Em conclusão, está claro que uma nova abordagem é necessária para criar sistemas verdadeiramente autônomos: sistemas capazes de acomodar mudanças significativas e/ou operar em ambientes desconhecidos. Isso requer aprendizado adaptativo ininterrupto e generalização do que já é conhecido. Apesar de seu nome, as abordagens de aprendizado profundo têm apenas uma representação rasa do mundo que não pode ser manipulada em um nível alto pelo processo de aprendizado. Em contraste, propomos que os sistemas de IAG que surgirão na próxima geração incorporarão o aprendizado profundo dentro de uma arquitetura mais ampla, equipada com a capacidade de raciocinar diretamente sobre o que sabe.

A capacidade de um sistema raciocinar simbolicamente sobre sua própria representação confere benefícios significativos para a indústria: com uma representação explicitamente composicional, o sistema pode ser auditado – seja por humanos ou internamente pelo próprio sistema – para atender a requisitos vitais de segurança e justiça. Embora haja sido muita preocupação acadêmica sobre o chamado risco-x da IAG, o foco apropriado é, em vez disso, o problema de engenharia concreto de reatribuir um sistema de controle enquanto retém esses requisitos vitais, um processo que denominamos alinhamento interativo. É apenas por meio da adoção desse tipo de sistemas de controle, que são confiáveis e eficientes aprendizes contínuos, que seremos capazes de realizar a próxima geração de autonomia imaginada pela Indústria 5.0.

Bas Steunebrink

Desde tenra idade, Bas questionou como a inteligência permite que alguém execute competentemente apesar de recursos inevitavelmente insuficientes. Para melhor entender a racionalidade limitada natural, sua pesquisa inicialmente se concentrou em emoções artificiais antes de mudar para abordagens amigáveis ao silício para inteligência geral como pós-doutorando do IDSIA, onde recebeu vários prêmios de melhor artigo e uma subvenção do Instituto Future of Life. No NNAISENSE, Bas lidera o esforço para desenvolver IA de propósito geral.

Unite.AI

Por que a Indústria 5.0 Precisa de Inteligência Artificial Geral

You may like