Líderes de pensamento
Por que a Indústria 5.0 precisa de Inteligência Artificial Geral

Por: Bas Steunebrink, Co-fundador e Diretor de Inteligência Artificial Geral, Eric Nivel, Engenheiro de AGI e Jerry Swan, Cientista de Pesquisa na NNAISENSE.
Consideramos a automação como algo comum em nosso mundo moderno, beneficiando-nos todos os dias com cadeias de suprimentos que abrangem o globo, entregando uma vasta seleção de produtos em nossas prateleiras. Mas por trás das cenas, a produção e o movimento de mercadorias geram muitos desafios de otimização, como embalagem, programação, roteamento e automação de linha de montagem. Esses desafios de otimização são dinâmicos e mudam constantemente em conjunto com o mundo real. Por exemplo, rotas de suprimento esperadas podem ser repentinamente comprometidas devido a circunstâncias imprevistas – por exemplo, o Canal de Suez pode ser bloqueado; rotas aéreas podem mudar devido a erupções vulcânicas; países inteiros podem ser inacessíveis devido a conflitos. Mudanças na legislação, colapso de moedas e recursos escassos também são exemplos de variáveis do lado da oferta que estão constantemente em fluxo.
Para fornecer outro exemplo, às vezes um componente novo deve ser incorporado a uma máquina ou fluxo de trabalho (os usuários podem querer materiais ou cores diferentes, por exemplo). Atualmente, é necessário trabalho humano especializado para fazer alterações no sistema, ou – no caso de aprendizado de máquina – adicionalmente re-treinar e reimplantar a solução. De maneira semelhante, os “gêmeos digitais” da Indústria 4.0 ainda dependem fortemente da noção de que a descrição do problema e a distribuição de entradas podem ser especificadas uma vez por todas no ponto de design inicial do sistema.
A pandemia recente destaca a fragilidade do planejamento de cadeia de suprimentos “just-in-time”. Torna-se mais aparente que, em um mundo cada vez mais complexo e incerto, a indústria não pode mais se dar ao luxo de tal inflexibilidade. Atualmente, a manufatura tem que fazer uma escolha fixa entre “Baixa-Mistura Alta-Volume” (BMHV) e “Alta-Mistura Baixa-Volume” (AMBV). A Indústria 5.0 antecipa a perspectiva de “Alta-Mistura Alta-Volume” (AMAV), na qual o fluxo de trabalho pode ser reconfigurado a baixo custo para atender a requisitos fluidos. Para alcançar isso, é necessário “automatizar a automação”, a fim de eliminar a necessidade de intervenção humana e/ou tempo de inatividade do sistema quando o problema ou o ambiente muda. Isso requer sistemas que “funcionem sob comando”, reagindo a tais mudanças, enquanto ainda têm uma perspectiva razoável de concluir as tarefas atribuídas dentro de restrições de tempo do mundo real. Considere, por exemplo, instruir um robô de linha de montagem, atualmente engajado com a tarefa X, da seguinte forma:
“Pare de montar X imediatamente: aqui está uma especificação de Y, e aqui estão a maioria dos seus antigos e alguns novos efeitos. Agora comece a montar Y, evitando tais e tais tipos de defeitos e desperdício.”
Apesar da fala generalizada recente sobre a chegada iminente da “Inteligência Artificial Geral” (IAG) por meio de modelos de linguagem grandes, como o GPT-3, nenhuma das abordagens propostas é genuinamente capaz de “funcionar sob comando”. Ou seja, elas não podem ser atribuídas a algo completamente fora de seu conjunto de treinamento sem o tempo de inatividade de re-treinamento offline, verificação e reimplantação.
Certamente está claro que qualquer noção real de inteligência está inextricavelmente associada à resposta a mudanças. Um sistema que permanece inalterado – não importa quantos eventos inesperados ele é exposto – não é autônomo nem inteligente. Isso não diminui as forças comprovadas das abordagens de aprendizado profundo (AP), que desfrutaram de grande sucesso como meio de sintetizar programas para problemas que são difíceis de especificar explicitamente.
Então, que tipo de funcionalidade do sistema pode permitir que a IA vá além desse paradigma de treinar, congelar e implantar, em direção a um que seja capaz de aprendizado adaptativo ininterrupto? Considere a necessidade de substituir um componente defeituoso em um fluxo de trabalho de manufatura por um de um fornecedor diferente, que pode ter tolerâncias diferentes. Com a modelagem de caixa preta de ponta a ponta da IA contemporânea, o processo de gêmeos digitais deve ser feito novamente. Para abordar as limitações das abordagens contemporâneas, uma mudança radical é necessária: um modelo que possa raciocinar diretamente sobre as consequências de uma mudança de componente – e, de fato, cenários contrafáticos mais gerais “e se”. Decompor um fluxo de trabalho em componentes com propriedades conhecidas e recombina-los conforme necessário requer o que é conhecido como “composicionalidade”.
A composicionalidade escapou até agora da IA contemporânea, onde é frequentemente confundida com a noção mais fraca de modularidade. A modularidade está preocupada com a capacidade de ‘colar’ componentes juntos, mas isso falha em capturar a essência da composicionalidade, que é a capacidade de raciocinar sobre o comportamento do fluxo de trabalho resultante para determinar e garantir a preservação de alguma propriedade desejada. Essa capacidade é vital por razões de verificação e segurança: por exemplo, a capacidade do sistema de raciocinar que “adotar um motor de um fabricante alternativo aumentará a saída de energia geral da usina enquanto todos os seus outros componentes permanecem dentro das margens de temperatura”.
Embora as abordagens de rede neural contemporâneas sejam excelentes em aprender regras a partir de dados, elas carecem de raciocínio composicional. Como alternativa à esperança de que o raciocínio composicional emergirá de dentro das arquiteturas de rede neural, é possível fazer uso direto das construções da teoria das categorias, o estudo matemático da composicionalidade. Em particular, sua subárea cibernética categórica está preocupada com controladores bidirecionais como elementos representacionais fundamentais. A bidirecionalidade é a capacidade de realizar inferência direta e inversa: previsão a partir de causas para efeitos e vice-versa. A inferência inversa composicional é particularmente importante porque permite a incorporação de feedback do ambiente em qualquer escala de representação estrutural – isso facilita o aprendizado rápido a partir de um pequeno número de exemplos.
Dado algum comportamento de sistema desejado, a tarefa de aprendizado é então construir uma estrutura de controle agregada que atenda a ele. Estruturas inicialmente aprendidas atuam como um esqueleto para o aprendizado subsequente.
À medida que o conhecimento do sistema aumenta, esse esqueleto pode ser decorado com propriedades compostas aprendidas, semelhante a como uma molécula de H2O pode ser determinada a ter propriedades diferentes das de seus átomos constituintes. Além disso, assim como “jogar uma bola” e “girar uma raquete de tênis” podem ser vistos como ações musculoesqueléticas relacionadas para um ser humano, tarefas relacionadas podem compartilhar uma estrutura de controle esquelética que é embellida de maneira específica da tarefa por meio de feedback do ambiente. Essa desconexão da estrutura causal dos detalhes da tarefa pode facilitar o aprendizado de novas tarefas sem o esquecimento catastrófico que aflige as abordagens contemporâneas. Portanto, uma abordagem híbrida numérica-simbólica do tipo descrito acima pode combinar as forças de ambas as abordagens neurais e simbólicas, tendo tanto uma noção explícita de estrutura quanto a capacidade de aprender adaptativamente como as propriedades são compostas. O raciocínio sobre propriedades compostas é fundamentado em uma base contínua pelo trabalho que o sistema é atualmente comandado a realizar.
Em conclusão, está claro que uma nova abordagem é necessária para criar sistemas verdadeiramente autônomos: sistemas capazes de acomodar mudanças significativas e/ou operar em ambientes desconhecidos. Isso requer aprendizado adaptativo ininterrupto e generalização do que já é conhecido. Apesar de seu nome, as abordagens de aprendizado profundo têm apenas uma representação rasa do mundo que não pode ser manipulada em um nível alto pelo processo de aprendizado. Em contraste, propomos que os sistemas de IAG que surgirão na próxima geração incorporarão o aprendizado profundo dentro de uma arquitetura mais ampla, equipada com a capacidade de raciocinar diretamente sobre o que ele sabe.
A capacidade de um sistema raciocinar simbolicamente sobre sua própria representação confere benefícios significativos para a indústria: com uma representação explicitamente composicional, o sistema pode ser auditado – seja por humanos ou internamente pelo próprio sistema – para atender a requisitos vitais de segurança e justiça. Embora haja muita preocupação acadêmica sobre o chamado risco-x da IAG, o foco apropriado é o problema de engenharia concreto de reatribuir um sistema de controle enquanto retém esses requisitos vitais, um processo que denominamos alinhamento interativo. É apenas por meio da adoção desse tipo de sistema de controle, que são confiáveis e eficientes aprendizes contínuos, que seremos capazes de realizar a próxima geração de autonomia imaginada pela Indústria 5.0.






