Inteligência artificial
Evolução da Mente da DeepMind: Empoderando Grandes Modelos de Linguagem para a Resolução de Problemas do Mundo Real
Nos últimos anos, a inteligência artificial (IA) surgiu como uma ferramenta prática para impulsionar a inovação em várias indústrias. À frente desses progressos estão os grandes modelos de linguagem (LLMs) conhecidos por sua capacidade de entender e gerar linguagem humana. Embora os LLMs sejam eficazes em tarefas como IA conversacional e criação de conteúdo, eles frequentemente lutam com desafios complexos do mundo real que exigem raciocínio estruturado e planejamento.
Por exemplo, se você pedir aos LLMs para planejar uma viagem de negócios multi-cidade que envolva a coordenação de horários de voos, horários de reuniões, restrições orçamentárias e descanso adequado, eles podem fornecer sugestões para aspectos individuais. No entanto, eles frequentemente enfrentam desafios ao integrar esses aspectos para equilibrar efetivamente as prioridades concorrentes. Essa limitação se torna ainda mais aparente à medida que os LLMs são cada vez mais usados para construir agentes de IA capazes de resolver problemas do mundo real de forma autônoma.
A Google DeepMind desenvolveu recentemente uma solução para resolver esse problema. Inspirada na seleção natural, essa abordagem, conhecida como Evolução da Mente, aprimora as estratégias de resolução de problemas por meio de adaptação iterativa. Ao orientar os LLMs em tempo real, ela permite que eles lidem com tarefas complexas do mundo real de forma eficaz e se adaptem a cenários dinâmicos. Neste artigo, exploraremos como esse método inovador funciona, suas aplicações potenciais e o que ele significa para o futuro da resolução de problemas impulsionada por IA.
Por que os LLMs lutam com o raciocínio complexo e o planejamento
Os LLMs são treinados para prever a próxima palavra em uma sentença analisando padrões em grandes conjuntos de dados de texto, como livros, artigos e conteúdo online. Isso permite que eles gerem respostas que parecem lógicas e apropriadas ao contexto. No entanto, esse treinamento é baseado em reconhecer padrões em vez de entender o significado. Como resultado, os LLMs podem produzir texto que parece lógico, mas lutam com tarefas que exigem raciocínio mais profundo ou planejamento estruturado.
A limitação principal reside em como os LLMs processam informações. Eles se concentram em probabilidades ou padrões em vez de lógica, o que significa que eles podem lidar com tarefas isoladas – como sugerir opções de voos ou recomendações de hotéis – mas falham quando essas tarefas precisam ser integradas em um plano coeso. Isso também torna difícil para eles manter o contexto ao longo do tempo. Tarefas complexas frequentemente exigem manter o rastreamento de decisões anteriores e se adaptar à medida que novas informações surgem. Os LLMs, no entanto, tendem a perder o foco em interações prolongadas, levando a saídas fragmentadas ou inconsistentes.
Como funciona a Evolução da Mente
A Evolução da Mente da DeepMind aborda essas limitações adotando princípios da evolução natural. Em vez de produzir uma única resposta a uma consulta complexa, essa abordagem gera múltiplas soluções potenciais, as refina iterativamente e seleciona a melhor solução por meio de um processo de avaliação estruturada. Por exemplo, considere uma equipe de brainstorming de ideias para um projeto. Algumas ideias são ótimas, outras menos. A equipe avalia todas as ideias, mantém as melhores e descarta o resto. Eles então melhoram as melhores ideias, introduzem novas variações e repetem o processo até chegarem à melhor solução. A Evolução da Mente aplica esse princípio aos LLMs.
Aqui está uma quebra de como funciona:
- Geração: O processo começa com o LLM criando múltiplas respostas a um problema dado. Por exemplo, em uma tarefa de planejamento de viagem, o modelo pode criar várias itinerários com base no orçamento, tempo e preferências do usuário.
- Avaliação: Cada solução é avaliada contra uma função de aptidão, uma medida de quão bem ela atende aos requisitos da tarefa. Respostas de baixa qualidade são descartadas, enquanto os candidatos mais promissores avançam para a próxima etapa.
- Refinamento: Uma inovação única da Evolução da Mente é o diálogo entre duas personalidades dentro do LLM: o Autor e o Crítico. O Autor propõe soluções, enquanto o Crítico identifica falhas e oferece feedback. Esse diálogo estruturado espelha como os humanos refinam ideias por meio de crítica e revisão. Por exemplo, se o Autor sugere um plano de viagem que inclui uma visita a um restaurante que excede o orçamento, o Crítico aponta isso. O Autor então revisa o plano para atender às preocupações do Crítico. Esse processo permite que os LLMs realizem uma análise profunda que não podiam realizar anteriormente usando outras técnicas de prompting.
- Otimização Iterativa: As soluções refinadas passam por uma avaliação e recombinação adicionais para produzir soluções refinadas.
Ao repetir esse ciclo, a Evolução da Mente melhora iterativamente a qualidade das soluções, permitindo que os LLMs lidem com desafios complexos de forma mais eficaz.
Evolução da Mente em Ação
A DeepMind testou essa abordagem em benchmarks como TravelPlanner e Natural Plan. Usando essa abordagem, o Gemini da Google alcançou uma taxa de sucesso de 95,2% no TravelPlanner, o que é uma melhoria notável em relação à linha de base de 5,6%. Com o Gemini Pro mais avançado, as taxas de sucesso aumentaram para quase 99,9%. Esse desempenho transformador mostra a eficácia da evolução da mente ao lidar com desafios práticos.
Interessantemente, a eficácia do modelo cresce com a complexidade da tarefa. Por exemplo, enquanto os métodos de uma única passada lutavam com itinerários de vários dias que envolviam várias cidades, a Evolução da Mente consistentemente superou, mantendo altas taxas de sucesso mesmo à medida que o número de restrições aumentava.
Desafios e Direções Futuras
Apesar de seu sucesso, a Evolução da Mente não está isenta de limitações. A abordagem exige recursos computacionais significativos devido aos processos de avaliação e refinamento iterativos. Por exemplo, resolver uma tarefa do TravelPlanner com a Evolução da Mente consumiu três milhões de tokens e 167 chamadas de API – substancialmente mais do que os métodos convencionais. No entanto, a abordagem permanece mais eficiente do que as estratégias de força bruta, como a busca exaustiva.
Além disso, projetar funções de aptidão eficazes para certas tarefas pode ser uma tarefa desafiadora. Pesquisas futuras podem se concentrar em otimizar a eficiência computacional e expandir a aplicabilidade da técnica para uma gama mais ampla de problemas, como escrita criativa ou tomada de decisões complexas.
Outra área interessante para exploração é a integração de avaliadores específicos de domínio. Por exemplo, no diagnóstico médico, incorporar conhecimento de especialistas na função de aptidão pode melhorar ainda mais a precisão e confiabilidade do modelo.
Aplicações Além do Planejamento
Embora a Evolução da Mente seja principalmente avaliada em tarefas de planejamento, ela pode ser aplicada a vários domínios, incluindo escrita criativa, descoberta científica e até geração de código. Por exemplo, pesquisadores introduziram um benchmark chamado StegPoet, que desafia o modelo a codificar mensagens ocultas dentro de poemas. Embora essa tarefa permaneça difícil, a Evolução da Mente supera os métodos tradicionais, alcançando taxas de sucesso de até 79,2%.
A capacidade de adaptar e evoluir soluções em linguagem natural abre novas possibilidades para lidar com problemas difíceis de formalizar, como melhorar fluxos de trabalho ou gerar projetos de produtos inovadores. Ao empregar o poder dos algoritmos evolutivos, a Evolução da Mente fornece um quadro flexível e escalável para melhorar as capacidades de resolução de problemas dos LLMs.
O Resumo
A Evolução da Mente da DeepMind introduz uma maneira prática e eficaz de superar limitações-chave nos LLMs. Ao usar o refinamento iterativo inspirado na seleção natural, ela melhora a capacidade desses modelos de lidar com tarefas complexas e multi-etapas que exigem raciocínio estruturado e planejamento. A abordagem já mostrou um sucesso significativo em cenários desafiadores, como planejamento de viagens, e demonstra promessa em vários domínios, incluindo escrita criativa, pesquisa científica e geração de código. Embora desafios como altos custos computacionais e a necessidade de funções de aptidão bem projetadas permaneçam, a abordagem fornece um quadro escalável para melhorar as capacidades da IA. A Evolução da Mente prepara o palco para sistemas de IA mais poderosos, capazes de raciocinar e planejar para resolver desafios do mundo real.












