Inteligência artificial
O Novo Instinto Instintivo da IA: Por Que Pensar de Forma Mais Inteligente Importa Mais do que Pensar por Mais Tempo

Os avanços em inteligência artificial (IA) foram impulsionados por muito tempo pela crença de que o aumento de dados e poder computacional pode melhorar o desempenho. Essa abordagem de “força bruta” levou a impressionantes sistemas de IA, como o GPT-3, que se saíram remarcadamente bem ao longo dos anos. No entanto, esse paradigma está alcançando seus limites. À medida que os problemas de IA se tornam mais complexos, fica claro que simplesmente adicionar mais poder de processamento não será uma solução sustentável ou eficaz para o progresso a longo prazo. Essa realização levou os pesquisadores a repensar sua abordagem para o desenvolvimento de IA. Nesse contexto, o modelo Cogito v2 da Deep Cogito apresenta uma nova abordagem que pode mudar o futuro do desenvolvimento de IA. Em vez de depender de mais poder de processamento ou raciocínio prolongado, o Cogito v2 desenvolve “instintos instintivos” internos que orientam o modelo a identificar os caminhos certos antes mesmo de começar a busca. Isso é uma mudança de paradigma na forma como a IA está sendo desenvolvida, focando em pensar melhor, não por mais tempo.
Uma Mudança no Desenvolvimento de IA
Por muitos anos, a força motriz por trás dos avanços em IA foi a ideia de que “mais é melhor”. Essa abordagem levou a modelos de IA que geram extensas cadeias de raciocínio para resolver problemas complexos. Os modelos da OpenAI, como o GPT-3, são um exemplo dessa abordagem, onde cadeias de raciocínio mais longas levaram a resultados impressionantes em tarefas difíceis. Embora esse método tenha produzido resultados impressionantes, ele vem com significativas desvantagens. Cadeias de raciocínio mais longas requerem mais recursos computacionais, o que resulta em tempos de inferência mais lentos e custos operacionais mais altos. Além disso, a pesquisa mostrou que esses processos prolongados frequentemente levam a retornos decrescentes, onde um raciocínio mais longo leva a maior viés e menos eficiência. O problema fundamental é que confiar em cadeias de raciocínio longas e aumentar o poder computacional não é mais uma solução eficaz para lidar com problemas de IA complexos. Essas abordagens são limitadas por seu tempo de processamento maciço e requisitos de memória.
Por Que ‘Instinto Instintivo’ Importa para a IA
Ao contrário dos atuais sistemas de IA que dependem de raciocínio prolongado, os humanos frequentemente confiam em o que é chamado de “instinto instintivo” (uma forma de julgamento intuitivo rápido) para resolver problemas. Embora o instinto instintivo possa parecer um conceito abstrato, ele é frequentemente o resultado de anos de experiência, aprendizado e processamento de contexto que permite aos humanos tomar decisões rápidas sem analisar completamente todos os detalhes. É esse tipo de intuição que separa a computação bruta do raciocínio humano. Os humanos constroem esse ‘instinto instintivo’ por meio do reconhecimento de padrões e experiência acumulada, e isso permite que tomem decisões sem explorar exaustivamente todas as opções possíveis. O novo “instinto instintivo” da IA visa replicar esse processo.
Essa ideia, também referida como o “prior de inteligência”, pode ser a chave para empoderar os sistemas de IA com raciocínio humano e torná-los mais eficientes. Modelos de IA com forte prior de inteligência podem antecipar quais soluções são prováveis de ter sucesso sem precisar passar por computação extensiva. Em vez de confiar em métodos de busca exaustivos, o instinto instintivo permite que os sistemas de IA aproveitem o conhecimento anterior, focando nos caminhos mais eficazes para uma solução.
Como o Cogito v2 Incorporou ‘Instinto Instintivo’
O Cogito incorporou a ideia de ‘instinto instintivo’ (mais tecnicamente, prior de inteligência) em seu modelo recentemente lançado, Cogito v2. Eles integraram essa ideia usando um mecanismo chamado Iterated Distillation and Amplification (IDA). Esse mecanismo permite que o modelo aprenda com seu próprio processo de raciocínio e refine suas habilidades de resolução de problemas ao longo do tempo. Em vez de confiar em prompts estáticos ou professores fixos, a IDA permite que a IA destile caminhos de raciocínio bem-sucedidos de volta aos parâmetros principais do modelo. Esse processo de auto-aperfeiçoamento refina a capacidade de raciocínio do modelo ao longo do tempo, otimizando não apenas para respostas precisas, mas para os métodos de pensamento mais eficazes.
-
Iterated Distillation and Amplification (IDA)
Para entender como a IDA funciona, podemos olhar para a teoria do processo dual, que divide o pensamento humano em dois sistemas: Sistema 1 e Sistema 2. O Sistema 1 refere-se à tomada de decisão intuitiva rápida, enquanto o Sistema 2 é mais lento, com um raciocínio mais deliberado. A teoria sugere que os humanos confiam no Sistema 1 para a maioria das tarefas, mas mudam para o Sistema 2 quando enfrentam decisões mais complexas.
A IDA é um ciclo de dois passos: amplificação e destilação. Na fase de amplificação, o modelo usa métodos computacionais intensivos para gerar soluções ou traços de raciocínio de alta qualidade. Isso é como o pensamento do Sistema 2, onde a IA leva o tempo para avaliar cuidadosamente as soluções potenciais. Na fase de destilação, o modelo então internaliza as percepções da fase de amplificação, transformando o processo de raciocínio do Sistema 2 para o Sistema 1. Assim como um motorista humano se torna mais intuitivo após ganhar experiência, um modelo de IA com IDA pode tomar decisões mais rápidas e eficientes ao longo do tempo.
A ideia-chave por trás da IDA é usar raciocínio computacionalmente intensivo na fase de amplificação, e então destilar o raciocínio aprimorado de volta aos parâmetros do modelo. Esse processo permite que o modelo internalize estratégias de raciocínio eficazes que constroem sua capacidade de pensar de forma intuitiva ao resolver problemas. Repetindo esse ciclo, o sistema de IA continua a melhorar sua capacidade de tomar decisões com menos recursos computacionais.
Vantagens de Incorporar ‘Instinto Instintivo’ na IA
Uma das principais vantagens do instinto instintivo da IA é sua eficiência. Modelos como o Cogito v2 demonstram cadeias de raciocínio que são até 60% mais curtas do que as de modelos concorrentes. Isso significa que eles podem chegar a respostas com menos etapas internas, reduzindo o tempo e os recursos necessários para inferência. Por exemplo, um problema que pode levar ao DeepSeek R1 mais de 200 tokens para resolver pode ser completado pelo Cogito v2 em menos de 100 tokens.
Além disso, o custo de treinamento do Cogito v2 é significativamente menor do que o dos modelos de IA tradicionais. O processo de treinamento completo para o Cogito v2, abrangendo uma ampla gama de parâmetros, custou menos de $3,5 milhões, o que é muito menos do que os gastos normalmente associados a modelos de grande escala, como o GPT-4.
O Cogito v2 também demonstrou habilidades emergentes em áreas para as quais não foi explicitamente treinado. Por exemplo, apesar de ser treinado principalmente em texto, o Cogito v2 pode raciocinar sobre imagens, tirando insights sobre composição de imagens e habitats. Essa capacidade de raciocínio cross-modal é um passo significativo em direção à inteligência generalizada, um marco importante no caminho para a Inteligência Artificial Geral (IAG).
Repensando o Desenvolvimento de IA
O sucesso do prior de inteligência sugere que as estratégias de desenvolvimento de IA precisam de uma mudança fundamental. Em vez de simplesmente dimensionar o tamanho do modelo ou aumentar os recursos computacionais, o desenvolvimento de IA deve se concentrar em construir sistemas que possam desenvolver e refinar suas próprias estratégias cognitivas. Essa mudança espelha o desenvolvimento cognitivo humano, onde a inteligência não é o resultado de um cérebro maior ou mais tempo de pensamento, mas sim de melhores modelos mentais e estratégias de raciocínio. Essa mudança de abordagem pode ter implicações de longo prazo. Ao enfatizar um raciocínio mais inteligente em vez do poder bruto de computação, a IA pode se tornar mais versátil, adaptável e capaz de lidar com novos desafios. Essa mudança pode acelerar a aplicação da IA em indústrias como saúde, segurança cibernética e transporte autônomo, tornando os sistemas de IA mais eficientes, econômicos e impactantes.
O Resumo
O sucesso do Cogito v2 demonstra que o futuro da IA não está em dimensionar os modelos ou aumentar o poder computacional, mas em refinar as arquiteturas de raciocínio e otimizar para a resolução de problemas mais inteligente. Essa mudança promete um futuro mais sustentável e acessível para a IA, onde os sistemas podem continuar a melhorar e se adaptar com menos dependência de vastos recursos computacionais. Ao se concentrar no raciocínio inteligente em vez da computação de força bruta, a IA pode se tornar mais capaz de lidar com problemas complexos e do mundo real.












