Inteligência artificial
Laboratório de Agentes: Uma Equipe de Pesquisa Virtual da AMD e da Johns Hopkins

Enquanto todos estavam falando sobre agentes de IA e automação, a AMD e a Universidade Johns Hopkins vêm trabalhando na melhoria da colaboração entre humanos e IA em pesquisas. Seu novo quadro de trabalho de código aberto, Laboratório de Agentes, é uma completa reimaginação de como a pesquisa científica pode ser acelerada por meio da equipe humana-IA.
Depois de olhar para numerosos quadros de pesquisa de IA, o Laboratório de Agentes se destaca por sua abordagem prática. Em vez de tentar substituir os pesquisadores humanos (como muitas soluções existentes), ele se concentra em aumentar suas capacidades, lidando com os aspectos demorados da pesquisa, enquanto mantém os humanos no comando.
A inovação central aqui é simples, mas poderosa: Em vez de perseguir pesquisas totalmente autônomas (o que muitas vezes leva a resultados questionáveis), o Laboratório de Agentes cria um laboratório virtual onde vários agentes de IA especializados trabalham juntos, cada um lidando com diferentes aspectos do processo de pesquisa, enquanto permanecem ancorados na orientação humana.
Desmembrando o Laboratório Virtual
Pense no Laboratório de Agentes como uma equipe de pesquisa bem orquestrada, mas com agentes de IA desempenhando papéis especializados. Assim como um laboratório de pesquisa real, cada agente tem responsabilidades e especialidades específicas:
- Um agente de PhD lida com revisões de literatura e planejamento de pesquisa
- Agentes de pós-doutorado ajudam a refinar abordagens experimentais
- Agentes de engenheiro de ML lidam com a implementação técnica
- Agentes de professor avaliam e pontuam os resultados da pesquisa
O que torna este sistema particularmente interessante é seu fluxo de trabalho. Ao contrário de ferramentas de IA tradicionais que operam em isolamento, o Laboratório de Agentes cria um ambiente colaborativo onde esses agentes interagem e constroem sobre o trabalho uns dos outros.
O processo segue uma progressão natural de pesquisa:
- Revisão de Literatura: O agente de PhD vasculha artigos acadêmicos usando a API do arXiv, reunindo e organizando pesquisas relevantes
- Formulação de Planos: Os agentes de PhD e pós-doutorado trabalham juntos para criar planos de pesquisa detalhados
- Implementação: Os agentes de engenheiro de ML escrevem e testam código
- Análise e Documentação: A equipe trabalha juntos para interpretar resultados e gerar relatórios abrangentes
Mas aqui é onde isso fica realmente prático: O quadro de trabalho é flexível em termos de computação, o que significa que os pesquisadores podem alocar recursos com base em seu acesso ao poder de computação e restrições orçamentárias. Isso o torna uma ferramenta projetada para ambientes de pesquisa do mundo real.

Schmidgall et al.
O Fator Humano: Onde a IA Encontra a Especialização
Embora o Laboratório de Agentes tenha capacidades de automação impressionantes, a verdadeira mágica acontece no que eles chamam de “modo de copiloto”. Neste setup, os pesquisadores podem fornecer feedback em cada etapa do processo, criando uma colaboração genuína entre a especialização humana e a assistência de IA.
Os dados de feedback do modo de copiloto revelam algumas percepções interessantes. No modo autônomo, os artigos gerados pelo Laboratório de Agentes obtiveram uma pontuação média de 3,8/10 nas avaliações humanas. Mas quando os pesquisadores se envolveram no modo de copiloto, essas pontuações saltaram para 4,38/10. O que é particularmente interessante é onde essas melhorias apareceram – os artigos obtiveram pontuações significativamente mais altas em clareza (+0,23) e apresentação (+0,33).
Mas aqui está a realidade: mesmo com a participação humana, esses artigos ainda obtiveram pontuações cerca de 1,45 pontos abaixo da média dos artigos aceitos no NeurIPS (que está em 5,85). Isso não é um fracasso, mas é uma aprendizagem crucial sobre como a especialização humana e as capacidades de IA precisam se complementar.
A avaliação revelou algo mais fascinante: os revisores de IA consistentemente classificaram os artigos cerca de 2,3 pontos mais altos do que os revisores humanos. Essa lacuna destaca por que a supervisão humana permanece crucial na avaliação da pesquisa.

Schmidgall et al.
Desmembrando os Números
O que realmente importa em um ambiente de pesquisa? O custo e o desempenho. A abordagem do Laboratório de Agentes para a comparação de modelos revela algumas ganhos de eficiência surpreendentes nesse aspecto.
GPT-4o emergiu como o campeão de velocidade, completando todo o fluxo de trabalho em apenas 1.165,4 segundos – isso é 3,2x mais rápido do que o1-mini e 5,3x mais rápido do que o1-preview. Mas o que é ainda mais importante é que isso custa apenas $2,33 por artigo. Em comparação com os métodos de pesquisa autônoma anteriores que custavam cerca de $15, estamos olhando para uma redução de custos de 84%.
Olhando para o desempenho do modelo:
- o1-preview obteve a pontuação mais alta em utilidade e clareza
- o1-mini alcançou as melhores pontuações de qualidade experimental
- GPT-4o ficou atrás em métricas, mas liderou em eficiência de custo
As implicações no mundo real são significativas.
Os pesquisadores agora podem escolher sua abordagem com base em suas necessidades específicas:
- Precisa de prototipagem rápida? GPT-4o oferece velocidade e eficiência de custo
- Priorizando a qualidade experimental? o1-mini pode ser a melhor aposta
- Procurando a saída mais polida? o1-preview mostra promessa
Essa flexibilidade significa que as equipes de pesquisa podem adaptar o quadro de trabalho às suas recursos e requisitos, em vez de estarem presas a uma solução de tamanho único.
Um Novo Capítulo na Pesquisa
Depois de olhar para as capacidades e resultados do Laboratório de Agentes, estou convencido de que estamos olhando para um deslocamento significativo em como a pesquisa será conduzida. Mas não é a narrativa de substituição que muitas vezes domina os headlines – é algo muito mais sutil e poderoso.
Embora os artigos do Laboratório de Agentes ainda não atinjam os padrões de conferência de ponta por conta própria, eles estão criando um novo paradigma para a aceleração da pesquisa. Pense nisso como ter uma equipe de assistentes de pesquisa de IA que nunca dormem, cada um especializado em diferentes aspectos do processo científico.
As implicações para os pesquisadores são profundas:
- O tempo gasto em revisões de literatura e codificação básica pode ser redirecionado para a ideia criativa
- Ideias de pesquisa que podem ter sido arquivadas devido a restrições de recursos se tornam viáveis
- A capacidade de prototipar e testar hipóteses rapidamente pode levar a avanços mais rápidos
As limitações atuais, como a lacuna entre as pontuações de revisão de IA e humana, são oportunidades. Cada iteração desses sistemas nos aproxima de uma colaboração de pesquisa mais sofisticada entre humanos e IA.
Olhando para o futuro, vejo três desenvolvimentos principais que podem remodelar a descoberta científica:
- Padrões de colaboração mais sofisticados entre humanos e IA surgirão à medida que os pesquisadores aprendem a usar essas ferramentas de forma eficaz
- As economias de custo e tempo podem democratizar a pesquisa, permitindo que laboratórios e instituições menores persigam projetos mais ambiciosos
- As capacidades de prototipagem rápida podem levar a abordagens experimentais mais amplas na pesquisa
A chave para maximizar esse potencial? Entender que o Laboratório de Agentes e quadros de trabalho semelhantes são ferramentas de amplificação, não de automação. O futuro da pesquisa não é sobre escolher entre a especialização humana e as capacidades de IA – é sobre encontrar maneiras inovadoras de combiná-las.












