Intelligenza artificiale
Laboratorio Agent: Un team di ricerca virtuale di AMD e Johns Hopkins

Mentre tutti parlavano di agenti di intelligenza artificiale e automazione, AMD e l’Università Johns Hopkins hanno lavorato per migliorare la collaborazione tra esseri umani e intelligenza artificiale nella ricerca. Il loro nuovo framework open-source, Laboratorio Agent, è una completa rielaborazione di come la ricerca scientifica possa essere accelerata attraverso la collaborazione tra esseri umani e intelligenza artificiale.
Dopo aver esaminato numerosi framework di ricerca sull’intelligenza artificiale, Laboratorio Agent si distingue per il suo approccio pratico. Invece di cercare di sostituire i ricercatori umani (come fanno molte soluzioni esistenti), si concentra sull’ampliare le loro capacità gestendo gli aspetti più lunghi della ricerca e mantenendo gli esseri umani al timone.
L’innovazione fondamentale qui è semplice ma potente: Invece di perseguire una ricerca completamente autonoma (che spesso porta a risultati discutibili), Laboratorio Agent crea un laboratorio virtuale in cui più agenti di intelligenza artificiale specializzati lavorano insieme, ciascuno gestendo diversi aspetti del processo di ricerca e restando ancorato alla guida umana.
Scomporre il laboratorio virtuale
Pensate a Laboratorio Agent come a un team di ricerca ben orchestrato, ma con agenti di intelligenza artificiale che svolgono ruoli specializzati. Proprio come un laboratorio di ricerca reale, ogni agente ha responsabilità e competenze specifiche:
- Un agente PhD affronta le recensioni della letteratura e la pianificazione della ricerca
- Gli agenti postdoc aiutano a raffinare gli approcci sperimentali
- Gli agenti ingegneri di apprendimento automatico gestiscono l’implementazione tecnica
- Gli agenti professori valutano e punteggiano i risultati della ricerca
Ciò che rende questo sistema particolarmente interessante è il suo flusso di lavoro. A differenza degli strumenti di intelligenza artificiale tradizionali che operano in isolamento, Laboratorio Agent crea un ambiente collaborativo in cui questi agenti interagiscono e si basano sul lavoro degli altri.
Il processo segue una progressione naturale della ricerca:
- Recensione della letteratura: L’agente PhD esamina gli articoli accademici utilizzando l’ API di arXiv, raccogliendo e organizzando la ricerca pertinente
- Pianificazione: Gli agenti PhD e postdoc lavorano insieme per creare piani di ricerca dettagliati
- Implementazione: Gli agenti ingegneri di apprendimento automatico scrivono e testano il codice
- Analisi e documentazione: Il team lavora insieme per interpretare i risultati e generare rapporti completi
Ma è qui che diventa veramente pratico: Il framework è flessibile in termini di calcolo, il che significa che i ricercatori possono allocare le risorse in base al loro accesso alla potenza di calcolo e ai vincoli di budget. Ciò lo rende uno strumento progettato per ambienti di ricerca del mondo reale.

Schmidgall et al.
Il fattore umano: dove l’intelligenza artificiale incontra l’esperienza
Mentre Laboratorio Agent possiede capacità di automazione impressionanti, la vera magia si verifica in ciò che chiamano “modalità co-pilota”. In questo setup, i ricercatori possono fornire feedback in ogni fase del processo, creando una vera collaborazione tra l’esperienza umana e l’assistenza dell’intelligenza artificiale.
I dati di feedback della modalità co-pilota rivelano alcune informazioni interessanti. Nella modalità autonoma, i saggi generati da Laboratorio Agent hanno ottenuto un punteggio medio di 3,8/10 nelle valutazioni umane. Ma quando i ricercatori hanno partecipato alla modalità co-pilota, quei punteggi sono saliti a 4,38/10. Ciò che è particolarmente interessante è dove si sono verificati questi miglioramenti – i saggi hanno ottenuto punteggi significativamente più alti in chiarezza (+0,23) e presentazione (+0,33).
Ma ecco la realtà: anche con il coinvolgimento umano, questi saggi hanno comunque ottenuto punteggi di circa 1,45 punti al di sotto della media dei saggi accettati NeurIPS (che si attesta a 5,85). Ciò non è un fallimento, ma è una conoscenza cruciale su come l’esperienza umana e le capacità dell’intelligenza artificiale debbano complementarsi a vicenda.
La valutazione ha rivelato un’altra cosa affascinante: i revisori dell’intelligenza artificiale hanno valutato consistentemente i saggi circa 2,3 punti più in alto dei revisori umani. Questo divario evidenzia perché la supervisione umana rimane cruciale nella valutazione della ricerca.

Schmidgall et al.
Scomporre i numeri
Cosa conta veramente in un ambiente di ricerca? Il costo e le prestazioni. L’approccio di Laboratorio Agent alla comparazione dei modelli rivela alcuni guadagni di efficienza sorprendenti a questo riguardo.
GPT-4o è emerso come il campione di velocità, completando l’intero flusso di lavoro in soli 1.165,4 secondi – ciò è 3,2 volte più veloce di o1-mini e 5,3 volte più veloce di o1-preview. Ma ciò che è ancora più importante è che costa solo 2,33 dollari per saggio. Rispetto ai metodi di ricerca autonomi precedenti che costavano circa 15 dollari, stiamo parlando di una riduzione dei costi dell’84%.
Guardando le prestazioni del modello:
- o1-preview ha ottenuto il punteggio più alto in utilità e chiarezza
- o1-mini ha ottenuto i migliori punteggi di qualità sperimentale
- GPT-4o è rimasto indietro nei metrici, ma ha guidato l’efficienza dei costi
Le implicazioni nel mondo reale sono significative.
I ricercatori possono ora scegliere il loro approccio in base alle loro esigenze specifiche:
- Hai bisogno di prototipazione rapida? GPT-4o offre velocità ed efficienza dei costi
- Dai priorità alla qualità sperimentale? o1-mini potrebbe essere la tua scelta migliore
- Stai cercando l’output più raffinato? o1-preview mostra promesse
Questa flessibilità significa che i team di ricerca possono adattare il framework alle loro risorse e requisiti, anziché essere bloccati in una soluzione universale.
Un nuovo capitolo nella ricerca
Dopo aver esaminato le capacità e i risultati di Laboratorio Agent, sono convinto che stiamo guardando a un significativo spostamento di come la ricerca sarà condotta. Ma non è la narrazione della sostituzione che spesso domina i titoli – è qualcosa di molto più sfumato e potente.
Mentre i saggi di Laboratorio Agent non stanno ancora raggiungendo gli standard delle migliori conferenze, stanno creando un nuovo paradigma per l’accelerazione della ricerca. Pensateci come avere un team di assistenti di ricerca di intelligenza artificiale che non dormono mai, ciascuno specializzato in diversi aspetti del processo scientifico.
Le implicazioni per i ricercatori sono profonde:
- Il tempo speso nelle recensioni della letteratura e nella codifica di base potrebbe essere ridiretto alla creazione di idee
- Le idee di ricerca che potrebbero essere state accantonate a causa dei vincoli di risorse diventano fattibili
- La capacità di prototipare rapidamente e testare ipotesi potrebbe portare a scoperte più rapide
Le limitazioni attuali, come il divario tra i punteggi di revisione dell’intelligenza artificiale e umana, sono opportunità. Ogni iterazione di questi sistemi ci avvicina a una collaborazione più sofisticata tra esseri umani e intelligenza artificiale.
Guardando avanti, vedo tre sviluppi chiave che potrebbero ridisegnare la scoperta scientifica:
- Emergeranno modelli di collaborazione più sofisticati tra esseri umani e intelligenza artificiale mentre i ricercatori imparano a sfruttare questi strumenti in modo efficace
- I risparmi di costo e tempo potrebbero democratizzare la ricerca, consentendo a laboratori e istituzioni più piccoli di perseguire progetti più ambiziosi
- Le capacità di prototipazione rapida potrebbero portare a approcci più sperimentali nella ricerca
La chiave per massimizzare questo potenziale? Comprendere che Laboratorio Agent e framework simili sono strumenti di amplificazione, non di automazione. Il futuro della ricerca non consiste nel scegliere tra l’esperienza umana e le capacità dell’intelligenza artificiale – è trovare modi innovativi per combinarle.












