Intelligenza artificiale

L’AI come ricercatore: il primo articolo di ricerca peer-reviewed scritto senza esseri umani

Published August 30, 2025

Updated April 26, 2026

Dr. Tehseen Zia

L’intelligenza artificiale ha superato un altro importante traguardo che mette in discussione la nostra comprensione di ciò che le macchine possono realizzare in modo indipendente. Per la prima volta nella storia scientifica, un sistema di intelligenza artificiale ha scritto un articolo di ricerca completo che ha superato la peer review in una conferenza accademica senza alcun aiuto umano nel processo di scrittura. Questo traguardo potrebbe essere un cambiamento fondamentale nel modo in cui la ricerca scientifica potrebbe essere condotta in futuro.

Risultato storico

Un articolo prodotto da The AI Scientist-v2 ha superato il processo di peer review in un workshop in una delle principali conferenze internazionali sull’AI. La ricerca è stata presentata a un ICLR 2025 workshop, che è uno dei luoghi più prestigiosi nel campo del machine learning. L’articolo è stato generato da una versione migliorata dell’originale AI Scientist, chiamata The AI Scientist-v2.

L’articolo accettato, intitolato “Compositional Regularization: Ostacoli inaspettati nel migliorare la generalizzazione delle reti neurali“, ha ricevuto punteggi impressionanti da parte dei revisori umani. Dei tre articoli presentati per la revisione, uno ha ricevuto voti che lo hanno collocato al di sopra della soglia di accettazione. Questo traguardo è un importante avanzamento poiché l’AI può ora partecipare al processo fondamentale della scoperta scientifica che è stato esclusivamente umano per secoli.

Il team di ricerca di Sakana AI, che lavora con collaboratori dell’Università della Columbia Britannica e dell’Università di Oxford, ha condotto questo esperimento. Hanno ricevuto l’approvazione del consiglio di revisione istituzionale e hanno lavorato direttamente con gli organizzatori della conferenza ICLR per assicurarsi che l’esperimento seguisse i protocolli scientifici appropriati.

Funzionamento di The AI Scientist-v2

The AI Scientist-v2 ha raggiunto questo successo grazie a diversi importanti avanzamenti rispetto al suo predecessore. A differenza del suo predecessore, AI Scientist-v2 elimina la necessità di modelli di codice scritti da esseri umani, può lavorare in diversi domini del machine learning e utilizza una metodologia di ricerca ad albero per esplorare più percorsi di ricerca contemporaneamente.

Il sistema opera attraverso un processo end-to-end che riflette il modo in cui lavorano i ricercatori umani. Inizia formulando ipotesi scientifiche basate sul dominio di ricerca assegnato. L’AI progetta quindi esperimenti per testare queste ipotesi, scrive il codice necessario per condurre gli esperimenti e li esegue automaticamente.

Ciò che rende questo sistema particolarmente avanzato è l’utilizzo della metodologia di ricerca ad albero agente. Questo approccio consente all’AI di esplorare più direzioni di ricerca contemporaneamente, proprio come i ricercatori umani potrebbero considerare diversi approcci per risolvere un problema. Ciò comporta l’esecuzione di esperimenti tramite la ricerca ad albero agente, l’analisi dei risultati e la generazione di una bozza di articolo. Un agente di gestione degli esperimenti dedicato coordina l’intero processo per assicurarsi che la ricerca rimanga focalizzata e produttiva.

Il sistema include anche un componente di revisione AI migliorato che utilizza modelli di linguaggio-visivo per fornire feedback sul contenuto e sulla presentazione visiva dei risultati di ricerca. Ciò crea un processo di raffinamento iterativo in cui l’AI può migliorare il proprio lavoro in base al feedback, simile a come i ricercatori umani raffinano i propri manoscritti in base al feedback dei colleghi.

Cosa ha reso questo articolo di ricerca speciale

L’articolo accettato si è concentrato su un problema difficile nel machine learning chiamato generalizzazione composizionale. Ciò si riferisce alla capacità delle reti neurali di comprendere e applicare concetti appresi in nuove combinazioni che non hanno mai visto prima. The AI Scientist-v2 ha indagato metodi di regolarizzazione nuovi che potrebbero migliorare questa capacità.

Interessantemente, l’articolo ha anche riportato risultati negativi. L’AI ha scoperto che alcuni approcci che aveva ipotizzato avrebbero migliorato le prestazioni delle reti neurali hanno in realtà creato ostacoli inaspettati. Nella scienza, i risultati negativi sono preziosi perché impediscono ad altri ricercatori di perseguire percorsi non produttivi e contribuiscono alla nostra comprensione di ciò che non funziona.

La ricerca ha seguito rigorosi standard scientifici in tutto il processo. The AI Scientist-v2 ha condotto più esecuzioni sperimentali per assicurare la validità statistica, ha creato visualizzazioni chiare dei suoi risultati e ha citato correttamente il lavoro precedente pertinente. Ha formattato l’intero manoscritto secondo gli standard accademici e ha scritto discussioni complete della sua metodologia e dei suoi risultati.

I ricercatori umani che hanno supervisionato il progetto hanno condotto la loro own revisione approfondita di tutti e tre gli articoli generati. Hanno scoperto che mentre l’articolo accettato era di qualità del workshop, conteneva alcuni problemi tecnici che lo avrebbero impedito di essere accettato nella traccia principale della conferenza. Questa valutazione onesta dimostra le limitazioni attuali mentre riconosce il significativo progresso raggiunto.

Capacità tecniche e miglioramenti

The AI Scientist-v2 dimostra diverse capacità tecniche notevoli che lo distinguono da sistemi di ricerca automatizzati precedenti. Il sistema può lavorare in diversi domini del machine learning senza richiedere modelli di codice pre-scritti. Ciò significa che può adattarsi a nuove aree di ricerca e generare approcci sperimentali originali piuttosto che seguire modelli predefiniti.

La metodologia di ricerca ad albero è un’innovazione significativa nell’automazione della ricerca AI. Piuttosto che perseguire una singola direzione di ricerca, il sistema può mantenere più ipotesi contemporaneamente e allocare risorse computazionali in base alla promessa che ogni direzione mostra. Questo approccio riflette il modo in cui i ricercatori umani esperti spesso mantengono più filoni di ricerca mentre si concentrano principalmente sulle aree più promettenti.

Un altro miglioramento cruciale è l’integrazione di modelli di linguaggio-visivo per la revisione e il raffinamento degli elementi visivi degli articoli di ricerca. Le figure scientifiche e le visualizzazioni sono fondamentali per comunicare i risultati di ricerca in modo efficace. L’AI può ora valutare e migliorare le proprie visualizzazioni dei dati in modo iterativo.

Il sistema dimostra anche una comprensione delle convenzioni di scrittura scientifica. Struttura correttamente gli articoli con sezioni appropriate, mantiene una terminologia coerente in tutto il manoscritto e crea un flusso logico tra le diverse parti della narrazione di ricerca. L’AI mostra consapevolezza di come presentare la metodologia, discutere le limitazioni e contestualizzare i risultati all’interno della letteratura esistente.

Limitazioni e sfide attuali

Nonostante questo risultato storico, diverse limitazioni importanti restrincono le capacità attuali della ricerca generata dall’AI. L’azienda ha dichiarato che nessuno dei suoi studi generati dall’AI ha superato il proprio standard interno per la pubblicazione nella traccia principale della conferenza ICLR. Ciò indica che mentre l’AI può produrre ricerca di qualità del workshop, raggiungere i livelli più alti della pubblicazione scientifica rimane una sfida.

I tassi di accettazione forniscono un contesto importante per valutare questo risultato. L’articolo è stato accettato in una traccia del workshop, che di solito ha standard meno rigidi rispetto alla traccia principale della conferenza (60-70% di accettazione rispetto ai 20-30% di accettazione tipici delle tracce principali delle conferenze. Mentre ciò non diminuisce l’importanza del risultato, suggerisce che produrre ricerca veramente innovativa rimane al di là delle capacità attuali dell’AI.

The AI Scientist-v2 ha anche dimostrato alcune debolezze che i ricercatori umani hanno identificato durante il processo di revisione. Il sistema ha occasionalmente commesso errori di citazione, attribuendo i risultati di ricerca a autori o pubblicazioni errati. Ha anche avuto difficoltà con alcuni aspetti della progettazione sperimentale che gli esperti umani avrebbero affrontato in modo diverso.

Forse più importante, la ricerca generata dall’AI si è concentrata su miglioramenti incrementali piuttosto che su scoperte che cambiano il paradigma. Il sistema sembra più capace di condurre indagini approfondite all’interno di quadri di ricerca stabiliti piuttosto che proporre nuovi modi di pensare ai problemi scientifici.

La strada ahead

La peer review di successo della ricerca generata dall’AI è l’inizio di una nuova era nella ricerca scientifica. Mentre i modelli di base continuano a migliorare, ci si può aspettare che The AI Scientist e sistemi simili producano ricerca sempre più sofisticata che si avvicina e potenzialmente supera le capacità umane in molti domini.

Il team di ricerca prevede che le versioni future saranno in grado di produrre articoli degni di essere accettati in conferenze e riviste di alto livello. La logica progressione suggerisce che i sistemi di AI potrebbero eventualmente contribuire a scoperte innovative in campi che vanno dalla medicina alla fisica alla chimica.

Questo sviluppo solleva anche importanti domande su etica della ricerca e standard di pubblicazione. La comunità scientifica deve sviluppare nuove norme per gestire la ricerca generata dall’AI, compreso quando e come divulgare il coinvolgimento dell’AI e come valutare tale lavoro accanto alla ricerca generata dagli esseri umani.

La trasparenza dimostrata dal team di ricerca in questo esperimento fornisce un modello prezioso per la valutazione futura della ricerca AI. Lavorando apertamente con gli organizzatori della conferenza e sottoponendo il proprio lavoro generato dall’AI agli stessi standard della ricerca umana, hanno stabilito importanti precedenti per lo sviluppo responsabile delle capacità di ricerca automatizzate.

Il punto fondamentale

L’accettazione di un articolo scritto dall’AI in un workshop di machine learning di primo livello è un avanzamento significativo nelle capacità dell’AI. Mentre il lavoro non è ancora al livello della traccia principale della conferenza, dimostra una chiara traiettoria verso l’AI che diventa un contributore serio alla scoperta scientifica. La sfida ora non risiede solo nel migliorare la tecnologia, ma anche nel plasmare i quadri etici e accademici che governeranno questa nuova frontiera della ricerca.

Dr. Tehseen Zia

Il dottor Tehseen Zia è un professore associato con tenure presso l'Università COMSATS di Islamabad, con un dottorato in Intelligenza Artificiale presso l'Università Tecnica di Vienna, Austria. Specializzato in Intelligenza Artificiale, Apprendimento Automatico, Scienza dei Dati e Visione Artificiale, ha apportato contributi significativi con pubblicazioni su riviste scientifiche reputate. Il dottor Tehseen ha anche guidato vari progetti industriali come principale investigatore e ha lavorato come consulente di Intelligenza Artificiale.