Intelligenza artificiale

L’evoluzione della mente di DeepMind: potenziamento dei grandi modelli linguistici per la risoluzione di problemi nel mondo reale

Published February 6, 2025

Updated April 26, 2026

Dr. Tehseen Zia

Negli ultimi anni, l’intelligenza artificiale (AI) è emersa come uno strumento pratico per guidare l’innovazione in tutti i settori. In prima linea di questo progresso ci sono i grandi modelli linguistici (LLM) noti per la loro capacità di comprendere e generare il linguaggio umano. Mentre gli LLM si eseguono bene in compiti come l’intelligenza artificiale conversazionale e la creazione di contenuti, spesso lottano con sfide del mondo reale complesse che richiedono ragionamento strutturato e pianificazione.

Ad esempio, se chiedi agli LLM di pianificare un viaggio d’affari multi-città che coinvolge la coordinazione degli orari dei voli, gli orari delle riunioni, i vincoli di budget e il riposo adeguato, possono fornire suggerimenti per aspetti individuali. Tuttavia, spesso affrontano sfide nell’integrare questi aspetti per bilanciare efficacemente le priorità in competizione. Questa limitazione diventa ancora più evidente poiché gli LLM sono sempre più utilizzati per costruire agenti di intelligenza artificiale in grado di risolvere problemi del mondo reale in modo autonomo.

Google DeepMind ha di recente sviluppato una soluzione per affrontare questo problema. Ispirata alla selezione naturale, questo approccio, noto come Mind Evolution, raffina le strategie di risoluzione dei problemi attraverso l’adattamento iterativo. Guidando gli LLM in tempo reale, consente loro di affrontare compiti del mondo reale complessi in modo efficace e di adattarsi a scenari dinamici. In questo articolo, esploreremo come funziona questo metodo innovativo, le sue potenziali applicazioni e cosa significa per il futuro della risoluzione dei problemi guidata dall’AI.

Perché gli LLM lottano con il ragionamento complesso e la pianificazione

Gli LLM sono addestrati a prevedere la prossima parola in una frase analizzando modelli in grandi set di dati di testo, come libri, articoli e contenuti online. Ciò consente loro di generare risposte che appaiono logiche e contestualmente appropriate. Tuttavia, questo addestramento si basa sul riconoscimento di modelli piuttosto che sulla comprensione del significato. Di conseguenza, gli LLM possono produrre testi che appaiono logici ma lottano con compiti che richiedono un ragionamento più profondo o una pianificazione strutturata.

La limitazione principale risiede nel modo in cui gli LLM elaborano le informazioni. Si concentrano sulle probabilità o sui modelli piuttosto che sulla logica, il che significa che possono gestire compiti isolati – come suggerire opzioni di volo o raccomandazioni di hotel – ma falliscono quando questi compiti devono essere integrati in un piano coerente. Ciò rende anche difficile per loro mantenere il contesto nel tempo. I compiti complessi richiedono spesso di tenere traccia delle decisioni precedenti e adattarsi alla nuova informazione che emerge. Gli LLM, tuttavia, tendono a perdere la concentrazione nelle interazioni prolungate, portando a output frammentati o incoerenti.

Come funziona Mind Evolution

Mind Evolution di DeepMind affronta queste carenze adottando principi dall’evoluzione naturale. Invece di produrre una singola risposta a una query complessa, questo approccio genera molte soluzioni potenziali, le raffina iterativamente e seleziona il miglior risultato attraverso un processo di valutazione strutturata. Ad esempio, considera un team che fa brainstorming di idee per un progetto. Alcune idee sono grandi, altre meno. Il team valuta tutte le idee, tenendo le migliori e scartando il resto. Quindi migliorano le migliori idee, introducono nuove variazioni e ripetono il processo fino a quando non raggiungono la soluzione migliore. Mind Evolution applica questo principio agli LLM.

Ecco una panoramica di come funziona:

Generazione: Il processo inizia con l’LLM che crea molte risposte a un problema dato. Ad esempio, in un compito di pianificazione di viaggio, il modello può creare vari itinerari in base al budget, al tempo e alle preferenze dell’utente.
Valutazione: Ogni soluzione viene valutata in base a una funzione di idoneità, una misura di quanto bene soddisfa i requisiti del compito. Le risposte di bassa qualità vengono scartate, mentre i candidati più promettenti avanzano alla fase successiva.
Raffinamento: Un’innovazione unica di Mind Evolution è il dialogo tra due personaggi all’interno dell’LLM: l’Autore e il Critico. L’Autore propone soluzioni, mentre il Critico identifica i difetti e fornisce feedback. Questo dialogo strutturato rispecchia il modo in cui gli esseri umani raffinano le idee attraverso la critica e la revisione. Ad esempio, se l’Autore suggerisce un piano di viaggio che include una visita a un ristorante che supera il budget, il Critico lo segnala. L’Autore quindi revisiona il piano per affrontare le preoccupazioni del Critico. Ciò consente agli LLM di eseguire un’analisi approfondita che non potevano eseguire in precedenza utilizzando altre tecniche di prompt.
Ottimizzazione iterativa: Le soluzioni raffinate subiscono ulteriori valutazioni e ricombinazioni per produrre soluzioni raffinate.

Ripetendo questo ciclo, Mind Evolution migliora iterativamente la qualità delle soluzioni, consentendo agli LLM di affrontare sfide complesse in modo più efficace.

Mind Evolution in azione

DeepMind ha testato questo approccio su benchmark come TravelPlanner e Natural Plan. Utilizzando questo approccio, Gemini di Google ha raggiunto un tasso di successo del 95,2% su TravelPlanner, un miglioramento notevole rispetto al baseline del 5,6%. Con il più avanzato Gemini Pro, i tassi di successo sono aumentati a quasi il 99,9%. Queste prestazioni trasformative mostrano l’efficacia di Mind Evolution nell’affrontare sfide pratiche.

Interessantemente, l’efficacia del modello aumenta con la complessità del compito. Ad esempio, mentre i metodi a singola passata lottavano con itinerari multi-giornalieri che coinvolgevano più città, Mind Evolution ha costantemente superato, mantenendo alti tassi di successo anche quando il numero di vincoli aumentava.

Sfide e direzioni future

Nonostante il suo successo, Mind Evolution non è immune da limitazioni. L’approccio richiede risorse computazionali significative a causa dei processi di valutazione e raffinamento iterativi. Ad esempio, la risoluzione di un compito TravelPlanner con Mind Evolution ha consumato tre milioni di token e 167 chiamate API, sostanzialmente più dei metodi convenzionali. Tuttavia, l’approccio rimane più efficiente delle strategie brute-force come la ricerca esaustiva.

Inoltre, progettare funzioni di idoneità efficaci per determinati compiti potrebbe essere un compito impegnativo. La ricerca futura potrebbe concentrarsi sull’ottimizzazione dell’efficienza computazionale e sull’ampliamento della tecnica per un’ampia gamma di problemi, come la scrittura creativa o la presa di decisioni complesse.

Un’altra area interessante da esplorare è l’integrazione di valutatori specifici del dominio. Ad esempio, nella diagnosi medica, l’integrazione della conoscenza degli esperti nella funzione di idoneità potrebbe ulteriormente migliorare l’accuratezza e l’affidabilità del modello.

Applicazioni al di là della pianificazione

Sebbene Mind Evolution sia principalmente valutato su compiti di pianificazione, potrebbe essere applicato a vari domini, tra cui scrittura creativa, scoperta scientifica e anche generazione di codice. Ad esempio, i ricercatori hanno introdotto un benchmark chiamato StegPoet, che sfida il modello a codificare messaggi nascosti all’interno di poesie. Sebbene questo compito rimanga difficile, Mind Evolution supera i metodi tradizionali raggiungendo tassi di successo fino al 79,2%.

La capacità di adattare e far evolvere soluzioni nel linguaggio naturale apre nuove possibilità per affrontare problemi che sono difficili da formalizzare, come il miglioramento dei flussi di lavoro o la generazione di progetti di prodotto innovativi. Utilizzando il potere degli algoritmi evolutivi, Mind Evolution fornisce un framework flessibile e scalabile per migliorare le capacità di risoluzione dei problemi degli LLM.

Il punto fondamentale

Mind Evolution di DeepMind introduce un modo pratico ed efficace per superare le limitazioni chiave degli LLM. Utilizzando il raffinamento iterativo ispirato alla selezione naturale, aumenta la capacità di questi modelli di gestire compiti complessi e multi-fase che richiedono ragionamento strutturato e pianificazione. L’approccio ha già mostrato un successo significativo in scenari impegnativi come la pianificazione di viaggi e dimostra promesse in diversi domini, tra cui scrittura creativa, ricerca scientifica e generazione di codice. Sebbene sfide come i costi computazionali elevati e la necessità di funzioni di idoneità ben progettate rimangano, l’approccio fornisce un framework scalabile per migliorare le capacità dell’AI. Mind Evolution prepara il terreno per sistemi di intelligenza artificiale più potenti in grado di ragionare e pianificare per risolvere sfide del mondo reale.

Dr. Tehseen Zia

Il dottor Tehseen Zia è un professore associato con tenure presso l'Università COMSATS di Islamabad, con un dottorato in Intelligenza Artificiale presso l'Università Tecnica di Vienna, Austria. Specializzato in Intelligenza Artificiale, Apprendimento Automatico, Scienza dei Dati e Visione Artificiale, ha apportato contributi significativi con pubblicazioni su riviste scientifiche reputate. Il dottor Tehseen ha anche guidato vari progetti industriali come principale investigatore e ha lavorato come consulente di Intelligenza Artificiale.