Intelligenza artificiale
L’istinto viscerale nuovo dell’AI: perché pensare in modo più intelligente è più importante che pensare più a lungo

I progressi nell’intelligenza artificiale (AI) sono stati a lungo guidati dalla convinzione che l’aumento dei dati e della potenza di calcolo possa migliorare le prestazioni. Questo approccio “brute force” ha portato a impressionanti sistemi di intelligenza artificiale, come GPT-3, che hanno ottenuto risultati notevoli negli anni. Tuttavia, questo paradigma sta raggiungendo i suoi limiti. Man mano che i problemi di intelligenza artificiale diventano più complessi, diventa chiaro che semplicemente aggiungere più potenza di calcolo non sarà una soluzione sostenibile o efficace per il progresso a lungo termine. Questa consapevolezza ha spinto i ricercatori a rivedere il loro approccio allo sviluppo dell’intelligenza artificiale. In questo contesto, il modello Cogito v2 di Deep Cogito introduce un nuovo approccio che potrebbe cambiare il futuro dello sviluppo dell’intelligenza artificiale. Piuttosto che dipendere da più potenza di calcolo o da un ragionamento prolungato, Cogito v2 sviluppa “istinti viscerali” interni che guidano il modello per identificare i percorsi giusti prima di iniziare la ricerca. Ciò rappresenta un cambiamento di paradigma nel modo in cui l’intelligenza artificiale sta essere sviluppata, concentrandosi su un pensiero migliore, non più lungo.
Un cambiamento nello sviluppo dell’AI
Per molti anni, la forza trainante dietro i progressi dell’intelligenza artificiale è stata l’idea che “più è meglio”. Questo approccio ha portato a modelli di intelligenza artificiale che generano catene di ragionamento estese per risolvere problemi complessi. I modelli di OpenAI, come GPT-3, sono un esempio di questo approccio, in cui catene di ragionamento più lunghe hanno portato a risultati impressionanti in compiti difficili. Se questo metodo ha prodotto risultati impressionanti, presenta anche notevoli svantaggi. Catene di ragionamento più lunghe richiedono più risorse computazionali, il che si traduce in tempi di inferenza più lenti e costi operativi più alti. Inoltre, la ricerca ha dimostrato che questi processi prolungati spesso portano a rendimenti decrescenti, in cui un ragionamento più lungo porta a una maggiore distorsione e a una minore efficienza. Il problema fondamentale è che fare affidamento a catene di ragionamento lunghe e a una maggiore potenza di calcolo non è più una soluzione efficace per affrontare problemi di intelligenza artificiale complessi. Questi approcci sono limitati dai loro tempi di elaborazione e dalle esigenze di memoria massive.
Perché l'”istinto viscerale” è importante per l’AI
A differenza degli attuali sistemi di intelligenza artificiale che dipendono da un ragionamento prolungato, gli esseri umani spesso si affidano a ciò che viene chiamato “istinto viscerale” (una forma di giudizio intuitivo rapido) per risolvere problemi. Se l’istinto viscerale può sembrare un concetto astratto, è spesso il risultato di anni di esperienza, apprendimento e elaborazione del contesto che consente agli esseri umani di prendere decisioni rapide senza analizzare completamente ogni dettaglio. È questo tipo di intuizione che separa il calcolo grezzo dal ragionamento umano. Gli esseri umani costruiscono questo “istinto viscerale” attraverso il riconoscimento di modelli e l’esperienza accumulata e ciò consente loro di prendere decisioni senza esplorare esaurientemente ogni opzione possibile. Il nuovo “istinto viscerale” dell’AI mira a replicare questo processo.
Quest’idea, anche nota come “priorità di intelligenza”, potrebbe essere la chiave per dotare i sistemi di intelligenza artificiale di un ragionamento umano e renderli più efficienti. I modelli di intelligenza artificiale con una forte priorità di intelligenza possono anticipare quali soluzioni sono probabili avere successo senza dover effettuare un calcolo estensivo. Invece di affidarsi a metodi di ricerca esaustivi, l’istinto viscerale consente ai sistemi di intelligenza artificiale di sfruttare le conoscenze precedenti, concentrandosi sui percorsi più efficaci per raggiungere una soluzione.
Come Cogito v2 ha incorporato l'”istinto viscerale”
Cogito ha incorporato l’idea di “istinto viscerale” (più tecnicamente, priorità di intelligenza) nel suo modello recentemente rilasciato Cogito v2. Hanno integrato questa idea utilizzando un meccanismo chiamato Iterated Distillation and Amplification (IDA). Questo meccanismo consente al modello di apprendere dal proprio processo di ragionamento e raffinare le sue capacità di risoluzione dei problemi nel tempo. Invece di affidarsi a prompt statici o a insegnanti fissi, IDA consente all’AI di distillare percorsi di ragionamento di successo nuovamente nei parametri del modello di base. Questo processo di auto-miglioramento raffina la capacità di ragionamento del modello nel tempo, ottimizzandolo non solo per risposte accurate, ma anche per i metodi di pensiero più efficienti.
-
Iterated Distillation and Amplification (IDA)
Per comprendere come funziona IDA, possiamo esaminare la teoria del processo duale, che divide il pensiero umano in due sistemi: Sistema 1 e Sistema 2. Il Sistema 1 si riferisce a un processo decisionale rapido e intuitivo, mentre il Sistema 2 è più lento e caratterizzato da un ragionamento più deliberato. La teoria suggerisce che gli esseri umani si affidano al Sistema 1 per la maggior parte dei compiti, ma passano al Sistema 2 quando si trovano di fronte a decisioni più complesse.
IDA è un ciclo a due fasi: amplificazione e distillazione. Nella fase di amplificazione, il modello utilizza metodi computazionali intensivi per generare soluzioni o tracce di ragionamento di alta qualità. Ciò è simile al pensiero del Sistema 2, in cui l’AI prende il tempo per valutare attentamente le soluzioni potenziali. Nella fase di distillazione, il modello internalizza quindi le intuizioni dalla fase di amplificazione, trasformando il processo di ragionamento dal Sistema 2 al Sistema 1. Proprio come un guidatore umano diventa più intuitivo dopo aver acquisito esperienza, un modello di intelligenza artificiale con IDA può prendere decisioni più rapide e più efficienti nel tempo.
L’idea chiave dietro IDA è utilizzare un ragionamento computazionalmente intensivo nella fase di amplificazione, quindi distillare il ragionamento migliorato nuovamente nei parametri del modello. Ciò consente al modello di internalizzare strategie di ragionamento efficaci che costruiscono la sua capacità di pensare in modo intuitivo quando si risolve un problema. Ripetendo questo ciclo, il sistema di intelligenza artificiale migliora costantemente la sua capacità di prendere decisioni con meno risorse computazionali.
Vantaggi dell’integrazione dell'”istinto viscerale” nell’AI
Uno dei principali vantaggi dell’istinto viscerale dell’AI è la sua efficienza. Modelli come Cogito v2 dimostrano catene di ragionamento che sono fino al 60% più brevi di quelle dei modelli concorrenti. Ciò significa che possono arrivare a risposte con meno passaggi interni, riducendo il tempo e le risorse necessarie per l’inferenza. Ad esempio, un problema che potrebbe richiedere a DeepSeek R1 oltre 200 token per risolvere può essere completato da Cogito v2 in meno di 100 token.
Inoltre, il costo di addestramento di Cogito v2 è significativamente inferiore a quello dei modelli di intelligenza artificiale tradizionali. L’intero processo di addestramento per Cogito v2, che copre una vasta gamma di parametri, è costato meno di 3,5 milioni di dollari, che è molto inferiore alle spese normalmente associate ai modelli di larga scala come GPT-4.
Cogito v2 ha anche dimostrato capacità emergenti in aree per cui non è stato espressamente addestrato. Ad esempio, nonostante sia stato addestrato principalmente su testo, Cogito v2 può ragionare su immagini, trarre conclusioni sulla composizione e sugli habitat delle immagini. Questa capacità di ragionamento cross-modale è un passo significativo verso l’intelligenza generalizzata, un importante traguardo sul percorso verso l’Intelligenza Artificiale Generale (AGI).
Ripensare lo sviluppo dell’AI
Il successo della priorità di intelligenza suggerisce che le strategie di sviluppo dell’AI devono subire un cambiamento fondamentale. Piuttosto che semplicemente aumentare le dimensioni del modello o aumentare le risorse computazionali, lo sviluppo dell’AI dovrebbe concentrarsi sulla costruzione di sistemi che possano sviluppare e raffinare le proprie strategie cognitive. Questo cambiamento di approccio rispecchia lo sviluppo cognitivo umano, in cui l’intelligenza non è il risultato di un cervello più grande o di più tempo di pensiero, ma piuttosto di migliori modelli mentali e strategie di ragionamento. Questo cambiamento di approccio potrebbe avere implicazioni a lungo termine. Concentrandosi su un ragionamento più intelligente anziché sulla pura potenza di calcolo, l’AI può diventare più versatile, adattabile e in grado di gestire nuove sfide. Questo cambiamento potrebbe accelerare l’applicazione dell’AI in settori come la sanità, la sicurezza informatica e il trasporto autonomo, rendendo i sistemi di intelligenza artificiale più efficienti, più convenienti e più efficaci.
Il punto fondamentale
Il successo di Cogito v2 dimostra che il futuro dell’AI non si trova nell’aumentare le dimensioni dei modelli o nell’aumentare la potenza di calcolo, ma nel raffinare le architetture del ragionamento e nell’ottimizzare per una risoluzione dei problemi più intelligente. Questo cambiamento di approccio promette un futuro più sostenibile e accessibile per l’AI, in cui i sistemi possono continuamente migliorare e adattarsi con meno affidamento su risorse computazionali massive. Concentrandosi su un ragionamento intelligente anziché su un calcolo brute-force, l’AI può diventare più capace di affrontare problemi complessi e reali.












