Seguici sui social

Il limite di memoria di ChatGPT è frustrante: il cervello mostra una soluzione migliore

Opinione

Il limite di memoria di ChatGPT è frustrante: il cervello mostra una soluzione migliore

mm

Se sei un utente esperto di ChatGPT, potresti aver incontrato di recente la temuta schermata "Memoria piena". Questo messaggio appare quando si raggiunge il limite massimo di memorie salvate da ChatGPT e può rappresentare un ostacolo significativo durante i progetti a lungo termine. La memoria dovrebbe essere una caratteristica fondamentale per le attività complesse e in corso: l'IA deve trasferire le conoscenze acquisite dalle sessioni precedenti ai risultati futuri. Visualizzare un avviso di memoria piena nel bel mezzo di un progetto urgente (ad esempio, mentre stavo risolvendo i problemi persistenti di errore HTTP 502 del server su uno dei nostri siti web affiliati) può essere estremamente frustrante e dispendioso.

La frustrazione per il limite di memoria di ChatGPT

Il problema principale non è che esista un limite di memoria: anche gli utenti paganti di ChatGPT Plus possono capire che potrebbero esserci limiti pratici alla quantità di memoria che può essere archiviata. Il vero problema è come Una volta raggiunto il limite, è necessario gestire i vecchi ricordi. L'interfaccia attuale per la gestione della memoria è tediosa e richiede molto tempo. Quando ChatGPT ti notifica che la memoria è piena al 100%, hai due opzioni: eliminare meticolosamente i ricordi uno alla volta o cancellarli tutti in una volta. Non esiste uno strumento intermedio o di selezione in blocco per eliminare in modo efficiente le informazioni archiviate.

Eliminare un ricordo alla volta, soprattutto se devi farlo ogni pochi giorni, sembra un'incombenza che non favorisce un utilizzo a lungo termine. Dopotutto, la maggior parte dei ricordi salvati è stata conservata per un motivo: contengono informazioni preziose che hai fornito a ChatGPT sulle tue esigenze o sulla tua attività. Naturalmente, preferiresti eliminare il numero minimo di elementi necessari per liberare spazio, in modo da non ostacolare la comprensione della tua cronologia da parte dell'IA. Eppure, il design della gestione della memoria impone un approccio "tutto o niente" o una lenta cura manuale. Ho osservato personalmente che ogni ricordo eliminato libera solo circa 1% dello spazio di memoria, suggerendo che il sistema consente solo circa 100 ricordi in totale prima che sia pieno (utilizzo al 100%). Questo limite massimo sembra arbitrario, data la portata dei moderni sistemi di intelligenza artificiale, e vanifica la promessa di ChatGPT di diventare un assistente esperto che cresce con te nel tempo.

Cosa dovrebbe succedere

Considerando che ChatGPT e l'infrastruttura su cui si basa hanno accesso a risorse computazionali pressoché illimitate, è sorprendente che la soluzione per la memoria a lungo termine sia così rudimentale. Idealmente, Le memorie AI a lungo termine dovrebbero riprodurre meglio il modo in cui il cervello umano funziona e gestisce le informazioni nel tempo. Il cervello umano ha sviluppato strategie efficienti per la gestione dei ricordi: non ci limitiamo a registrare ogni evento parola per parola e a conservarlo indefinitamente. Il cervello è progettato per l'efficienza: conserviamo informazioni dettagliate a breve termine, per poi elaborarle gradualmente. consolidare comprimere quei dettagli nella memoria a lungo termine.

Nelle neuroscienze, consolidamento della memoria si riferisce al processo mediante il quale i ricordi instabili a breve termine vengono trasformati in ricordi stabili e duraturi. Secondo il modello standard di consolidamento, le nuove esperienze vengono inizialmente codificate dal ippocampo, una regione del cervello cruciale per la formazione di memorie episodiche, e nel tempo la conoscenza è “addestrato” nella corteccia per la memorizzazione permanente. Questo processo non avviene istantaneamente: richiede il passare del tempo e spesso avviene durante i periodi di riposo o di sonno. L'ippocampo agisce essenzialmente come un buffer di apprendimento rapido, mentre la corteccia integra gradualmente le informazioni in una forma più durevole attraverso reti neurali diffuse. In altre parole, la "memoria a breve termine" del cervello (memoria di lavoro ed esperienze recenti) viene sistematicamente trasferita e riorganizzata in una memoria a lungo termine distribuita. Questo trasferimento in più fasi rende la memoria più resistente alle interferenze o all'oblio, un po' come stabilizzare una registrazione in modo che non venga facilmente sovrascritta.

Fondamentalmente, il cervello umano non spreca risorse memorizzando ogni dettaglio alla lettera. Invece, tende a filtrare i dettagli banali e a conservare ciò che è più significativo delle nostre esperienze. Gli psicologi hanno da tempo notato che quando ricordiamo un evento passato o un'informazione appresa, di solito ricordarne il succo piuttosto che un resoconto perfetto, parola per parola. Ad esempio, dopo aver letto un libro o visto un film, ricorderemo i punti principali della trama e i temi, ma non ogni battuta di dialogo. Col tempo, la formulazione esatta e i dettagli minuti dell'esperienza svaniscono, lasciando dietro di sé un riassunto più astratto di ciò che è accaduto. Infatti, la ricerca dimostra che la nostra memoria letterale (dettagli precisi) svanisce più velocemente della memoria generale (significato generale) con il passare del tempo. Questo è un modo efficiente per immagazzinare la conoscenza: scartando i dettagli estranei, il cervello "comprime" le informazioni, conservando le parti essenziali che potrebbero essere utili in futuro.

Questo compressione neurale può essere paragonato al modo in cui i computer comprimono i file, e in effetti gli scienziati hanno osservato processi analoghi nel cervello. Quando ripercorriamo mentalmente un ricordo o immaginiamo uno scenario futuro, la rappresentazione neurale viene effettivamente accelerata e spogliata di alcuni dettagli: è una versione compressa dell'esperienza reale. Neuroscienziati dell'UT Austin hanno scoperto un meccanismo di onde cerebrali che ci permette di ricordare un'intera sequenza di eventi (ad esempio, un pomeriggio trascorso al supermercato) in pochi secondi, utilizzando un ritmo cerebrale più veloce che codifica informazioni meno dettagliate e di alto livello. In sostanza, il nostro cervello può accelerare i ricordi, mantenendone lo schema e i punti critici e omettendo i dettagli più complessi, che sarebbero superflui o troppo complessi da riprodurre per intero. La conseguenza è che i piani immaginati e le esperienze ricordate vengono immagazzinati in una forma condensata, comunque utile e comprensibile, ma molto più efficiente in termini di spazio e tempo rispetto all'esperienza originale.

Un altro aspetto importante della gestione della memoria umana è prioritizzazioneNon tutto ciò che entra nella memoria a breve termine viene immortalato nella memoria a lungo termine. Il nostro cervello decide inconsciamente cosa vale la pena ricordare e cosa no, in base al significato o alla rilevanza emotiva. studio recente alla Rockefeller University hanno dimostrato questo principio usando i topi: i topi sono stati esposti a diversi risultati in un labirinto (alcuni altamente gratificanti, alcuni leggermente gratificanti, alcuni negativi). Inizialmente, i topi hanno imparato tutte le associazioni, ma quando sono stati testati un mese dopo, solo il più saliente la memoria ad alta ricompensa veniva conservata mentre i dettagli meno importanti svanivano.

In altre parole, il cervello ha filtrato il rumore e ha mantenuto la memoria più importante per gli obiettivi dell'animale. I ricercatori hanno persino identificato una regione del cervello, la talamo anteriore, che agisce come una sorta di moderatore tra l'ippocampo e la corteccia durante il consolidamento, segnalando quali ricordi sono abbastanza importanti da essere "conservati" a lungo termine. Il talamo sembra inviare un rinforzo continuo per i ricordi preziosi – essenzialmente dicendo alla corteccia "tieni questo" finché il ricordo non è completamente codificato – mentre consente ai ricordi meno importanti di svanire. Questa scoperta sottolinea che dimenticare non è solo un fallimento della memoria, ma una caratteristica attiva del sistema: eliminando le informazioni banali o ridondanti, il cervello evita che la sua memoria si intasi e garantisce che le conoscenze più utili siano facilmente accessibili.

Ripensare la memoria dell'intelligenza artificiale con i principi umani

Il modo in cui il cervello umano gestisce la memoria offre un chiaro modello di come ChatGPT e sistemi di intelligenza artificiale simili dovrebbero gestire le informazioni a lungo termine. Invece di trattare ogni memoria salvata come un punto dati isolato che deve essere conservato per sempre o eliminato manualmente, un'intelligenza artificiale potrebbe consolidare e riassumere i ricordi più vecchi in background. Ad esempio, se hai dieci conversazioni o informazioni correlate memorizzate sul tuo progetto in corso, l'IA potrebbe unirle automaticamente in un riassunto conciso o in un insieme di conclusioni chiave, comprimendo efficacemente la memoria preservandone l'essenza, proprio come il cervello condensa i dettagli in un'idea generale. Questo libererebbe spazio per nuove informazioni senza "dimenticare" realmente ciò che era importante nelle vecchie interazioni. Infatti, la documentazione di OpenAI suggerimenti che i modelli di ChatGPT possono già effettuare alcuni aggiornamenti automatici e combinare i dettagli salvati, ma l'esperienza utente attuale suggerisce che questa funzionalità non è ancora fluida o sufficiente.

Un altro miglioramento di ispirazione umana sarebbe la conservazione prioritaria dei ricordi. Invece di un rigido limite di 100 elementi, l'IA potrebbe valutare quali ricordi siano stati più frequentemente rilevanti o più critici per le esigenze dell'utente e scartare (o ridurre) solo quelli che sembrano meno importanti. In pratica, questo potrebbe significare che ChatGPT identifica determinati fatti (ad esempio, gli obiettivi principali dell'azienda, le specifiche dei progetti in corso, le preferenze personali) come altamente salienti e da conservare sempre, mentre informazioni isolate e di poco conto, risalenti a mesi prima, potrebbero essere archiviate o eliminate per prime. Questo approccio dinamico è simile al modo in cui il cervello elimina continuamente le connessioni inutilizzate e rinforza quelle utilizzate di frequente per ottimizzare l'efficienza cognitiva.

La conclusione è che un sistema di memoria a lungo termine per l’intelligenza artificiale dovrebbe evolvere, non solo riempirsi e fermarsi. La memoria umana è straordinariamente adattabile: si trasforma e si riorganizza nel tempo e non si aspetta che un utente esterno gestisca nei minimi dettagli ogni slot di memoria. Se la memoria di ChatGPT funzionasse più come la nostra, gli utenti non si troverebbero di fronte a un muro improvviso a 100 voci, né alla dolorosa scelta tra cancellare tutto o cliccare su cento elementi uno alla volta. Al contrario, le memorie di chat più vecchie si trasformerebbero gradualmente in una base di conoscenza distillata a cui l'IA può attingere, e solo le parti veramente obsolete o irrilevanti svanirebbero. La comunità dell'IA, che è il pubblico di riferimento in questo caso, può comprendere che l'implementazione di un tale sistema potrebbe comportare tecniche come il riepilogo del contesto. database vettoriali per il recupero della conoscenzao livelli di memoria gerarchici nelle reti neurali: tutte aree di ricerca attive. In effetti, dotare l'IA di una forma di "memoria episodica" che si comprima nel tempo è una sfida nota, e risolverla rappresenterebbe un passo avanti verso un'IA che apprende continuamente e amplia la propria base di conoscenza in modo sostenibile.

Conclusione

L'attuale limitazione di memoria di ChatGPT sembra una soluzione provvisoria che non sfrutta appieno la potenza dell'IA. Osservando la cognizione umana, comprendiamo che un'efficace memoria a lungo termine non consiste nell'archiviazione di dati grezzi illimitati, ma nella compressione, nel consolidamento e nell'oblio intelligenti delle informazioni. La capacità del cervello umano di conservare ciò che conta risparmiando spazio di archiviazione è esattamente ciò che rende la nostra memoria a lungo termine così vasta e utile. Affinché l'IA diventi un vero partner a lungo termine, dovrebbe adottare una strategia simile: distillare automaticamente le interazioni passate in informazioni durature, anziché scaricare tale onere sull'utente. La frustrazione di raggiungere un limite di "memoria piena" potrebbe essere sostituita da un sistema che cresce gradualmente con l'uso, imparando e ricordando in modo flessibile, simile a quello umano. L'adozione di questi principi non solo risolverebbe il problema dell'esperienza utente, ma sbloccherebbe anche un'esperienza di IA più potente e personalizzata per l'intera comunità di utenti e sviluppatori che si affida a questi strumenti.

Antoine è un leader visionario e socio fondatore di Unite.AI, spinto da una passione incrollabile per la definizione e la promozione del futuro dell'intelligenza artificiale e della robotica. Imprenditore seriale, ritiene che l'intelligenza artificiale sarà dirompente per la società quanto l'elettricità, e spesso viene colto a delirare sul potenziale delle tecnologie dirompenti e dell'AGI.

Come futurista, si dedica a esplorare come queste innovazioni plasmeranno il nostro mondo. Inoltre, è il fondatore di Titoli.io, una piattaforma focalizzata sugli investimenti in tecnologie all'avanguardia che stanno ridefinendo il futuro e rimodellando interi settori.