Leader di pensiero

Pensare come un essere umano: può l’intelligenza artificiale sviluppare un ragionamento analogico?

mm

Quando siamo di fronte a qualcosa di nuovo, gli esseri umani istintivamente cercano paragoni. Un bambino che impara sugli atomi potrebbe sentire che gli elettroni orbitano intorno al nucleo “come i pianeti orbitano intorno al sole”. Un imprenditore potrebbe presentare la sua startup come “Uber per la toelettatura degli animali”. Uno scienziato potrebbe spiegare a un pubblico non specializzato che il cervello elabora le informazioni “come un computer”.

Questo salto mentale – vedere come una cosa assomiglia a un’altra nella sua struttura più profonda – si chiama ragionamento analogico. E potrebbe essere l’ingrediente che separa l’intelligenza umana dall’IA nella sua forma attuale. Se vogliamo sviluppare un’Intelligenza Artificiale Generale – l’obiettivo finale dell’IA che finora si è rivelato elusivo – dobbiamo capire se è possibile per le macchine imparare a pensare in modo analogico. La posta in gioco non potrebbe essere più alta. Se la risposta è “No”, allora anche i sistemi di intelligenza artificiale più sofisticati rimarranno per sempre nulla più che calcolatori glorificati. Non saranno in grado di risolvere problemi che richiedono più di una riorganizzazione dei dati su cui sono stati addestrati.

L’architettura della comprensione

Il ragionamento analogico funziona a livello di somiglianze strutturali, piuttosto che superficiali. Ad esempio, cosa rende simili i cuori e le pompe idrauliche? Certamente non il loro aspetto fisico. È il fatto che entrambi svolgono la stessa funzione, ovvero far circolare un fluido attraverso un sistema. Ed è proprio questa capacità di mappare relazioni tipiche in un contesto su un altro contesto che rende l’apprendimento, la creatività e la risoluzione dei problemi umani così unici.

Non c’è scarsità di esempi nel mondo reale. Prendiamo August Kekulé, il brillante chimico tedesco, che ricevette un suggerimento sulla struttura del benzene sotto forma di sogno in cui vide un serpente che si morde la coda. Oggi, i programmatori applicano lezioni sull’organizzazione di una cucina quando strutturano il codice, e gli insegnanti spiegano la corrente elettrica paragonandola all’acqua che fluisce attraverso le tubazioni.

Tuttavia, i sistemi di intelligenza artificiale attuali trovano questa abilità cognitiva comune molto difficile. Quando sollecitati, i moderni modelli linguistici di grandi dimensioni (LLM) sono più che felici di spiegare perché “il tempo è denaro” o di completare rompicapo di ragionamento verbale. Ma prove sempre più numerose suggeriscono che spesso stanno impegnandosi in un riconoscimento di pattern sofisticato, piuttosto che in una mappatura strutturale genuina. Quando i ricercatori presentano questi modelli con problemi analogici nuovi che si discostano dai loro dati di addestramento, le prestazioni spesso calano. Ciò è perché i LLM eccellono nel riprodurre analogie che hanno visto prima, ma esitano quando vengono chiamati a forgiare nuove connessioni.

Nessun ragionamento analogico, nessun’IA generale

Evidentemente, il ragionamento analogico è ilsine qua non dell’IA generale. Senza di esso, i sistemi di intelligenza artificiale rimangono fragili, incapaci di adattare la conoscenza che è rilevante in un dominio per risolvere problemi in un altro. Ad esempio, immaginate un’auto a guida autonoma che ha imparato a navigare nelle strade soleggiate della California, ma non può estrapolare quell’apprendimento per gestire condizioni nevose. Il sistema di intelligenza artificiale dell’auto è un costoso riconoscitore di pattern, non un sistema in grado di vera intelligenza. La vera intelligenza richiederebbe la flessibilità cognitiva per riconoscere che guidare su strade ghiacciate è strutturalmente paragonabile ad altre situazioni di superfici scivolose, anche se i dettagli differiscono.

Lo stesso principio si applica in domini al di là dei veicoli autonomi, naturalmente. Il pensiero analogico guida anche i progressi nella scienza, nella diagnosi medica, nel ragionamento giuridico e nelle imprese creative. I sistemi di intelligenza artificiale senza questa capacità assomigliano a uno studioso che ha memorizzato un’intera biblioteca, ma non può sintetizzare quella conoscenza tra le discipline. Impressionante, certo, ma solo in un modo limitato.

Costruire la mente analogica

Quindi, cosa ci vuole per sviluppare sistemi di intelligenza artificiale in grado di ragionamento analogico umano? Sulla base della ricerca emergente e della natura fondamentale del pensiero analogico, diverse condizioni e tecniche critiche sembrano essere necessarie.

Dati di addestramento strutturalmente ricchi e diversificati

Il primo requisito è avere sistemi di intelligenza artificiale addestrati su dati che vanno oltre i pattern di testo a livello superficiale. Internet, con il suo vasto repository di articoli scientifici, documentazione tecnica, opere creative e contenuti esplicativi, è un buon punto di partenza. Ma non tutti i dati di Internet saranno utili. Ciò che è richiesto è diversità strutturale. In altre parole, per guidare i sistemi di intelligenza artificiale a imparare a riconoscere pattern astratti, gli sviluppatori dovrebbero iniziare a esporli a contrasti fin dal primo giorno di addestramento. I loro dati di addestramento potrebbero presentare progetti architettonici accanto a partiture musicali, prove matematiche insieme a poesie, o argomenti giuridici accanto a ricette di cucina. Poiché ogni dominio incarna tipi diversi di strutture relazionali, un sistema di intelligenza artificiale generale potrebbe trarre beneficio da questo tipo di esercizio.

Inoltre, questi dati devono preservare e mettere in evidenza le relazioni strutturali, non solo le correlazioni statistiche. Grafi di conoscenza, diagrammi causali e relazioni tra concetti esplicitamente mappate potrebbero aiutare i sistemi di intelligenza artificiale a imparare a “vedere” la struttura piuttosto che memorizzare associazioni meccanicamente. Pensateci come insegnare all’intelligenza artificiale non solo cosa sono le cose, ma come si relazionano tra loro in modi principati.

Testare oltre il set di addestramento

Per assicurarsi che i sistemi di intelligenza artificiale stiano imparando a ragionare in modo analogico, e non semplicemente migliorando le loro abilità di mimetizzazione, abbiamo bisogno di strumenti che sondino deliberatamente la loro capacità di mappare la struttura su situazioni che non hanno mai incontrato prima. Ciò comporta la costruzione di problemi di test che sono intenzionalmente diversi da qualsiasi cosa possa apparire nei dati di addestramento – ciò che i ricercatori chiamano “compiti controfattuali”.

Ad esempio, invece di chiedere a un sistema di intelligenza artificiale di completare analogie standard come “cucciolo è a cane come cucciolo di gatto è a ____”, potremmo presentargli problemi che utilizzano concetti inventati o chiedergli di mappare relazioni tra domini che non ha mai visto collegati. Può riconoscere che la relazione tra ingredienti e una ricetta parallela la relazione tra prove e un argomento giuridico, anche se non ha mai incontrato quel particolare paragone? Tali test rivelerebbero se il sistema comprende strutture sottostanti o semplicemente ricorda esempi simili.

Misurare ciò che conta

La buona notizia per gli sviluppatori di intelligenza artificiale è che esiste una ricerca di decenni sulla scienza cognitiva che tratta specificamente di come gli esseri umani elaborano le analogie. Possono utilizzare questa ricerca per sviluppare benchmark robusti per il ragionamento analogico. Tuttavia, questi benchmark devono andare oltre il semplice conteggio delle risposte corrette ai test di analogia. Ciò che è realmente necessario sono metriche che catturino se i sistemi di intelligenza artificiale possono identificare quali relazioni sono rilevanti per la mappatura, ignorando le somiglianze superficiali e mantenendo la coerenza attraverso le loro mappe.

Ciò potrebbe coinvolgere sistemi di punteggio che premiano l’identificazione di relazioni di ordine superiore. Ad esempio, un sistema di intelligenza artificiale otterrebbe un punteggio più alto se potesse non solo riconoscere che sia gli atomi che i sistemi solari coinvolgono orbite, ma anche comprendere le relazioni causali che governano quelle orbite. Un’altra competenza da valutare potrebbe essere se l’intelligenza artificiale può generare spontaneamente analogie adeguate per spiegare concetti nuovi, non solo completare problemi di analogia prestrutturati.

Guidare attraverso la sollecitazione

La ricerca recente suggerisce che la capacità dell’intelligenza artificiale di pensare in modo analogico dipende in larga misura da come viene chiesto di farlo. La sollecitazione analogica – guidare esplicitamente i modelli attraverso il processo di mappatura strutturale – può suscitare un ragionamento più sofisticato rispetto al semplice presentare problemi freddi. Ciò potrebbe coinvolgere il chiedere al sistema di identificare relazioni in un dominio di origine, quindi richiedere esplicitamente di mappare quelle relazioni su un dominio di destinazione.

Questa tecnica potrebbe servire a due scopi: migliorare le capacità analogiche dei sistemi di intelligenza artificiale attuali e generare dati di addestramento per modelli futuri. Registrando istanze di successo di ragionamento analogico guidato, esempi possono essere creati per insegnare a sistemi successivi a impegnarsi in questo processo in modo più naturale.

Architettura ibrida

Raggiungere il ragionamento analogico umano potrebbe richiedere di andare oltre gli approcci puramente basati su reti neurali. Sistemi ibridi che combinano il riconoscimento di pattern con il ragionamento simbolico – rappresentando esplicitamente e manipolando relazioni strutturali – potrebbero fornire il pezzo mancante. Mentre le reti neurali eccellono nell’apprendimento di pattern impliciti, i sistemi simbolici possono imporre la coerenza strutturale e la mappatura logica che il ragionamento analogico richiede.

Le architetture ibride sono ancora in fase di infanzia, ma i ricercatori stanno attivamente esplorando il loro potenziale. Alcuni, ad esempio, sostengono la combinazione di reti neurali con il ragionamento simbolico che potrebbe portare a capacità analogiche migliorate. Altri promuovono modelli ibridi costruiti per affrontare la tendenza dei modelli di intelligenza artificiale a confabulare e pensare in modo analogico in modo superficiale.

Dove andare?

A seconda di chi chiedi, il ragionamento analogico è già emerso o i sistemi di intelligenza artificiale stanno semplicemente diventando più sofisticati nella loro mimetizzazione. Qualsiasi posizione sia più vicina alla verità, è chiaro che, se il sogno dell’IA generale è da realizzare, ci vorrà più di semplici modelli più grandi o più dati. Ci vorranno anche alcune innovazioni fondamentali nella struttura, nell’addestramento e nella valutazione dei nostri sistemi di intelligenza artificiale.

Man mano che le capacità trasformative dell’intelligenza artificiale si sviluppano, il ragionamento analogico rappresenta sia un benchmark critico per le prestazioni che un promemoria sobrio del divario tra le capacità attuali dell’IA e la vera cognizione umana. Quando un sistema di intelligenza artificiale può vedere che la democrazia è ai cittadini ciò che un’orchestra è ai musicisti – riconoscendo non le caratteristiche superficiali ma le relazioni strutturali profonde sulla coordinazione, la rappresentanza e l’armonia emergente – avrà superato una soglia cruciale verso la vera intelligenza.

Da oltre 13 anni, Gediminas Rickevicius è una forza di crescita nelle aziende leader del mercato IT, pubblicità e logistica in tutto il mondo. Ha cambiato l'approccio tradizionale allo sviluppo aziendale e alle vendite integrando i big data nella pianificazione strategica. Come Senior VP di Global Partnerships di Oxylabs, Gediminas continua la sua missione di potenziare le aziende con soluzioni di raccolta di dati web pubblici all'avanguardia.