Intelligenza artificiale
Ronald T. Kneusel, Autore di “How AI Works: From Sorcery to Science” – Serie di Interviste

Abbiamo recentemente ricevuto una copia avanzata del libro “How AI Work: From Sorcery to Science” di Ronald T. Kneusel. Finora ho letto oltre 60 libri sull’AI, e mentre alcuni di loro possono essere ripetitivi, questo libro è riuscito a offrire una prospettiva fresca, ho apprezzato questo libro abbastanza da aggiungerlo alla mia lista personale dei migliori libri di Machine Learning & AI di tutti i tempi.
“How AI Works: From Sorcery to Science” è un libro conciso e chiaro progettato per delineare i fondamenti core dell’apprendimento automatico. Di seguito sono riportate alcune domande che sono state poste all’autore Ronald T. Kneusel.
Questo è il tuo terzo libro sull’AI, i primi due sono: “Practical Deep Learning: A Python-Base Introduction,” e “Math for Deep Learning: What You Need to Know to Understand Neural Networks”. Qual era la tua intenzione iniziale quando hai iniziato a scrivere questo libro?
Destinatari diversi. I miei libri precedenti sono destinati a persone interessate a diventare praticanti di AI. Questo libro è per lettori generali, persone che sentono molto parlare di AI sui notiziari ma non hanno alcuna formazione in materia. Voglio mostrare ai lettori da dove proviene l’AI, che non è magia e che chiunque può capire cosa sta facendo.
Mentre molti libri sull’AI tendono a generalizzare, tu hai preso l’approccio opposto di essere molto specifico nell’insegnamento del significato di vari termini e anche spiegare la relazione tra AI, apprendimento automatico e deep learning. Perché credi che ci sia tanta confusione sociale tra questi termini?
Per capire la storia dell’AI e perché è ovunque ci guardiamo ora, dobbiamo capire la distinzione tra i termini, ma nell’uso comune, è giusto utilizzare “AI” sapendo che si riferisce principalmente ai sistemi AI che stanno trasformando il mondo in modo così rapido. I sistemi AI moderni sono emersi dal deep learning, che a sua volta è emerso dall’apprendimento automatico e dall’approccio connessionista all’AI.
Il secondo capitolo si addentra nella storia dell’AI, dalla mitologia di Talos, un gigante robotico destinato a proteggere una principessa fenicia, al paper di Alan Turing del 1950, “Computing Machinery and Intelligence”, fino all’avvento della rivoluzione del Deep Learning nel 2012. Perché una comprensione della storia dell’AI e dell’apprendimento automatico è strumentale per capire completamente quanto l’AI sia evoluta?
La mia intenzione è quella di mostrare che l’AI non è caduta dal cielo. Ha una storia, un’origine e un’evoluzione. Mentre le capacità emergenti dei grandi modelli linguistici sono una sorpresa, il percorso che li ha portati non lo è. È il risultato di decenni di pensiero, ricerca e sperimentazione.
Hai dedicato un intero capitolo alla comprensione dei sistemi AI legacy come le machine di supporto vettoriale, gli alberi decisionali e le foreste casuali. Perché credi che capire appieno questi modelli AI classici sia così importante?
L’AI come reti neurali è solo (!) un approccio alternativo al tipo di modellazione basata sull’ottimizzazione trovata in molti modelli di apprendimento automatico precedenti. È un approccio diverso per sviluppare un modello di un processo, una funzione che mappa input in output. Conoscere i modelli precedenti aiuta a comprendere da dove provengono i modelli attuali.
Affermi di credere che il modello LLM di OpenAI ChatGPT sia l’alba del vero AI. Cosa, a tuo parere, è stato il più grande cambiamento tra questo e i metodi precedenti di affrontare l’AI?
Ho recentemente visto un video degli anni ’80 di Richard Feynman che tenta di rispondere a una domanda sulle macchine intelligenti. Ha affermato di non sapere quale tipo di programma potesse agire in modo intelligente. In un certo senso, stava parlando dell’AI simbolica, dove il mistero dell’intelligenza è trovare la sequenza logica magica, ecc., che abilita il comportamento intelligente. Mi sono chiesto, come molti, la stessa cosa – come si programma l’intelligenza?
La mia convinzione è che non si possa realmente farlo. Invece, l’intelligenza emerge da sistemi sufficientemente complessi in grado di implementare ciò che chiamiamo intelligenza (cioè noi). I nostri cervelli sono reti enormemente complesse di unità basiche. Lo stesso vale per una rete neurale. Credo che l’architettura del trasformatore, come implementata nei LLM, abbia in qualche modo accidentalmente scoperto un accordo simile di unità basiche che possono lavorare insieme per consentire il comportamento intelligente emergente.
Da un lato, è l’incidente “happy” di Bob Ross, mentre dall’altro, non dovrebbe essere troppo sorprendente una volta che l’accordo e le interazioni consentite tra le unità basiche in grado di abilitare il comportamento intelligente emergente siano accadute. Sembra chiaro ora che i modelli del trasformatore siano uno di tali accordi. Naturalmente, ciò solleva la domanda: quali altri accordi potrebbero esserci?
Il tuo messaggio principale è che l’AI moderna (LLMS) è, al core, semplicemente una rete neurale addestrata con backpropagation e discesa del gradiente. Sei personalmente sorpreso da quanto siano efficaci i LLM?
Sì e no. Sono continuamente sbalordito dalle loro risposte e capacità mentre le utilizzo, ma facendo riferimento alla domanda precedente, l’intelligenza emergente è reale, quindi perché non dovrebbe emergere in un modello sufficientemente grande con un’architettura adatta? Credo che ricercatori come Frank Rosenblatt, se non prima, abbiano probabilmente pensato molto la stessa cosa.
La dichiarazione di missione di OpenAI è “garantire che l’intelligenza artificiale generale—sistemi AI che sono generalmente più intelligenti degli esseri umani—benefici tutta l’umanità”. Credi personalmente che l’AGI sia raggiungibile?
Non so cosa significhi AGI più di quanto non sappia cosa significhi coscienza, quindi è difficile rispondere. Come affermo nel libro, potrebbe benissimo venire un punto, molto presto, in cui è inutile preoccuparsi di tali distinzioni – se cammina come un’anatra e fa il verso dell’anatra, solo chiamalo un’anatra e vai avanti.
Risposte spiritose a parte, è del tutto possibile che un sistema AI potrebbe, un giorno, soddisfare molte teorie della coscienza. Vogliamo sistemi AI completamente coscienti (qualunque cosa significhi realmente)? Forse no. Se è cosciente, allora è come noi e, quindi, una persona con diritti – e non credo che il mondo sia pronto per persone artificiali. Abbiamo già abbastanza problemi a rispettare i diritti dei nostri simili umani, per non parlare di quelli di qualsiasi altro tipo di essere.
C’è stato qualcosa che hai imparato durante la stesura di questo libro che ti ha sorpreso?
Al di là dello stesso livello di sorpresa che tutti gli altri provano per le capacità emergenti dei LLM, no. Ho imparato l’AI come studente negli anni ’80. Ho iniziato a lavorare con l’apprendimento automatico all’inizio degli anni 2000 e sono stato coinvolto nel deep learning mentre emergeva all’inizio degli anni 2010. Ho assistito agli sviluppi dell’ultimo decennio di persona, insieme a migliaia di altri, mentre il campo cresceva drasticamente da una conferenza all’altra.
Grazie per la grande intervista, i lettori potrebbero anche voler dare un’occhiata alla mia recensione di questo libro. Il libro è disponibile presso tutti i principali rivenditori, tra cui Amazon.












