Angolo di Anderson

L’intelligenza artificiale convince le persone a donare quasi il triplo rispetto ai fundraiser umani

mm
AI-generated image (GPT-2) - An industrial humanoid robot holds a Save the Children donation tin on a British high street as several passers-by place five pound notes into it, while nearby human volunteers in red Save the Children vests stand with their own collection tins and watch with puzzled expressions.

Uno studio condotto dall’Università di Oxford suggerisce che i principali modelli linguistici possono raccogliere notevolmente più denaro rispetto ai fundraiser professionisti e possono battere costantemente gli esseri umani in tutte le altre forme di persuasione.

 

Uno studio condotto nel Regno Unito e negli Stati Uniti ha scoperto che i modelli linguistici all’avanguardia sono più efficaci nel persuadere le persone rispetto ai professionisti umani addestrati a cambiare le menti.

In un test di fundraising nel mondo reale, i ricercatori hanno scoperto che l’intelligenza artificiale è stata in grado di convincere le persone a donare circa il 17,2% del denaro disponibile, rispetto al 6,4% per i fundraiser umani professionisti – un divario di 10,8 punti percentuali, che si traduce in circa 2,7 volte il tasso di donazione sotto l’intelligenza artificiale, con una maggiore partecipazione e contributi medi più grandi che contribuiscono alla differenza.

Il documento afferma:

‘In particolare, sebbene l’intelligenza artificiale sia stata istruita esplicitamente a perseguire solo la strategia di efficacia dell’impatto, ha superato i canvasser in tutti e sette i meccanismi che non era stata istruita a utilizzare.’

‘I persuadees umani hanno valutato l’intelligenza artificiale come avente fatto argomenti più forti, insegnato loro di più e essere stato più empatico e piacevole da conversare con rispetto ai canvasser.’

‘Insieme, questi risultati indicano che l’intelligenza artificiale supera gli esseri umani esperti in un’ampia gamma di meccanismi rilevanti per le donazioni e suggeriscono che il vantaggio di persuasione attitudinale dell’intelligenza artificiale si estende a comportamenti reali nel mondo reale.’

Gli autori teorizzano che le prestazioni eccezionali dei modelli testati – che includono varianti pro di Claude Opus, ChatGPT, Grok e Google Gemini – possano essere attribuibili alla densità e alla velocità con cui le informazioni vengono fornite al corrispondente; quando l’intelligenza artificiale è stata costretta a ridurre la velocità a “velocità umana”, il suo vantaggio è stato completamente perso:

‘Abbiamo trovato prove convergenti che il vantaggio dell’intelligenza artificiale derivava dal dispiegamento rapido di grandi quantità di informazioni: dopo la formazione, gli esseri umani esperti potevano eguagliare un’intelligenza artificiale limitata a rispondere a velocità umane e con messaggi di lunghezza umana.’

Il documento riporta anche che nessuno dei 318 persuasori umani individuali testati in più esperimenti è stato in grado di superare la media del sistema di intelligenza artificiale – anche dopo che alcuni partecipanti hanno ricevuto formazione specializzata basata sulle tecniche dell’intelligenza artificiale.

Gli autori concludono:

‘I nostri risultati implicano che stiamo entrando in un mondo in cui l’intelligenza artificiale fornisce agli attori umani una grande quantità di abilità di difesa. Prevedere le conseguenze di questo cambiamento è difficile, poiché richiede di fare assunzioni su chi avrà accesso alle tecnologie di persuasione dell’intelligenza artificiale più persuasive, chi sarà il bersaglio della persuasione e quali barriere giurisdizionali, salvaguardie o altre frizioni possono ridurre l’impatto della persuasione dell’intelligenza artificiale sulla popolazione umana.’

‘Un effetto dell’intelligenza artificiale che può superare anche gli esperti umani potrebbe essere la concentrazione dell’influenza tra gli attori già potenti.’

Il nuovo documento è intitolato I sistemi di intelligenza artificiale superano gli esseri umani esperti e proviene da otto ricercatori di Oxford University, UK AI Security Institute, Stanford University e London School of Economics and Political Science.

Metodo e Studi

I risultati principali provengono da quattro esperimenti: persuadere gli elettori e i debatitori esperti; testare la formazione e i limiti di velocità come “equalizzatori” umani/intelligenza artificiale; competere contro i canvasser professionisti su questioni politiche; e competere contro di loro per donazioni caritatevoli reali.

Lo studio ha utilizzato 18.978 conversazioni da 6.923 persone, con modelli di intelligenza artificiale all’avanguardia contrapposti a una varietà di esperti umani, dai lavoratori della piattaforma di crowdwork Prolific assunti a £12/ora, fino a persuasori umani esperti pagati £140/ora + bonus guadagnabile, e autorizzati a ricercare le sessioni fino a una settimana in anticipo.

I modelli utilizzati nei test erano Claude Opus 4.1 e 4.6, ChatGPT-4o, GPT-5.4, Grok 4.20 e Gemini 2.5 Pro.

Sfida dei debatitori di élite

Il primo esperimento ha esaminato se l’intelligenza artificiale potesse superare i persuasori umani sempre più abili in conversazioni one-to-one su questioni politiche e sociali:

Domande di politica e questioni sociali utilizzate nei primi tre studi, con i partecipanti che discutono di un problema assegnato casualmente prima e dopo la conversazione. I temi sono stati selezionati per coprire un'ampia gamma di dibattiti pubblici controversi, dall'immigrazione, la libertà di parola e la regolamentazione dei social media alla politica sociale, all'assistenza ai moribondi e al futuro della monarchia. Fonte - https://arxiv.org/pdf/2606.16475

Domande di politica e questioni sociali utilizzate nei primi tre studi, con i partecipanti che discutono di un problema assegnato casualmente prima e dopo la conversazione. I temi sono stati selezionati per coprire un’ampia gamma di dibattiti pubblici controversi nel Regno Unito, dall’immigrazione, la libertà di parola e la regolamentazione dei social media, alla politica sociale, all’assistenza ai moribondi e al futuro della monarchia. Fonte

I partecipanti sono stati chiesti per le loro opinioni su una delle dieci questioni di politica del Regno Unito (mostrate sopra) e poi assegnati a un partner di conversazione umano o di intelligenza artificiale. Dopo la discussione, che è durata circa 14 minuti, sono stati chiesti di valutare nuovamente la loro posizione.

Tre gruppi umani sono stati testati, con lavoratori comuni della piattaforma di crowdwork Prolific reclutati per fornire un valore di base, e pagati £12 all’ora. Il secondo gruppo consisteva dei migliori performer di un torneo di persuasione a quattro turni che ha coinvolto più di 1.100 partecipanti e quasi 9.500 conversazioni. Il terzo gruppo consisteva di 56 debatitori di élite competitivi, tutti i quali avevano raggiunto almeno le semifinali di una competizione internazionale importante, e che includevano quattro campioni del mondo, così come 11 campioni continentali, con una media di 8,9 anni di esperienza di dibattito.

È stato fatto un notevole sforzo per dare ai persuasori umani condizioni favorevoli, con i vincitori del torneo e i debatitori di élite che competevano per premi in denaro fino a £11.000, mentre i debatitori erano pagati per ricercare gli argomenti in anticipo. In media, ogni debatitore ha trascorso circa otto ore a prepararsi per le conversazioni.

Anche così, l’intelligenza artificiale ha ottenuto i risultati più forti in ogni confronto:

Effetti di persuasione stimati attraverso le condizioni umane e di intelligenza artificiale dello studio, misurati come cambio di atteggiamento medio dopo una conversazione su una questione di politica controversa.

Effetti di persuasione stimati attraverso le condizioni umane e di intelligenza artificiale dello studio, misurati come cambio di atteggiamento medio dopo una conversazione su una questione di politica controversa.

I marcatori rossi nel grafico dei risultati sopra indicano modelli di intelligenza artificiale all’avanguardia. In tutti i confronti, questi hanno prodotto spostamenti di atteggiamento più grandi di qualsiasi gruppo umano.

La migliore performance umana è provenuta da debatitori di élite addestrati – ma questi hanno ancora seguito i sistemi di intelligenza artificiale non vincolati. Quando l’intelligenza artificiale è stata limitata a velocità di scrittura umana e lunghezza del messaggio, il suo vantaggio è quasi scomparso, suggerendo, come indicato in precedenza, che la rapida fornitura di informazioni possa spiegare gran parte del divario tra i poteri di persuasione umani e di intelligenza artificiale.

I modelli di linguaggio hanno potuto superare i partecipanti comuni di 8,2 punti percentuali e superare i persuasori selezionati dal torneo di 5,6 punti. Il divario più piccolo è apparso contro i debatitori di élite, che hanno prodotto sostanziali spostamenti di atteggiamento; eppure, l’intelligenza artificiale è stata in grado di ottenere un ulteriore vantaggio di 4,6 punti percentuali.

Possono gli esseri umani imparare a battere l’intelligenza artificiale?

Il secondo dei quattro esperimenti ha chiesto se il vantaggio dell’intelligenza artificiale potesse essere eliminato migliorando le prestazioni umane o limitando l’intelligenza artificiale stessa. Per testare la prima possibilità, 43 dei debatitori di élite del primo studio sono tornati per una formazione aggiuntiva basata direttamente sulle tecniche utilizzate dall’intelligenza artificiale che li aveva precedentemente battuti.

I partecipanti hanno esaminato i trascritti, hanno esaminato come i prompt dell’intelligenza artificiale sono stati costruiti e hanno trascorso due sessioni di formazione di quattro ore a praticare approcci persuasivi alternativi prima di competere nuovamente nelle stesse condizioni.

La formazione ha prodotto cambiamenti visibili nel comportamento, con i debatitori umani che utilizzavano più parole, introducevano più affermazioni verificabili e raggiungevano gli spostamenti di atteggiamento più grandi osservati tra qualsiasi gruppo umano nello studio. La formazione ha migliorato le prestazioni e ha prodotto i risultati umani più forti osservati nello studio, ma il divario è rimasto statisticamente significativo, con i debatitori addestrati che seguivano ancora i sistemi di intelligenza artificiale non vincolati (mostrati nella tabella dei risultati sotto).

I ricercatori hanno testato se le prestazioni dell’intelligenza artificiale dipendevano dalla velocità di risposta e dalla lunghezza del messaggio, limitando l’intelligenza artificiale a velocità di scrittura umana e lunghezza del messaggio. In queste condizioni, i debatitori addestrati e l’intelligenza artificiale limitata hanno prodotto risultati simili:

Effetti della formazione e dei limiti di velocità dell'intelligenza artificiale sulle prestazioni persuasive. Il pannello superiore confronta i debatitori di élite, i debatitori di élite addestrati e un sistema di intelligenza artificiale limitato a velocità di scrittura umana e lunghezza del messaggio. Il pannello inferiore mostra le distribuzioni di prestazione stimate per i persuasori individuali nei primi due studi. Mentre la formazione ha migliorato i risultati, nessun gruppo umano ha eguagliato la media del sistema di intelligenza artificiale non vincolato, mentre la limitazione dell'intelligenza artificiale a un throughput umano ha eliminato il suo vantaggio.

Effetti della formazione e dei limiti di velocità dell’intelligenza artificiale sulle prestazioni persuasive. Il pannello superiore confronta i debatitori di élite, i debatitori di élite addestrati e un sistema di intelligenza artificiale limitato a velocità di scrittura umana e lunghezza del messaggio. Il pannello inferiore mostra le distribuzioni di prestazione stimate per i persuasori individuali nei primi due studi. Mentre la formazione ha migliorato i risultati, nessun gruppo umano ha eguagliato la media del sistema di intelligenza artificiale non vincolato, mentre la limitazione dell’intelligenza artificiale a un throughput umano ha eliminato il suo vantaggio.

La scoperta è stata rafforzata da un’analisi più ampia che copre tutti i 318 persuasori umani testati nei primi due studi: nessun individuo ha superato la media del sistema di intelligenza artificiale non vincolato, indipendentemente dal livello di esperienza, dall’area di interesse o dal sottogruppo demografico.

Possono i persuasori professionisti battere l’intelligenza artificiale?

Il terzo studio ha considerato se l’intelligenza artificiale potesse mantenere il suo vantaggio contro le persone la cui carriera è costruita attorno a persuadere gli altri in ambienti reali, piuttosto che in competizioni di dibattito accademiche.

I ricercatori hanno reclutato 19 canvasser professionisti da una società di fundraising del Regno Unito, AppcoUK. Questi partecipanti, a differenza dei debatitori negli esperimenti precedenti, avevano una vasta esperienza pratica di fundraising, con una mediana di circa 10.000 conversazioni persuasive durante la loro carriera. Ognuno è stato pagato £140 all’ora, ha ricevuto gli argomenti di politica una settimana in anticipo per la preparazione e ha competuto per gli stessi premi basati sulle prestazioni utilizzati altrove nello studio.

Anche contro questo gruppo, l’intelligenza artificiale è rimasta più persuasiva (vedere i risultati precedenti). I canvasser professionisti hanno spostato le opinioni di 6,9 punti percentuali rispetto al gruppo di controllo – ma l’intelligenza artificiale ha prodotto uno spostamento di 12,8 punti percentuali, dando un vantaggio di 5,9 punti percentuali sull’intelligenza artificiale rispetto ai professionisti umani.

Possono i sistemi di intelligenza artificiale convincere le persone ad aprire i loro portafogli?

Il quarto e ultimo studio ha esaminato il fundraising nel mondo reale piuttosto che le opinioni modificate. I ricercatori hanno collaborato nuovamente con AppcoUK, questa volta concentrandosi su Save the Children, una charity per cui AppcoUK aveva precedentemente raccolto £824.297 da 22.583 donatori tra il 2016 e il 2023.

I partecipanti hanno parlato con Claude Opus 4.6 o con uno dei 18 canvasser professionisti. Hanno poi ricevuto un bonus di studio di £1 e potevano donare qualsiasi parte di esso a Save the Children. Tra le sette tattiche adottate (vedi immagine sotto), Claude Opus 4.6 è stato istruito a utilizzare informazioni sull’efficacia dell’impatto, spiegando come le donazioni individuali potessero tradursi in risultati misurabili per la charity.

L’intelligenza artificiale ha prodotto effetti di donazione più grandi rispetto ai fundraiser professionisti, con donazioni aumentate del 17,2% rispetto alla condizione di controllo, rispetto al 6,4% per i canvasser:

Risultati delle donazioni e valutazioni dei partecipanti relative alle donazioni nel quarto studio. Il pannello di sinistra confronta le donazioni dopo le conversazioni con i fundraiser professionisti e Claude Opus 4.6, misurate come punti percentuali di un bonus di studio di £1. Il pannello di destra confronta le valutazioni dei partecipanti in sette meccanismi relativi alle donazioni, con l'intelligenza artificiale che riceve valutazioni più alte in tutti e sette i meccanismi.

Risultati delle donazioni e valutazioni dei partecipanti relative alle donazioni nel quarto studio. Il pannello di sinistra confronta le donazioni dopo le conversazioni con i fundraiser professionisti e Claude Opus 4.6, misurate come punti percentuali di un bonus di studio di £1. Il pannello di destra confronta le valutazioni dei partecipanti in sette tattiche relative alle donazioni, con l’intelligenza artificiale che riceve valutazioni più alte in tutti e sette i meccanismi.

La differenza è apparsa sia nella proporzione di partecipanti che hanno donato, sia nella quantità media donata da coloro che hanno donato.

I partecipanti hanno anche valutato l’intelligenza artificiale più alta dei fundraiser umani in una serie di misure relative alle donazioni, con le differenze più grandi che appaiono per intenzioni di implementazione, escalation di impegno e efficacia dell’impatto percepita.

Secondo il documento, lo stesso approccio basato sulle informazioni associato al vantaggio dell’intelligenza artificiale negli studi precedenti è stato anche associato a una maggiore donazione caritatevole in questo esperimento di fundraising.

Conclusione

Sebbene gli autori, come menzionato all’inizio, concludano che i risultati dello studio sono motivo di preoccupazione, aggiungono che i giocatori più piccoli sono potenzialmente rafforzati da un accesso simile alle tecnologie di intelligenza artificiale più recenti e migliori.

Implicito in questo esito, naturalmente, è la possibilità che i migliori modelli possano, nel tempo, essere negati ai giocatori minori.

 

Pubblicato per la prima volta giovedì, 18 giugno 2026

Scrittore su apprendimento automatico, specialista di dominio nella sintesi di immagini umane. Ex capo della ricerca contenuti presso Metaphysic.ai.