Andersons hoek

AI overtuigt mensen om bijna 3 keer meer te doneren dan menselijke fondsenwervers

Gepubliceerd op 18 juni 2026

Door

Martin Anderson

AI-generated image (GPT-2) - An industrial humanoid robot holds a Save the Children donation tin on a British high street as several passers-by place five pound notes into it, while nearby human volunteers in red Save the Children vests stand with their own collection tins and watch with puzzled expressions.

Een nieuwe door Oxford geleide studie suggereert dat toonaangevende taalmodellen aanzienlijk meer geld kunnen ophalen dan professionele fondsenwervers en dat ze betrouwbaar kunnen winnen van mensen bij alle andere vormen van overtuiging.

Een nieuwe Brits-Amerikaanse studie heeft ontdekt dat frontier taalmodellen effectiever zijn in het overtuigen van mensen dan getrainde menselijke professionals wiens taak het is om meningen te veranderen.

In een real-world fondsenwervings-test vonden de onderzoekers dat AI in staat was om mensen te overtuigen om ongeveer 17,2% van hun beschikbare geld te doneren, in vergelijking met 6,4% voor professionele menselijke fondsenwervers – een verschil van 10,8 procentpunten, wat neerkomt op ongeveer 2,7 keer de donatiegraad onder AI, met een hogere deelname en grotere gemiddelde bijdragen die allebei bijdroegen aan het verschil.

Het artikel vermeldt:

‘Opvallend is dat de AI, hoewel deze expliciet werd geïnstrueerd om alleen de impact-efficaciteitsstrategie te volgen, beter presteerde dan de fondsenwervers op de zes andere mechanismen die het niet werd opgedragen te gebruiken.’

‘[Menselijke] overtuigden beoordeelden de AI als hebben gemaakt van sterker argumenten, hen meer geleerd en meer empathisch en aangenaam om mee te praten dan [fondsenwervers]. ‘

‘Samen geven deze resultaten aan dat AI beter presteert dan expert-mensen over een breed scala aan donatie-relevante mechanismen en suggereren dat AI’s attitudinale-overtuigingsvoordeel zich uitstrekt tot gevolgrijke, echte, wereldwijde gedragingen.’

De auteurs veronderstellen dat de uitstekende prestatie van de geteste modellen – die pro-varianten van Claude Opus, ChatGPT, Grok en Google Gemini omvatten – mogelijk te wijten is aan de dichtheid en snelheid waarmee informatie wordt gepresenteerd aan de correspondent; wanneer de AI’s werden gedwongen om naar ‘menselijke snelheid’ te gaan, verloren ze hun voordeel volledig:

‘We vonden convergerend bewijs dat AI’s voordeel voortkwam uit het snel inzetten van grotere hoeveelheden informatie: na coaching konden expert-mensen een AI die werd beperkt tot het reageren op menselijke snelheden en met menselijke berichtlengtes, gelijkspelen.’

Het artikel vermeldt ook dat geen van de 318 individuele menselijke overtuigers die werden getest in meerdere experimenten, de gemiddelde prestatie van het AI-systeem konden overtreffen – zelfs niet na speciale coaching op basis van de eigen technieken van de AI.

De auteurs concluderen:

‘Onze resultaten impliceren dat we een wereld binnen gaan waarin AI menselijke actoren voorziet van een overvloed aan vaardige voorstanders. Het voorspellen van de gevolgen van deze verandering is moeilijk, omdat het ons dwingt om aannamen te doen over wie toegang zal hebben tot de meest overtuigende AI-technologieën, wie het doelwit zal zijn van overtuiging en welke juridische barrières, waarborgen of andere wrijvingspunten de impact van AI-overtuiging op de menselijke bevolking kunnen verminderen.’

‘Een effect van AI dat zelfs menselijke experts kan overtuigen, kan een consolidatie van invloed onder reeds machtige actoren zijn.’

Het nieuwe artikel heeft als titel AI-systemen overtuigen expert-mensen en komt van acht onderzoekers van de Universiteit van Oxford, het VK AI Security Institute, Stanford University en de London School of Economics and Political Science.

Methode en studies

De kernresultaten komen uit vier experimenten: het overtuigen van kiezers en expert-debaters; het testen van coaching en snelheidsbeperkingen als menselijke/AI-‘equalizers’; het concurreren tegen professionele fondsenwervers op politieke kwesties; en het concurreren tegen hen voor echte charitatieve donaties.

De studie gebruikte 18.978 gesprekken van 6.923 mensen, met toonaangevende AI-modellen die werden ingezet tegen een variabele standaard van menselijke experts, van ingehuurde crowdworkers op £12/uur tot ervaren menselijke overtuigers die £140/uur verdienden plus een bonus die verdiend kon worden, en die toegestaan werd om de sessies tot een week van tevoren te onderzoeken.

Modellen die in de tests werden gebruikt, waren Claude Opus 4.1 en 4.6, ChatGPT-4o, GPT-5.4, Grok 4.20 en Gemini 2.5 Pro.

Elite-debaters

Het eerste experiment onderzocht of AI kon winnen van steeds meer vaardige menselijke overtuigers in één-op-één-gesprekken over politieke en sociale kwesties:

Politieke en sociale beleidsvragen die werden gebruikt in de eerste drie studies, met deelnemers die één willekeurig toegewezen kwestie bespraken voordat en na het gesprek. De onderwerpen werden geselecteerd om een breed scala aan omstreden openbare debatten in het VK te beslaan, van immigratie, vrije meningsuiting en socialemediaregulering, tot welzijnsbeleid, hulp bij sterven en de toekomst van de monarchie. Bron

Deelnemers werden eerst gevraagd naar hun mening over één van de tien VK-beleidsvragen (hierboven weergegeven), en kregen vervolgens een AI- of menselijke gesprekspartner toegewezen. Na het gesprek, dat meestal ongeveer 14 minuten duurde, werden ze gevraagd om hun mening opnieuw te beoordelen.

Drie menselijke groepen werden getest, met gewone werknemers van het Prolific crowdwork-platform die werden ingehuurd om een basislijn te bieden en £12 per uur verdienden. De tweede groep bestond uit de sterkste presteerders uit een vier-rondes overtuigingstoernooi met meer dan 1.100 deelnemers en bijna 9.500 gesprekken. De derde groep bestond uit 56 elite-competitiedebaters, die allemaal minstens de halve finales van een belangrijk internationaal toernooi hadden bereikt en vier wereldkampioenen, evenals 11 continentale kampioenen, met een gemiddelde van 8,9 jaar debatervaring.

Er werd veel moeite gedaan om de menselijke overtuigers gunstige omstandigheden te geven, met toernooiwinnaars en elite-debaters die concurreerden voor aanzienlijke contantprijzen tot £11.000, terwijl de debaters toegestaan werd om de kwesties te kiezen waarover ze dachten dat ze het beste konden argumenteren en betaald werden om die onderwerpen van tevoren te onderzoeken. Gemiddeld besteedde elke debater ongeveer acht uur aan de voorbereiding van de gesprekken.

Selfs zo, behaalde AI de sterkste resultaten in elke vergelijking:

Geschatte overtuigingseffecten over de studie’s menselijke en AI-omstandigheden, gemeten als gemiddelde houdingsverandering na een gesprek over een omstreden beleidskwestie.

Rode markers in de resultaatgrafiek hierboven geven frontier AI-modellen aan. Over alle vergelijkingen produceerden deze grotere houdingsveranderingen dan elke menselijke groep.

De sterkste menselijke prestatie kwam van gecoachte elite debaters – maar deze vielen nog steeds achter onbeperkte AI-systemen. Wanneer AI werd beperkt tot menselijke schrijfsnelheden en berichtlengtes, verdween het voordeel grotendeels, wat suggereert, zoals eerder vermeld, dat snelle informatieoverdracht veel van de kloof tussen menselijke en AI-overtuigingskracht kan verklaren.

De LLM’s konden de gewone deelnemers overtreffen met 8,2 procentpunten en de toernooi-geselecteerde overtuigers met 5,6 punten. Het kleinste verschil verscheen tegen de elite debaters, die zelf aanzienlijke houdingsveranderingen produceerden; toch kon AI nog steeds een verdere 4,6 procentpunt-voordeel behalen.

Kunnen mensen AI verslaan?

Het tweede van de vier experimenten vroeg of AI’s voorsprong kon worden geëlimineerd door de menselijke prestatie te verbeteren of door AI zelf te beperken. Om de eerste mogelijkheid te testen, keerden 43 van de elite-debaters uit de eerste studie terug voor aanvullende training op basis van de technieken die door de AI werden gebruikt die hen eerder had verslagen.

De deelnemers bekeken transcripties, onderzochten hoe AI-prompts waren geconstrueerd en brachten twee vier-uur durende coachingsessies door waarin ze alternatieve overtuigingsbenaderingen oefenden voordat ze opnieuw concurreerden onder dezelfde omstandigheden.

De coaching produceerde opmerkelijke veranderingen in gedrag, met de menselijke debaters die meer woorden gebruikten, meer feitcontroleerbare claims introduceerden en de grootste houdingsveranderingen bereikten die onder alle menselijke groepen in de studie werden waargenomen. Coaching verbeterde de prestatie en produceerde de sterkste menselijke resultaten die in de studie werden waargenomen, maar het verschil bleef statistisch significant, met gecoachte debaters die nog steeds achter onbeperkte AI-systemen vielen (zie resultaatentabel hieronder).

De onderzoekers testten of AI’s prestatie afhankelijk was van responssnelheid en berichtlengte, door AI te beperken tot menselijke schrijfsnelheden en berichtlengtes. Onder deze omstandigheden produceerden gecoachte debaters en beperkte AI soortgelijke resultaten:

Effecten van coaching en AI-snelheidsbeperkingen op overtuigingsprestatie. Het bovenste paneel vergelijkt elite-debaters, gecoachte elite-debaters en een AI-systeem dat werd beperkt tot menselijke schrijfsnelheden en berichtlengtes. Het onderste paneel toont geschatte prestatieverdelingen voor individuele overtuigers over de eerste twee studies. Terwijl coaching de resultaten verbeterde, overtrof geen enkele menselijke groep het gemiddelde onbeperkte AI-systeem, terwijl het beperken van AI tot menselijke doorvoer het voordeel elimineerde.

De bevinding werd versterkt door een bredere analyse die alle 318 menselijke overtuigers omvatte die in de eerste twee studies werden getest: geen enkel individu overtrof de gemiddelde prestatie van het onbeperkte AI-systeem, ongeacht ervaringsniveau, kwestiegebied of demografische subgroep.

Kunnen professionele overtuigers AI verslaan?

De derde studie onderzocht of AI zijn voordeel kon behouden tegen mensen wiens carrières gebouwd zijn op het overtuigen van anderen in echte, wereldwijde situaties, in plaats van academische debatwedstrijden.

De onderzoekers recruteerden 19 professionele fondsenwervers van het Britse fondsenwervingsbedrijf AppcoUK. Deze deelnemers, in tegenstelling tot de debaters in de eerdere experimenten, hadden uitgebreide praktische ervaring met fondsenwerving, met een mediaan van ongeveer 10.000 overtuigingsgesprekken tijdens hun carrière. Elke fondsenwerver werd £140 per uur betaald, kreeg de beleidskwesties een week van tevoren voor voorbereiding en concurreerde voor dezelfde prestatie-gebaseerde prijzen die elders in de studie werden gebruikt.

Selfs tegen deze groep bleef AI overtuigender (zie eerder resultaten hierboven). De professionele fondsenwervers veranderden meningen met 6,9 procentpunten in vergelijking met de controlegroep – maar AI produceerde een verschuiving van 12,8 procentpunten, waardoor het een voordeel van 5,9 procentpunten had ten opzichte van de menselijke professionals.

Kan AI mensen overtuigen om hun portemonnee te openen?

De vierde en laatste studie onderzocht echte, wereldwijde fondsenwerving in plaats van veranderde meningen. De onderzoekers werkten opnieuw samen met AppcoUK, dit keer met als focus Save the Children, een charitatieve organisatie waarvoor AppcoUK eerder £824.297 had opgehaald van 22.583 donoren tussen 2016 en 2023.

Deelnemers spraken met ofwel Claude Opus 4.6 of een van de 18 professionele fondsenwervers. Vervolgens ontvingen ze een studiebonus van £1 en konden ze een deel van het bedrag doneren aan Save the Children. Onder de zeven tactieken die werden gebruikt (zie afbeelding hieronder), werd Claude Opus 4.6 geïnstrueerd om impact-efficaciteitsinformatie te gebruiken, waarin werd uitgelegd hoe individuele donaties konden worden omgezet in meetbare resultaten voor de charitatieve organisatie.

AI produceerde grotere donatie-effecten dan de professionele fondsenwervers, met donaties die toenamen met 17,2 procentpunten ten opzichte van de controlegroep, in vergelijking met 6,4 procentpunten voor de fondsenwervers:

Donatie-uitkomsten en donatie-gerelateerde deelnemersbeoordelingen in de vierde studie. Het linkergepaneel vergelijkt geven na gesprekken met professionele fondsenwervers en Claude Opus 4.6, gemeten als percentagepunten van een £1-studiebonus. Het rechterpaneel vergelijkt deelnemersbeoordelingen over zeven donatie-gerelateerde tactieken, met AI die hogere beoordelingen kreeg op alle zeven maatregelen.

Het verschil werd zichtbaar in zowel het percentage deelnemers dat donaties deed als in het gemiddelde bedrag dat werd gedoneerd door degenen die gaven.

Deelnemers beoordeelden de AI ook hoger dan de menselijke fondsenwervers op een reeks donatie-gerelateerde maatregelen, met de grootste verschillen die verschenen voor implementatie-intenties, commitment-escalatie en waargenomen impact-efficaciteit.

Volgens het artikel was dezelfde informatie-georiënteerde benadering die verband hield met AI’s voordeel in de eerdere studies, ook geassocieerd met grotere charitatieve donaties in dit fondsenwervingsexperiment.

Conclusie

Hoewel de auteurs, zoals eerder vermeld, concluderen dat de resultaten van de studie reden tot bezorgdheid geven, voegen ze eraan toe dat kleinere spelers eveneens potentieel worden gesteund door soortgelijke toegang tot de nieuwste en beste AI-technologieën.

Implicit in deze uitkomst, natuurlijk, is de mogelijkheid dat de beste modellen over tijd kunnen worden ontzegd aan kleinere spelers.

Publicatie op donderdag 18 juni 2026