Kąt Andersona
AI Przekonuje Ludzi do Wkładu O Prawie 3-Krotnie Więcej niż Ludzcy Fundraiserzy

Nowe badanie przeprowadzone przez Oxford sugeruje, że czołowe modele językowe mogą zebrać znacznie więcej pieniędzy niż profesjonalni fundraiserzy i mogą niezawodnie pokonywać ludzi we wszystkich innych formach perswazji.
Nowe badanie przeprowadzone w Wielkiej Brytanii i Stanach Zjednoczonych wykazało, że modele językowe są bardziej skuteczne w przekonywaniu ludzi niż wykształceni profesjonaliści, których zadaniem jest zmiana opinii.
W teście fundraisingowym w środowisku rzeczywistym, badacze stwierdzili, że AI było w stanie przekonać ludzi do darowizny około 17,2% ich dostępnych pieniędzy, w porównaniu z 6,4% dla profesjonalnych fundraiserów – różnica 10,8 punktów procentowych, co przekłada się na około 2,7-krotnie wyższy wskaźnik darowizn pod AI, z wyższym udziałem i większymi przeciętnymi wkładami, które przyczyniły się do różnicy.
W artykule napisano:
‘Nie tylko AI zostało wyraźnie poinstruowane, aby stosować tylko strategię skuteczności, ale również przewyższyło kanwasyjerów w sześciu innych mechanizmach, których nie zostało poinstruowane do stosowania.’
‘[Ludzcy] przekonywani ocenili AI jako mające silniejsze argumenty, nauczyły ich więcej i były bardziej empatyczne i przyjemne w rozmowie niż [kanwasyjerzy].’
‘Wszystkie te wyniki wskazują, że AI przewyższa ekspertów ludzkich w szerokim zakresie mechanizmów dotyczących darowizn i sugerują, że przewaga AI w perswazji dotyczącej postaw rozciąga się na konsekwentne zachowania w świecie rzeczywistym.’
Autorzy teorzą, że wybitne wyniki testowanych modeli – w tym wersji pro Claude Opus, ChatGPT, Grok i Google Gemini – mogą być przypisywane gęstości i szybkości, z jaką informacje są przekazywane korespondentowi; kiedy AI zostało ograniczone do “ludzkiej szybkości”, jego przewaga została całkowicie utracona:
‘Znaleźliśmy zbieżne dowody, że przewaga AI wynikała z szybkiego wdrożenia większych ilości informacji: po coachingu, eksperci ludzcy mogli związać AI ograniczone do odpowiedzi na ludzką szybkość i z ludzką długością wiadomości.’
W artykule również napisano, że żaden z 318 indywidualnych ludzkich przekonywaczy testowanych w całym badaniu nie był w stanie pokonać średniej wydajności systemu AI – nawet po tym, jak niektórzy uczestnicy otrzymali specjalistyczne szkolenie oparte na technice AI.
Autorzy podsumowują:
‘Nasze wyniki sugerują, że wkraczamy w świat, w którym AI zapewnia ludziom nadmiar umiejętnych działań. Przewidywanie konsekwencji tej zmiany jest trudne, ponieważ wymaga od nas dokonywania założeń na temat tego, kto będzie miał dostęp do najbardziej przekonywujących technologii AI, kto będzie celem perswazji i jakie bariery, zabezpieczenia lub tarcie mogą zmniejszyć wpływ perswazji AI na ludzi.’
‘Jednym z efektów AI, które może przewyższyć nawet ekspertów ludzkich, może być konsolidacja wpływu wśród już potężnych aktorów.’
Nowy artykuł nosi tytuł Systemy AI przewyższają ekspertów ludzkich i pochodzi od ośmiu badaczy z Uniwersytetu w Oksfordzie, UK AI Security Institute, Uniwersytetu Stanforda i London School of Economics and Political Science.
Metoda i Badania
Główne wyniki pochodzą z czterech eksperymentów: przekonywania wyborców i ekspertów od debat; testowania coachingu i ograniczeń szybkości jako “wyrównywanie” ludzi i AI; konkurowania z profesjonalnymi kanwasyjami w sprawach politycznych; i konkurowania z nimi o rzeczywiste darowizny charytatywne.
Badanie wykorzystało 18 978 rozmów z 6 923 ludźmi, z czołowymi modelami AI rywalizującymi z ludzkimi ekspertami o różnym poziomie, od wynajętych pracowników crowdwork platformy Prolific za 12 funtów za godzinę, po doświadczonych ludzkich przekonywaczy, którzy byli wynagradzani 140 funtami za godzinę plus premia, i mieli możliwość badania sesji do tygodnia wcześniej.
Modele wykorzystane w testach to Claude Opus 4.1 i 4.6, ChatGPT-4o, GPT-5.4, Grok 4.20 i Gemini 2.5 Pro.
Starcie z elitą debat
Pierwszy eksperyment sprawdził, czy AI może pokonać coraz bardziej wykwalifikowanych ludzkich przekonywaczy w rozmowach jeden na jeden na tematy polityczne i społeczne:

Polityczne i społeczne pytania polityczne wykorzystane w pierwszych trzech badaniach, z uczestnikami dyskutującymi o jednej losowo przydzielonej kwestii przed i po rozmowie. Tematy zostały wybrane w celu objęcia szerokiego zakresu kontrowersyjnych debat publicznych w Wielkiej Brytanii, od imigracji, wolności słowa i regulacji mediów społecznościowych po politykę społeczną, eutanazję i przyszłość monarchii. Źródło
Uczestnicy zostali najpierw poproszeni o wyrażenie swoich opinii na temat jednego z dziesięciu pytań politycznych (wyżej), a następnie przydzielono im albo AI, albo ludzkiego partnera rozmowy. Po rozmowie, która trwała średnio około 14 minut, zostali poproszeni o ocenę swojej pozycji ponownie.
Trzy grupy ludzkie zostały przetestowane, z zwykłymi pracownikami z platformy crowdwork Prolific, którzy zostali wynajęci w celu zapewnienia podstawy, i wynagrodzeni 12 funtów za godzinę. Druga grupa składała się z najsilniejszych wykonawców z czterorundowego turnieju perswazji, w którym wzięło udział ponad 1 100 uczestników i prawie 9 500 rozmów. Trzecia grupa składała się z 56 elitarnych debatujących, wszyscy z nich osiągnęli co najmniej półfinał dużego międzynarodowego konkursu, i obejmowała czterech mistrzów świata, a także 11 mistrzów kontynentalnych, ze średnim stażem 8,9 lat.
Znaczne wysiłki zostały podjęte, aby dać ludzkim przekonywaczom korzystne warunki, z turniejami, w których zwycięzcy i elitarni debatujący konkurowali o znaczne nagrody pieniężne do 11 000 funtów, podczas gdy debatujący byli wynagradzani za badanie sesji przed rozpoczęciem i mieli możliwość przygotowania się do rozmów.
Nawet tak, AI osiągnęło najmocniejsze wyniki we wszystkich porównaniach:

Szacowane efekty perswazji w badaniach ludzkich i AI, mierzone jako średnia zmiana postawy po rozmowie na temat kontrowersyjnego problemu politycznego.
Czerwone markery na wykresie wyników powyżej wskazują czołowe modele AI. We wszystkich porównaniach te wytworzyły większe zmiany postaw niż jakakolwiek grupa ludzka.
Najlepszy wynik ludzki pochodził od wyselekcjonowanych elitarnych debatujących – ale nawet oni zostali pokonani przez nieograniczone systemy AI. Kiedy AI zostało ograniczone do ludzkiej szybkości i długości wiadomości, jego przewaga praktycznie zniknęła, co sugeruje, że szybkie dostarczanie informacji może wyjaśniać znaczną część różnicy między ludzką a AI perswazją.
Modele językowe były w stanie przewyższyć zwykłych uczestników o 8,2 punkty procentowe i pokonać wyselekcjonowanych przekonywaczy o 5,6 punktów. Najmniejsza różnica pojawiła się wobec elitarnych debatujących, którzy sami wytworzyli znaczne zmiany postaw; jednak AI było w stanie uzyskać dalszą przewagę o 4,6 punktu procentowego.
Czy Ludzie Mogą Nauczyć Się Pokonywać AI?
Drugi z czterech eksperymentów spytał, czy przewaga AI może zostać wyeliminowana albo przez poprawę ludzkiej wydajności, albo przez ograniczenie samej AI. Aby przetestować pierwszą możliwość, 43 elitarnych debatujących z pierwszego badania powróciło do dodatkowego szkolenia opartego bezpośrednio na technice AI, która wcześniej pokonała ich.
Uczestnicy przeglądali transkrypty, badali, jak polecenia AI zostały skonstruowane, i spędzili dwa czterogodzinne sesje coachingu, praktykując alternatywne podejścia perswazyjne, zanim ponownie konkurowali w tych samych warunkach.
Szkolenie wytworzyło zauważalne zmiany w zachowaniu, z ludzkimi debatującymi używającymi więcej słów, wprowadzającymi więcej faktów i osiągającymi największe zmiany postaw wśród wszystkich grup ludzkich w badaniu. Szkolenie poprawiło wyniki i wytworzyło najmocniejsze ludzkie wyniki obserwowane w badaniu, ale różnica pozostała statystycznie istotna, z wyselekcjonowanymi debatującymi nadal pozostającymi w tyle za nieograniczoną AI (pokazano w tabeli poniżej).
Badacze przetestowali, czy wyniki AI zależą od szybkości odpowiedzi i długości wiadomości, ograniczając AI do ludzkiej szybkości i długości wiadomości. W tych warunkach wyselekcjonowani debatujący i ograniczona AI wytworzyli podobne wyniki:

Efekty coachingu i ograniczeń szybkości AI na wyniki perswazji. Górny panel porównuje elitarnych debatujących, wyselekcjonowanych debatujących i system AI ograniczony do ludzkiej szybkości i długości wiadomości. Dolny panel pokazuje szacowane wyniki poszczególnych przekonywaczy w pierwszych dwóch badaniach. Chociaż szkolenie poprawiło wyniki, żadna grupa ludzka nie pokonała średniej nieograniczonej AI, podczas gdy ograniczenie AI do ludzkiej wydajności wyeliminowało jej przewagę.
Wynik ten został potwierdzony przez szerszą analizę obejmującą wszystkich 318 ludzkich przekonywaczy testowanych w pierwszych dwóch badaniach: żaden indywidualny człowiek nie przekroczył średniej wydajności nieograniczonej AI, niezależnie od poziomu doświadczenia, obszaru problemu czy podgrupy demograficznej.
Czy Profesjonalni Przekonywacze Mogą Pokonać AI?
Trzecie badanie rozważyło, czy AI może utrzymać swoją przewagę wobec ludzi, których kariera opiera się na przekonywaniu innych w realnych warunkach, a nie w akademickich konkursach debat.
Badacze zwerbowali 19 profesjonalnych kanwasyjerów z brytyjskiej firmy fundraisingowej AppcoUK. Uczestnicy ci, w przeciwieństwie do debatujących w poprzednich eksperymentach, mieli obszerną praktykę w fundraisingu, z mediana około 10 000 perswazyjnych rozmów w trakcie ich kariery. Każdy z nich był wynagradzany 140 funtów za godzinę, otrzymywał tematy polityczne tydzień wcześniej w celu przygotowania i konkurował o te same nagrody za wyniki, które zostały użyte gdzie indziej w badaniu.
Nawet wobec tej grupy AI pozostało bardziej przekonywające (patrz wcześniejsze wyniki powyżej). Profesjonalni kanwasyjerzy przesunęli opinie o 6,9 punktów procentowych w porównaniu z grupą kontrolną – ale AI wytworzyło przesunięcie o 12,8 punktów procentowych, dając mu przewagę 5,9 punktów procentowych nad ludzkimi profesjonalistami.
Czy AI Może Przekonać Ludzi do Otwarcia Portfela?
Czwarte i ostatnie badanie sprawdziło fundraising w świecie rzeczywistym, a nie zmiany opinii. Badacze współpracowali ponownie z AppcoUK, tym razem koncentrując się na Save the Children, organizacji charytatywnej, dla której AppcoUK wcześniej zebrało 824 297 funtów od 22 583 darczyńców między 2016 a 2023 rokiem.
Uczestnicy rozmawiali albo z Claude Opus 4.6, albo z jednym z 18 profesjonalnych kanwasyjerów. Następnie otrzymali bonus 1 funta i mogli darować dowolną część go na Save the Children. Wśród siedmiu podejść przyjętych (patrz poniżej), Claude Opus 4.6 zostało poinstruowane, aby użyć informacji o skuteczności, wyjaśniając, jak indywidualne darowizny mogą przekładać się na wymierne rezultaty dla organizacji charytatywnej.
AI wytworzyło większe efekty darowizn niż profesjonalni fundraiserzy, z darowiznami zwiększonymi o 17,2 punkty procentowe w porównaniu z grupą kontrolną, w porównaniu z 6,4 punktami procentowymi dla kanwasyjerów:

Wyniki darowizn i oceny uczestników w czwartym badaniu. Lewy panel porównuje dawstwo po rozmowach z profesjonalnymi fundraiserami i Claude Opus 4.6, mierzone jako punkty procentowe bonusu 1 funta. Prawy panel porównuje oceny uczestników w siedmiu mechanizmach związanych z darowiznami, z AI otrzymującą wyższe oceny we wszystkich siedmiu miarach.
Różnica pojawiła się zarówno w proporcji uczestników, którzy darowali, jak i w średniej kwocie darowizny tych, którzy darowali.
Uczestnicy również ocenili AI wyżej niż ludzkich fundraiserów w zakresie różnych miar związanych z darowiznami, z największymi różnicami pojawiającymi się w intencjach wdrożeniowych, eskalacji zobowiązań i postrzeganej skuteczności.
Zgodnie z artykułem, ten sam informacyjny styl związany z przewagą AI w poprzednich badaniach był również związany z wyższymi darowiznami charytatywnymi w tym eksperymentcie fundraisingowym.
Podsumowanie
Chociaż autorzy, jak wspomniano na początku, stwierdzają, że wyniki badania są powodem do niepokoju, dodają, że mniejsi gracze są również potencjalnie wzmocnieni przez podobny dostęp do najnowszych i najlepszych technologii AI.
Wkładni w tym wyniku, naturalnie, jest możliwość, że najlepsze modele mogą, z czasem, być odmówione mniejszym graczom.
Pierwotnie opublikowane w czwartek, 18 czerwca 2026












