Ângulo de Anderson

A Inteligência Artificial Convence as Pessoas a Doar Quase 3 Vezes Mais do que os Arrecadadores Humanos

mm
AI-generated image (GPT-2) - An industrial humanoid robot holds a Save the Children donation tin on a British high street as several passers-by place five pound notes into it, while nearby human volunteers in red Save the Children vests stand with their own collection tins and watch with puzzled expressions.

Um novo estudo liderado por Oxford sugere que os principais modelos de linguagem podem arrecadar muito mais dinheiro do que os arrecadadores profissionais e podem confiavelmente superar os humanos em todas as outras formas de persuasão.

 

Um novo estudo Reino Unido-Estados Unidos descobriu que os modelos de linguagem de ponta são mais eficazes em persuadir as pessoas do que os profissionais treinados cujo trabalho é mudar mentes.

Em um teste de arrecadação de fundos no mundo real, os pesquisadores descobriram que a IA foi capaz de persuadir as pessoas a doar cerca de 17,2% do dinheiro disponível, em comparação com 6,4% para os arrecadadores humanos profissionais – uma diferença de 10,8 pontos percentuais, o que equivale a aproximadamente 2,7 vezes a taxa de doação sob a IA, com maior participação e contribuições médias maiores contribuindo para a diferença.

O artigo afirma:

‘Notavelmente, embora a IA tenha sido explicitamente instruída a perseguir apenas a estratégia de eficácia de impacto, ela superou os arrecadadores nas seis outras mecânicas que não foi solicitada a usar também.’

‘Os persuadidos humanos classificaram a IA como tendo feito argumentos mais fortes, ensinado mais e sido mais empática e agradável de conversar do que os arrecadadores.’

‘Juntos, esses resultados indicam que a IA supera os humanos especializados em uma ampla gama de mecanismos relevantes para doações e sugerem que a vantagem de persuasão atitudinal da IA se estende a comportamentos reais conseqüentes.’

Os autores teorizam que o desempenho excepcional dos modelos testados – que incluem variantes pro de Claude Opus, ChatGPT, Grok e Google Gemini – pode ser atribuído à densidade e velocidade com que as informações são fornecidas ao correspondente; quando as IAs foram forçadas a reduzir para ‘velocidade humana’, sua vantagem foi completamente perdida:

‘Encontramos evidências convergentes de que a vantagem da IA decorreu do rápido deploy de grandes quantidades de informações: após o treinamento, os humanos especializados podiam empatar com a IA restrita a responder a velocidades humanas e com mensagens de comprimento humano.’

O artigo também relata que nenhum dos 318 arrecadadores humanos individuais testados em vários experimentos conseguiu superar o desempenho médio do sistema de IA – mesmo após alguns participantes receberem treinamento especializado baseado nas próprias técnicas da IA.

Os autores concluem:

‘Nossos resultados implicam que estamos entrando em um mundo em que a IA fornece aos atores humanos uma abundância de defesa habilidosa. Prever as conseqüências dessa mudança é desafiador, pois requer que façamos suposições sobre quem terá acesso às tecnologias de persuasão da IA mais persuasivas, quem será o alvo da persuasão e quais barreiras jurisdicionais, salvaguardas ou outras fricções podem reduzir o impacto da persuasão da IA na população humana.’

‘Um efeito da IA que pode superar a persuasão até mesmo os especialistas humanos pode ser uma consolidação de influência entre atores já poderosos.’

O novo artigo é intitulado Sistemas de IA superam humanos especializados e vem de oito pesquisadores de Oxford University, UK AI Security Institute, Stanford University e London School of Economics and Political Science.

Método e Estudos

Os principais resultados vêm de quatro experimentos: persuadindo eleitores e debatedores especializados; testando treinamento e limites de velocidade como ‘equalizadores’ humanos/IA; competindo contra arrecadadores profissionais em questões políticas; e competindo contra eles para doações reais para caridade.

O estudo usou 18.978 conversas de 6.923 pessoas, com modelos de IA de ponta competindo contra uma variedade de especialistas humanos, desde trabalhadores da multidão contratados por £12/hora, até arrecadadores humanos experientes pagos £140/hora + bônus, e permitidos a pesquisar as sessões até uma semana antes.

Modelos usados nos testes foram Claude Opus 4.1 e 4.6, ChatGPT-4o, GPT-5.4, Grok 4.20 e Gemini 2.5 Pro.

Confronto de Debatedores Especializados

O primeiro experimento examinou se a IA poderia superar arrecadadores humanos cada vez mais habilidosos em conversas um-a-um sobre questões políticas e sociais;

Questões de política e sociedade usadas nos três primeiros estudos, com participantes discutindo uma questão aleatoriamente designada antes e após a conversa. Os tópicos foram selecionados para abranger uma ampla gama de debates públicos contenciosos, desde imigração, liberdade de expressão e regulação de mídia social até política de bem-estar, morte assistida e o futuro da monarquia. Fonte - https://arxiv.org/pdf/2606.16475

Questões de política e sociedade usadas nos três primeiros estudos, com participantes discutindo uma questão aleatoriamente designada antes e após a conversa. Os tópicos foram selecionados para abranger uma ampla gama de debates públicos contenciosos no Reino Unido, desde imigração, liberdade de expressão e regulação de mídia social, até política de bem-estar, morte assistida e o futuro da monarquia. Fonte

Os participantes foram primeiro solicitados a expressar suas opiniões sobre uma das dez questões de política do Reino Unido (mostradas acima) e, em seguida, designados para um parceiro de conversa, seja uma IA ou um humano. Após a discussão, que normalmente durou cerca de 14 minutos, eles foram solicitados a classificar sua posição novamente.

Três grupos humanos foram testados, com trabalhadores comuns da plataforma de multidão Prolific recrutados para fornecer uma linha de base, e pagos £12 por hora. O segundo grupo consistia nos principais performers de um torneio de persuasão de quatro rodadas que envolveu mais de 1.100 participantes e quase 9.500 conversas. O terceiro grupo consistia em 56 debatedores competitivos especializados, todos os quais haviam alcançado pelo menos as semifinais de uma competição internacional importante, e apresentava quatro campeões mundiais, bem como 11 campeões continentais, com uma média de 8,9 anos de experiência em debates.

Um esforço considerável foi feito para dar aos arrecadadores humanos condições favoráveis, com os vencedores do torneio e os debatedores especializados competindo por prêmios em dinheiro substanciais de até £11.000, enquanto os debatedores eram pagos para pesquisar os tópicos com antecedência. Em média, cada debatedor passou cerca de oito horas se preparando para as conversas.

Mesmo assim, a IA alcançou os resultados mais fortes em cada comparação:

Efeitos de persuasão estimados em todo o estudo humano e condições de IA, medidos como mudança de atitude média após uma conversa sobre uma questão de política contenciosa.

Efeitos de persuasão estimados em todo o estudo humano e condições de IA, medidos como mudança de atitude média após uma conversa sobre uma questão de política contenciosa.

Os marcadores vermelhos no gráfico de resultados acima indicam modelos de IA de ponta. Em todas as comparações, esses produziram mudanças de atitude maiores do que qualquer grupo humano.

O desempenho humano mais forte veio dos debatedores especializados treinados – mas esses ainda ficaram atrás dos sistemas de IA não restritos. Quando a IA foi limitada a velocidades de escrita humanas e comprimentos de mensagem, sua vantagem desapareceu quase completamente, sugerindo, como indicado anteriormente, que a entrega rápida de informações pode explicar grande parte da diferença entre os poderes de persuasão humanos e da IA.

As LLMs foram capazes de superar os participantes comuns por 8,2 pontos percentuais e superar os persuasores selecionados pelo torneio por 5,6 pontos. A menor diferença apareceu contra os especializados debatedores, que produziram mudanças de atitude substanciais; ainda assim, a IA foi capaz de obter uma vantagem adicional de 4,6 pontos percentuais.

Os Humanos Podem Aprender a Superar a IA?

O segundo dos quatro experimentos perguntou se a liderança da IA poderia ser eliminada, seja melhorando o desempenho humano ou restringindo a IA. Para testar a primeira possibilidade, 43 dos debatedores especializados do primeiro estudo retornaram para treinamento adicional baseado diretamente nas técnicas usadas pela IA que os havia superado anteriormente.

Os participantes revisaram transcrições, examinaram como os prompts da IA haviam sido construídos e passaram dois períodos de treinamento de quatro horas praticando abordagens persuasivas alternativas antes de competir novamente sob as mesmas condições.

O treinamento produziu mudanças notáveis no comportamento, com os debatedores humanos usando mais palavras, introduzindo mais afirmações verificáveis e alcançando as maiores mudanças de atitude observadas entre qualquer grupo humano no estudo. O treinamento melhorou o desempenho e produziu os resultados humanos mais fortes observados no estudo, mas a diferença permaneceu estatisticamente significativa, com debatedores treinados ainda atrás dos sistemas de IA não restritos (mostrados na tabela de resultados abaixo).

Os pesquisadores testaram se o desempenho da IA dependia da velocidade de resposta e do comprimento da mensagem, limitando a IA a velocidades de escrita humanas e comprimentos de mensagem. Sob essas condições, os debatedores treinados e a IA restrita produziram resultados semelhantes:

Efeitos do treinamento e restrições de velocidade da IA no desempenho persuasivo. O painel superior compara debatedores especializados, debatedores especializados treinados e um sistema de IA restrito a velocidades de escrita e comprimentos de mensagem humanos. O painel inferior mostra distribuições de desempenho estimadas para persuasores individuais nos dois primeiros estudos. Embora o treinamento tenha melhorado os resultados, nenhum grupo humano igualou o sistema de IA não restrito, enquanto a limitação da IA à produtividade humana eliminou sua vantagem.

Efeitos do treinamento e restrições de velocidade da IA no desempenho persuasivo. O painel superior compara debatedores especializados, debatedores especializados treinados e um sistema de IA restrito a velocidades de escrita e comprimentos de mensagem humanos. O painel inferior mostra distribuições de desempenho estimadas para persuasores individuais nos dois primeiros estudos. Embora o treinamento tenha melhorado os resultados, nenhum grupo humano igualou o sistema de IA não restrito, enquanto a limitação da IA à produtividade humana eliminou sua vantagem.

A descoberta foi reforçada por uma análise mais ampla que abrangeu todos os 318 arrecadadores humanos testados nos dois primeiros estudos: nenhum indivíduo superou o desempenho médio do sistema de IA não restrito, independentemente do nível de experiência, área de questão ou subgrupo demográfico.

Os Persuasores Profissionais Podem Superar a IA?

O terceiro estudo considerou se a IA poderia manter sua vantagem contra pessoas cujas carreiras são construídas em torno de persuadir os outros em configurações do mundo real, em vez de competições de debates acadêmicos.

Os pesquisadores recrutaram 19 arrecadadores profissionais da empresa de arrecadação de fundos do Reino Unido, AppcoUK. Esses participantes, ao contrário dos debatedores nos experimentos anteriores, tinham experiência prática extensa de arrecadação de fundos, com uma mediana de cerca de 10.000 conversas persuasivas durante suas carreiras. Cada um foi pago £140 por hora, recebeu os tópicos de política uma semana antes para preparação e competiu por prêmios de desempenho iguais aos usados em outras partes do estudo.

Mesmo contra esse grupo, a IA permaneceu mais persuasiva (veja os resultados anteriores acima). Os arrecadadores profissionais mudaram opiniões por 6,9 pontos percentuais em comparação com o grupo de controle – mas a IA produziu uma mudança de 12,8 pontos percentuais, dando-lhe uma vantagem de 5,9 pontos percentuais sobre os profissionais humanos.

A IA Pode Persuadir as Pessoas a Abrir suas Carteiras?

O quarto e último estudo examinou a arrecadação de fundos do mundo real, em vez de opiniões alteradas. Os pesquisadores parceiraram novamente com a AppcoUK, desta vez se concentrando em Save the Children, uma caridade para a qual a AppcoUK havia arrecadado anteriormente £824.297 de 22.583 doadores entre 2016 e 2023.

Os participantes falaram com Claude Opus 4.6 ou um dos 18 arrecadadores profissionais. Eles então receberam um bônus de estudo de £1 e puderam doar qualquer parte dele para Save the Children. Entre as sete abordagens adotadas (veja a imagem abaixo), Claude Opus 4.6 foi instruído a usar informações de eficácia de impacto, explicando como doações individuais poderiam se traduzir em resultados mensuráveis para a caridade.

A IA produziu efeitos de doação maiores do que os arrecadadores profissionais, com doações aumentando 17,2 pontos percentuais em relação à condição de controle, em comparação com 6,4 pontos percentuais para os arrecadadores:

Resultados de doações e classificações de participantes relacionadas a doações no quarto estudo. O painel esquerdo compara doações após conversas com arrecadadores profissionais e Claude Opus 4.6, medidas como pontos percentuais de um bônus de estudo de £1. O painel direito compara classificações de participantes em sete medidas relacionadas a doações, com a IA recebendo classificações mais altas em todas as sete medidas.

Resultados de doações e classificações de participantes relacionadas a doações no quarto estudo. O painel esquerdo compara doações após conversas com arrecadadores profissionais e Claude Opus 4.6, medidas como pontos percentuais de um bônus de estudo de £1. O painel direito compara classificações de participantes em sete medidas relacionadas a doações, com a IA recebendo classificações mais altas em todas as sete medidas.

A diferença apareceu tanto na proporção de participantes que doaram quanto no valor médio doado por aqueles que deram.

Os participantes também classificaram a IA mais alto do que os arrecadadores humanos em uma variedade de medidas relacionadas a doações, com as maiores diferenças aparecendo para intenções de implementação, escalada de compromisso e eficácia de impacto percebida.

De acordo com o artigo, a mesma abordagem focada em informações associada à vantagem da IA nos estudos anteriores também foi associada a doações caritativas mais altas nesse experimento de arrecadação de fundos.

Conclusão

Embora os autores, como mencionado no início, concluam que as descobertas do estudo são causa de preocupação, eles acrescentam que os jogadores menores também são potencialmente fortalecidos por acesso semelhante às últimas e melhores tecnologias de IA.

Implicitamente nesse resultado, naturalmente, está a possibilidade de que os melhores modelos possam, ao longo do tempo, ser negados a jogadores menores.

 

Publicado pela primeira vez na quinta-feira, 18 de junho de 2026

Escritor sobre aprendizado de máquina, especialista em síntese de imagem humana. Ex-chefe de conteúdo de pesquisa da Metaphysic.ai.