Ângulo de Anderson

Utilizando a 'Probabilidade' como métrica de detecção de deepfakes

Publicado 13 de novembro de 2025

Martin Anderson

Montagem com imagem gerada por IA (GPT-1) da erupção do Vesúvio em 79 d.C., apresentando Donald Trump do episódio 1 da 27ª temporada de South Park, David Icke no programa 'Wogan' em 1991 e a política Catherine Connolly.

Se os vídeos e áudios gerados por IA se tornarem suficientemente bons, os detectores de deepfakes baseados em artefatos visuais ou outros sinais tradicionais deixarão de funcionar. Mas, considerando a raridade com que as pessoas se desviam de comportamentos previsíveis, talvez o conceito de "probabilidade" possa ser adotado de forma mais abrangente como um indicador da veracidade de um vídeo ou boato.

Opinião No início da década de 1990, o respeitado ex-jogador de futebol britânico e comentarista esportivo de TV, David Icke revelado casualmente Em um programa de entrevistas, ele afirmou ser 'o filho de Deus' – uma revelação bizarra e inesperada que se transformaria, ao longo das décadas seguintes, em uma obsessão persistente e teoria da conspiração elaborada sobre uma conspiração global secreta e poderosa de 'homens-lagarto'.

Com a adoção da internet ainda a alguns anos de distância, e o advento das redes sociais ainda mais distante, a dissonância gritante entre a fama de Icke e a natureza de suas novas ideias teve um impacto profundo no público britânico – sobretudo devido à completa falta de contexto, ou qualquer tipo de preparação para essa mudança radical, por parte de uma personalidade esportiva tão conhecida e consagrada.

Mais de vinte anos depois, uma vertente semelhante, porém muito mais sombria, desse choque social ocorreu quando o querido ativista de causas sociais e apresentador de programas infantis, Jimmy Savile, foi considerado culpado postumamente. criminoso sexual serial e voraz ao longo da vida que usou sua imagem pública exemplar para facilitar seus crimes.

O subsequente Operação Yewtree A investigação policial revelaria muitas outras celebridades do Reino Unido com longos históricos de crimes sexuais; mais tarde, o processo contra Harvey Weinstein levaria a uma descoberta semelhante de celebridades agressoras sexuais nos EUA, evoluindo para o movimento #MeToo e se consolidando permanentemente na cultura americana em revelações como... The Morning ShowAs notícias "chocantes" pareciam estar desenvolvendo um novo formato abrupto – um formato que eventualmente seria adotado por criadores de deepfakes.

O fim da detecção 'tradicional' de deepfakes?

Mesmo que as redes sociais e a inteligência artificial já existissem no início dos anos noventa, nenhum sistema preditivo no mundo poderia ter previsto as revelações de Icke em seu talk show, que (como bem me lembro) não foram de forma alguma prenunciadas nos anos que antecederam o evento.

Mas, se a IA já existisse, talvez levasse algum tempo para convencer um público mais amplo de que as declarações de Icke não eram produto de... Google Veo 3ou outra das novas gerações de frameworks deepfake hiper-realistas de áudio/vídeo.

Foi somente nos últimos 6 a 12 meses que os métodos de deepfake com IA se tornaram eficazes o suficiente para atender a essa demanda. anos de previsões catastróficas da mídia sobre interferência eleitoral por meio de deepfakes, e capaz o suficiente para gerar o tipo de mancha de reputação de ataque rápido Isso não é verdade, mas é difícil de erradicar em uma cultura cada vez mais crédula.

Até o momento, a produção de vídeo por IA geralmente fica aquém do verdadeiro realismo, limitada por obstáculos técnicos e cada vez mais polarizada por uma crescente disparidade entre os modelos ocidentais restritivos e as versões de código aberto não censuradas da China.^**.

No entanto, noto cada vez mais na literatura de pesquisa uma iminente concessão desta guerra fria, por exemplo, no novo artigo. Degradação de desempenho na detecção de deepfakes^†:

"[Nós] partimos do pressuposto de que os vídeos deepfake continuarão a conter características que podem ser aprendidas por máquina e que os distinguem de forma confiável dos vídeos genuínos. À medida que as capacidades da IA generativa continuam a avançar rapidamente, essa premissa pode muito bem deixar de existir."

'Nesse cenário, a marca d'água e outros métodos de rastreamento de procedência serão o único recurso para manter a confiança na mídia digital.'

No entanto, o mesmo artigo reconhece que soluções baseadas em proveniência, como a liderada pela Adobe, podem ser problemáticas. Iniciativa de Autenticidade de Conteúdo (e os muitos) menor pesquisa ofertas dos últimos 7 a 8 anos) exigem uma adoção tão generalizada que se torna irrealista; e o artigo termina com uma nota geral de recuo, senão de derrota.

Se os métodos de detecção de deepfakes audiovisuais forem superados pela IA generativa, e a adoção global de um sistema intrusivo de marca d'água ou rastreabilidade falhar devido aos diversos obstáculos logísticos, qual característica central comum poderia substituí-los como indicadores de conteúdo potencialmente falsificado? Ou devemos nos resignar a um mundo onde toda a mídia é questionável? Dividendo do mentiroso prevalece?

Gráficos de conhecimento

Parece ser o momento de alavancar mais profundamente. probabilidade e plausibilidade de 'eventos relatados' como uma característica marcante na detecção de deepfakes. Além disso, como os sistemas de IA generativos de vídeo e áudio estão convergindo cada vez mais, talvez seja o momento de as linhas de pesquisa separadas de 'notícias falsas' (como um evento narrativo baseado em texto) e imagens/vídeos falsos convergirem da mesma forma.

A probabilidade A métrica deepfake não é a mesma que RAG-assistido verificação de fatos, onde um modelo de IA pode incorporar resultados da web atuais para obter conhecimento de eventos que ocorrem após o seu próprio. Cancelar compromissoe/ou para corroborar suas alegações.

Em vez disso, realizaria previsões com base em tendências estatísticas geralmente indicativas, derivadas de padrões históricos que se conformam a uma investigação atual.

Nesse sentido, um método probabilístico está mais próximo de análise estatística do que as abordagens mais modernas no cenário atual de aprendizado de máquina.

Embora anteriormente ofuscado por abordagens mais modernas da era Transformers, gráficos de conhecimento estão fazendo algo de volta No âmbito empresarial, e parecem adaptadas à potencial implementação de métricas de 'probabilidade' na detecção de deepfakes.

Um grafo de conhecimento simplificado que ilustra como pessoas, lugares, obras de arte e eventos podem ser conectados por meio de relações rotuladas, permitindo que máquinas raciocinem sobre entidades do mundo real e suas conexões. Fonte: [ https://blog.langchain.com/enhancing-rag-based-applications-accuracy-by-constructing-and-leveraging-knowledge-graphs/

Um grafo de conhecimento simplificado que ilustra como pessoas, lugares, obras de arte e eventos podem ser interligados por meio de relações rotuladas, permitindo que as máquinas raciocinem sobre entidades do mundo real e suas conexões. fonte

Um grafo de conhecimento é uma forma de organizar informações mapeando elementos do mundo real, como pessoas, empresas, eventos ou ideias, em uma rede de fatos interconectados.

Cada subentidade é um nó, e as ligações entre elas (arestas) descrevem como elas se relacionam. Por exemplo, 'Microsoft' (um nó) pode estar ligado a 'OpenAI' (outro nó) por uma aresta que diz 'é cliente de'. Essas conexões são frequentemente armazenadas em bancos de dados de grafos e seguem uma estrutura sujeito-predicado-objeto, como 'Microsoft é cliente da OpenAI'.

Memória Persistente

completa estudo chinês Em setembro deste ano, foi proposto um método sem treinamento que utiliza raciocínio baseado em grafos para detectar inconsistências sutis em deepfakes multimodais.

Em vez de gerar justificativas ou afinação Em modelos de grande porte, o sistema recupera pares de imagem e texto, constrói um gráfico de similaridade e pontua as conexões, a fim de recuperar os exemplos mais relevantes, e estes orientam o julgamento do modelo sem a necessidade de novo treinamento:

Uma visão geral da estrutura GASP-ICL, que aprimora a detecção de deepfakes combinando seleção de amostras baseada em grafos com aprendizado contextual, permitindo que um modelo de visão-linguagem congelado classifique pares de imagem/texto como reais ou falsos, sem treinamento ou ajuste fino. Fonte: [https://www.arxiv.org/pdf/2509.21774]

Uma visão geral da estrutura GASP-ICL, que aprimora a detecção de deepfakes combinando a seleção de amostras baseada em grafos com o aprendizado contextual, permitindo que um modelo de visão-linguagem congelado classifique pares de imagem/texto como reais ou falsos, sem treinamento ou ajuste fino. fonte

Este é provavelmente o trabalho mais próximo, certamente o que já vi, de uma abordagem "informada" e historicamente consciente para a avaliação e verificação de novas produções midiáticas. Em sua maior parte, as abordagens de visão computacional continuam a analisar imagens (incluindo quadros de vídeos e anomalias temporais abrangendo múltiplos enquadramentos), enquanto as estruturas de detecção de 'notícias falsas' continuam a enfatizar dados baseados em texto, mesmo em projetos multimodais.

Aumento de recursos

O desafio de um sistema preditivo desse tipo reside no alcance da vigilância que pode ser necessário para tornar a abordagem totalmente eficaz – pelo menos além da análise de celebridades e figuras públicas, para as quais já existem dados de livre acesso.

Provavelmente, a linha de pesquisa atual mais semelhante é a área de pré-crime, que rotula diversos sinais de inteligência multimodal como 'suspeitos' e se apresenta como um espantalho da IA em produções como a de Jonathan Nolan. Person of Interest (2011-2016), e o de Steven Spielberg Minority Report (2002).

Enquanto um Person of InterestEmbora um sistema de vigilância onívoro ao estilo chinês produzisse resultados ótimos, é improvável que, no momento, a cultura ocidental possa aprovar o nível de intrusão pessoal que as redes internas da China impõem aos seus cidadãos.

Portanto, em relação a possíveis notícias falsas sobre nãoPara incluir cidadãos comuns em sua cobertura e análises, apenas agências governamentais como a polícia (bem como registros de nascimento e óbito e repartições de finanças) teriam informações históricas pertinentes suficientes para fundamentar probabilidades em um fluxo de trabalho baseado em grafos; e mesmo elas precisariam de vontade política, capacidade, legislação e recursos semelhantes aos do Partido Comunista Chinês para incluir cidadãos comuns em sua cobertura e análises (ou seja, além de dados banais, porém obrigatórios, como números de passaporte e registros de veículos).

Pontuação de Probabilidade

Parece provável que a eficácia potencial de um sistema desse tipo se limite aos casos de uso (atuais) mais óbvios.^††† Para conteúdo deepfake: desestabilização (deepfakes patrocinados pelo Estado); deepfakes pornográficos de celebridades e 'desconhecidos' (ambos podem ser considerados maliciosos, embora o último caso tenda a atrair maior atenção da mídia); fraude (Incluindo deepfakes de áudio/vídeo projetado para executar 'roubos por falsificação de identidade'); e assassinato de reputação política.

Um sistema baseado em conhecimento precisaria de uma escala de probabilidades para uma diversidade de eventos possíveis. Em uma extremidade do espectro, falhas humanas comuns, como má gestão financeira, infidelidade, vícios, indiscrição, etc.; na outra… revelar que você é o filho de Deus em um programa de entrevistas ao vivo na TV (ou eventos de escala e impacto semelhantes).

Mesmo neste último caso, fatores históricos pessoais de qualquer indivíduo influenciariam a probabilidade do resultado: uma figura política proeminente que tenha se mostrado ambígua publicamente em questões controversas (como a veracidade dos pousos lunares das décadas de 1960 e 70) para obter vantagens com um número cada vez maior de apoiadores teria um peso crescente. informado de forma 'alternativa' eleitorado, pode obter ganhos adicionais curinga status em rotinas de verificação, em comparação com seus pares mais estáveis.

No caso de pornografia com celebridades, existe um contexto adequado do mundo real (ou seja, o Vazamento de fotos de celebridades em 2012, entre outros incidentes – bastante raros –) para gerar um Dividendo do Mentiroso moderado, em certos contextos; mas como esses incidentes isolados tendem a funcionar como exceções que confirmam a regra, a maioria dos vídeos pornográficos de celebridades produzidos atualmente por difusão seria considerada extremamente 'improvável' (embora isso não resolva a questão da apropriação da identidade das pessoas para tais fins).

Em termos de perturbações nacionais, existe uma quantidade considerável de dados estatísticos que podem auxiliar na avaliação das probabilidades de relatos de catástrofes. Mesmo na história antiga, eventos aparentemente repentinos, como a erupção do vulcão Vesúvio em 79 d.C., foram pressagiados. se você tivesse prestado atenção suficienteAlém disso, a disponibilidade de uma infinidade de fontes de informação governamentais e apoiadas por ONGs, juntamente com a capacidade crescente da IA de... Extrair a estrutura a partir de dados brutos Pode fornecer contexto histórico adicional para a avaliação de probabilidades.

Conclusão

Mesmo um sistema preditivo bem implementado desse tipo não seria capaz de explicar o acaso, eventos naturais, ocorrências fortuitas ou eventos maliciosos arquitetados sem qualquer supervisão.

Além disso, o enorme volume e a profundidade dos dados necessários para abranger também pessoas não famosas seriam um obstáculo político — pelo menos por enquanto.

No entanto, as opções parecem estar se reduzindo; a análise baseada em visão computacional está fadada ao fracasso diante da IA generativa aprimorada, enquanto os esquemas de verificação e procedência carregam um fardo considerável de dívida técnica e dificultam sua adoção. Isso torna soluções como a Content Authenticity Initiative e o sistema de reconhecimento facial de direitos autorais Metaphysic.ai, ainda não implementado, pouco atraentes. Metafísica Profissional, difícil de popularizar.

Em sua aplicação mais ampla, os sistemas baseados em RAG (Raiz, Autenticidade, Coragem) só conseguem determinar se uma fonte confiável corrobora uma alegação não verificada; e como muitas notícias importantes (e verdadeiras) surgem sem contexto prévio, a falta de comprovação por parte de fontes confiáveis não é necessariamente significativa.

Seu valor pode se provar ainda maior se puderem fazer parte de um ecossistema de dados mais amplo, preocupado com o único aspecto que a maioria das formas atuais de IA considera desafiador: o contexto histórico.

* Não confundir com o início codificador automático Lançamentos que estrearam em 2017 e que eventualmente seriam substituídos por abordagens superiores.

^†https://arxiv.org/abs/2511.07009

^**Que geralmente podem ser executados livremente em PCs domésticos mais potentes, em vez de estarem disponíveis apenas por meio de APIs restritas, como o ChatGPT e a série Veo.

^†††Excluindo usos legítimos para entretenimento, como efeitos visuais profissionais em produções de cinema e televisão.

Publicado originalmente na quinta-feira, 13 de novembro de 2025.

Tópicos relacionados:LLMs avançados deepfake detecção de deepfake DeepFakes

Martin Anderson

Escritor sobre machine learning, especialista em domínio em síntese de imagem humana. Ex-chefe de conteúdo de pesquisa na Metaphysic.ai.
Site pessoal: martinanderson.ai
Contato: [email protected]
Twitter: @manders_ai