Angle d’Anderson

Utilisation de la « probabilité » comme métrique de détection de deepfake

mm
Montage against AI-generated (GPT-1) image of Vesuvius exploding in 79AD, featuring Donald Trump from South Park season 27 episode 1, David Icke on 'Wogan' in 1991, and politician Catherine Connolly.

Si les vidéos et les audios générés par l’IA deviennent suffisamment réalistes, les détecteurs de deepfake basés sur les artefacts visuels ou d’autres signaux traditionnels ne fonctionneront plus. Mais étant donné que les gens s’écartent rarement d’un comportement prévisible, peut-être que la « probabilité » pourrait être adoptée plus en profondeur comme signal de la véracité d’une vidéo ou d’une rumeur.

 

Opinion Au début des années 1990, l’ancien footballeur britannique respecté et commentateur de sports télévisés David Icke a révélé de manière décontractée dans un talk-show qu’il était « le fils de Dieu » – une révélation bizarre et inattendue qui allait évoluer au fil des décennies suivantes en une théorie du complot élaborée et persistante sur une cabale mondiale secrète et puissante de « gens-lézards ».

Avec l’adoption d’Internet encore quelques années plus tard, et l’avènement des médias sociaux encore plus loin dans le futur, la dissonance entre la célébrité d’Icke et la nature de ses nouvelles révélations a eu un impact profond sur le public britannique – notamment en raison du manque total de contexte ou de préparation pour ce pivot massif, d’une personnalité sportive bien connue et bien établie.

Plus de vingt ans plus tard, une souche similaire et beaucoup plus sombre de ce choc sociétal s’est produite, lorsque le charitable campagnard et l’hôte de télévision pour enfants Jimmy Savile a été retrouvé après sa mort comme étant un délinquant sexuel à vie qui avait utilisé son image publique pour faciliter ses crimes.

L’enquête policière ultérieure Opération Yewtree a mis au jour de nombreux autres célébrités britanniques ayant des antécédents de délits sexuels ; plus tard, la poursuite de Harvey Weinstein a conduit à une découverte similaire de célébrités délinquantes sexuelles aux États-Unis, évoluant dans le mouvement #metoo, et s’intégrant de manière permanente dans la culture américaine dans des sorties telles que The Morning Show. Les « nouvelles choquantes » semblaient développer un nouveau modèle abrupt – qui allait finalement être adopté par les attaquants de deepfake.

La fin de la détection de deepfake « traditionnelle » ?

Même si les médias sociaux et l’IA avaient existé dans les années 90, aucun système prédictif au monde n’aurait pu prévoir les révélations de Icke, qui (comme je me souviens bien) n’ont pas été préfigurées de quelque manière que ce soit dans les années précédant l’événement.

Cependant, si l’IA avait existé, il aurait peut-être fallu du temps pour convaincre un public plus large que les déclarations d’Icke n’étaient pas le produit de Google Veo 3, ou d’un autre des nouveaux cadres audio/vidéo de deepfake hyper-réalistes.

Il n’y a que dans les 6-12 derniers mois que les méthodes de deepfake de l’IA sont devenues suffisamment efficaces pour remplir des années de déclarations médiatiques catastrophiques sur l’ingérence électorale de deepfake, et capables de générer le type de tache réputationnelle rapide qui est fausse, mais difficile à éradiquer dans une culture de plus en plus crédule.

Jusqu’à présent, la sortie vidéo de l’IA est généralement limitée à la réalisme, limitée par des obstacles techniques et de plus en plus polarisée par un écart croissant entre les modèles restrictifs occidentaux et les sorties open source non censurées de la Chine**.

Cependant, je remarque de plus en plus dans la littérature de recherche une concession de cette guerre froide, par exemple dans le nouveau document Performance Decay in Deepfake Detection:

‘[Nous] supposons que les vidéos de deepfake continueront à contenir des fonctionnalités apprenables par machine qui les distinguent de manière fiable des vidéos réelles. À mesure que les capacités de l’IA générative continuent à progresser rapidement, cette hypothèse peut bien se briser.

‘Dans un tel scénario, le marquage d’eau et d’autres méthodes de suivi de la provenance offriront le seul recours pour maintenir la confiance dans les médias numériques.’

Cependant, le même document reconnaît que les solutions basées sur la provenance telles que l’initiative Content Authenticity (et les très nombreuses petites offres de recherche de ces 7-8 dernières années) nécessitent une adoption si large qu’elle est irréaliste ; et le document se termine sur une note générale de retraite, sinon de défaite.

Si les méthodes de détection de deepfake audio-visuel sont dépassées par l’IA générative, et que l’adoption mondiale d’un système de marquage d’eau ou de provenance intrusive échoue aux nombreux obstacles logistiques, quelle caractéristique centrale commune pourrait les remplacer comme indicateurs de sortie potentiellement fausse ? Ou devons-nous nous résigner à un monde où tous les médias sont suspects, et où le Liar’s Dividend prévaut ?

Graphes de connaissances

Il semble temps de mettre en œuvre plus en profondeur la probabilité et la plausibilité des « événements signalés » comme caractéristique de signal dans la détection de deepfake. De plus, puisque les systèmes de génération de vidéo et d’audio de l’IA convergent de plus en plus, il peut également être temps pour les branches de recherche distinctes de « fausses nouvelles » (en tant qu’événement narratif basé sur le texte) et de fausses images/vidéos de converger de manière similaire.

Une probabilité de métrique de deepfake n’est pas la même chose que la RAG-aided vérification des faits, où un modèle d’IA peut apporter des résultats Web actuels pour acquérir des connaissances sur des événements qui se produisent après sa propre date de fin, et/ou pour corroborer ses allégations.

Plutôt, il effectuerait des prédictions basées sur des tendances statistiques généralement indicatives, dérivées de modèles historiques qui sont conformes à une enquête actuelle.

Dans ce sens, une méthode de probabilité est plus proche de l’analyse statistique que des approches plus modernes de la scène actuelle de l’apprentissage automatique.

Bien que précédemment éclipsé par des approches plus modernes de l’ère des Transformers, les graphes de connaissances font quelque chose d’un comeback dans l’espace Entreprise, et semblent adaptés au déploiement potentiel de « probabilité » de métriques dans la détection de deepfake.

Un graphique de connaissances simplifiĂ© illustrant comment les personnes, les lieux, les Ɠuvres d'art et les Ă©vĂ©nements peuvent ĂȘtre liĂ©s par des relations Ă©tiquetĂ©es, permettant aux machines de raisonner sur des entitĂ©s et leurs connexions rĂ©elles. Source [ https://blog.langchain.com/enhancing-rag-based-applications-accuracy-by-constructing-and-leveraging-knowledge-graphs/ 

Un graphique de connaissances simplifié illustrant comment les personnes, les lieux, les œuvres d’art et les événements peuvent être liés par des relations étiquetées, permettant aux machines de raisonner sur des entités et leurs connexions réelles. Source

Un graphique de connaissances est un moyen d’organiser les informations en cartographiant des choses du monde réel telles que des personnes, des entreprises, des événements ou des idées dans un réseau de faits connectés.

Chaque sous-entité est un nœud, et les liens entre eux (bords) décrivent comment ils se rapportent. Par exemple, « Microsoft » (un nœud) pourrait être lié à « OpenAI » (un autre nœud) par un bord qui dit « est un client de ». Ces connexions sont souvent stockées dans des bases de données graphiques et suivent une structure de sujet-prédicat-objet, telle que « Microsoft est un client d’OpenAI ».

Mémoire persistante

Une étude chinoise de septembre de cette année a proposé une méthode sans formation qui utilise un raisonnement basé sur le graphique pour détecter des incohérences subtiles dans les deepfakes multimodaux.

Au lieu de générer des raisons ou de fine-tuning de grands modèles, le système récupère des paires d’images et de texte, construit un graphique de similarité et score les connexions, afin de récupérer les exemples les plus pertinents, et ces derniers guident le jugement du modèle sans avoir besoin d’une nouvelle formation:

Une vue d'ensemble du cadre GASP-ICL, qui améliore la détection de deepfake en combinant la sélection d'échantillons basée sur le graphique avec l'apprentissage en contexte, permettant à un modÚle de vision-langage gelé de classer les paires d'images et de texte comme réelles ou fausses, sans formation ou fine-tuning.  Source [  https://www.arxiv.org/pdf/2509.21774

Une vue d’ensemble du cadre GASP-ICL, qui améliore la détection de deepfake en combinant la sélection d’échantillons basée sur le graphique avec l’apprentissage en contexte, permettant à un modèle de vision-langage gelé de classer les paires d’images et de texte comme réelles ou fausses, sans formation ou fine-tuning.  Source

Ceci est probablement le travail le plus proche, en tout cas qui a traversé mon chemin, d’une approche « informée » et consciente de l’histoire pour l’évaluation et la vérification de la sortie des médias. Pour la plupart, les approches de vision par ordinateur continuent d’analyser les images (y compris les cadres de vidéos et les anomalies temporelles qui englobent plusieurs cadres) tandis que les cadres de détection de « fausses nouvelles » continuent de mettre l’accent sur les données basées sur le texte, même dans les projets multimodaux.

Crépitation de fonctionnalités

Le défi d’un système prédictif de ce type est la portée de la surveillance qui peut être nécessaire pour rendre l’approche pleinement performante – au moins au-delà de l’analyse des célébrités et des personnalités publiques, pour lesquelles des données librement accessibles existent déjà.

Probablement le courant de recherche le plus similaire actuellement est le domaine de la pré-crime, qui étiquette divers signaux d’intelligence multimodaux comme « suspects », et se présente comme un épouvantail d’IA inébranlable dans des sorties telles que Person of Interest (2011-2016) et Minority Report (2002).

Alors qu’un système de surveillance omnivore de type Person of Interest produirait des résultats optimaux, il est peu probable que la culture occidentale puisse actuellement sanctionner le niveau d’intrusion personnelle que les réseaux internes de la Chine imposent à ses citoyens.

Par conséquent, en ce qui concerne les fausses nouvelles sur les non-célébrités, seuls les organismes gouvernementaux tels que la police (ainsi que les registres des naissances et des décès et les bureaux des impôts) auraient suffisamment d’informations historiques pour informer les probabilités dans un flux de travail basé sur le graphique ; et même eux auraient besoin d’une volonté, d’une capacité, d’une législation et de ressources de style CCCP pour inclure les citoyens ordinaires dans leur couverture et leurs analyses (c’est-à-dire au-delà des points de données banaux mais obligatoires tels que les numéros de passeport et les immatriculations de voitures).

Score de probabilité

Il semble probable que l’efficacité potentielle d’un système de ce type serait limitée aux cas d’utilisation les plus évidents (actuels) pour le contenu de deepfake: destabilisation (deepfakes soutenus par l’État) ; deepfakes de célébrités et de « inconnus » (qui peuvent être considérés comme malveillants, bien que le dernier cas tende à attirer une attention médiatique plus profonde) ; fraude (y compris les deepfakes audio/vidéo conçus pour effectuer des ‘vols d’impersonation’) ; et l’assassinat de personnalité politique.

Un système basé sur les connaissances aurait besoin d’une échelle de probabilités pour une diversité d’événements possibles. À une extrémité du spectre, les défaillances humaines courantes telles que la gestion financière douteuse, l’infidélité, la dépendance, l’indiscrétion, etc. ; à l’autre extrémité… révéler que vous êtes le fils de Dieu dans un talk-show télévisé en direct (ou des événements d’une ampleur et d’un impact similaires).

Même dans ce dernier cas, les facteurs historiques personnels pour un individu donné pondéreront le résultat de la probabilité: un personnage politique important qui a publiquement équivoqué dans des questions controversées (telles que la véracité des alunissages des années 60/70) pour gagner du capital avec un électoral de plus en plus ‘alternativement informé’ pourrait gagner un statut wildcard supplémentaire dans les routines de vérification, par rapport à ses pairs plus réservés.

Dans le cas des deepfakes de célébrités, il existe un contexte réel suffisant (c’est-à-dire les fuites de photos de célébrités de 2012, entre autres incidents rares) pour générer un Liar’s Dividend modéré, dans certains contextes ; mais puisque ces incidents de hors-la-loi ont tendance à fonctionner comme des exceptions qui prouvent la règle, la plupart des deepfakes de célébrités basés sur la diffusion actuels seraient considérés comme extrêmement « improbables » (ce qui ne résout pas le problème de l’appropriation des identités des personnes à ces fins).

En termes de perturbation nationale, il existe une richesse considérable de données statistiques qui peuvent aider à évaluer les probabilités de « rapports catastrophiques ». Même dans l’histoire ancienne, des événements apparemment « hors de propos » tels que l’éruption du volcan non identifié du Vésuve en 79 après J.-C. ont été précédés, si vous aviez prêté suffisamment attention ; et outre la disponibilité d’un grand nombre de flux de gouvernements et d’ONG, la capacité évolutive de l’IA à extraire une structure à partir de données brutes peut fournir un contexte historique supplémentaire pour le score de probabilité.

Conclusion

Même un système prédictif bien mis en œuvre de ce type ne pourrait pas tenir compte du hasard, des actes de Dieu, des occurrences accidentelles ou d’événements malveillants concoctés à l’abri de toute surveillance.

De plus, le volume et la profondeur des données nécessaires pour fournir une couverture également pour les personnes non célèbres seraient un point de contention politique – au moins, pour le moment.

Cependant, les choix semblent se rétrécir ; l’analyse basée sur la vision est sur le point de faire face à l’échec face à l’amélioration de l’IA générative, tandis que les schémas de vérification et de provenance supportent un fardeau technique accablant et une friction contre l’adoption. Cela rend des solutions telles que l’initiative Content Authenticity et le système de droit d’auteur facial non réalisé de Metaphysic.ai Metaphysic Pro, difficile à populariser.

Dans leur utilisation la plus large, les systèmes basés sur RAG ne peuvent déterminer que si une source d’autorité étaye une affirmation non vérifiée ; et puisque de nombreuses grandes histoires de nouvelles vraies émergent sans contexte préalable, un manque de preuve de la part des sources d’autorité n’est pas nécessairement significatif.

<p-Leur valeur peut se révéler plus grande s'ils peuvent faire partie d'un écosystème de données plus large concerné par la chose que la plupart des formes actuelles d'IA trouvent difficile – le contexte historique.

 

* Pas à confondre avec les premières sorties d’auto-encodeur qui ont fait leurs débuts en 2017 et qui seraient finalement supplantées par des approches supérieures.

https://arxiv.org/abs/2511.07009

** Cela peut généralement fonctionner librement sur des PC domestiques plus puissants, au lieu de n’être disponible que via des API contrôlées telles que ChatGPT et la série Veo.

††† Omettant les utilisations de divertissement légitimes, telles que les effets visuels professionnels dans les productions de films et de télévision.

Publié pour la première fois le jeudi 13 novembre 2025

Écrivain sur l'apprentissage automatique, spĂ©cialiste de domaine en synthĂšse d'images humaines. Ancien responsable du contenu de recherche chez Metaphysic.ai.