Intelligence artificielle
Extraction de données d’entraînement à partir de modèles de diffusion stables affinés

De nouvelles recherches menées aux États-Unis présentent une méthode pour extraire des portions importantes de données d’entraînement à partir de modèles affinés.
Cela pourrait potentiellement fournir des preuves légales dans les cas où le style d’un artiste a été copié, ou où des images protégées par le droit d’auteur ont été utilisées pour entraîner des modèles génératifs de personnalités publiques, de personnages protégés par la propriété intellectuelle, ou d’autres contenus.

À partir du nouveau document : les images d’entraînement originales sont visibles dans la rangée supérieure, et les images extraites sont représentées dans la rangée inférieure. Source : https://arxiv.org/pdf/2410.03039
De tels modèles sont largement et librement disponibles sur Internet, principalement grâce aux archives énormes contribuées par les utilisateurs de civit.ai, et dans une moindre mesure, sur la plateforme de référentiel Hugging Face.
Le nouveau modèle développé par les chercheurs s’appelle FineXtract, et les auteurs affirment qu’il obtient des résultats de pointe dans cette tâche.












