Suivez nous sur

L'IA finira-t-elle par prospérer en dehors de son système de protection ?

Angle d'Anderson

L'IA finira-t-elle par prospérer en dehors de son système de protection ?

mm
Image de dessin animé d'un jeu de type SIMS où un laird écossais, dans son château, observe avec perplexité les villageois prospères situés au-delà de ses douves. GPT-1.5.

Les coûts et les restrictions liés à l'IA de masse, ainsi que son influence sur les coûts du matériel, obligent les utilisateurs à construire leurs propres systèmes – au moment même où la réglementation croissante menace de mettre un terme à cette « économie parallèle de l'IA ».

 

Opinion Parmi les nombreux pièges qui apparaissent dans les articles de recherche scientifique, l'un des plus fréquents est que le problème abordé par l'article était déjà résolu ailleurset que la contribution de ces nouvelles recherches est purement fortuite ou incrémentale.

Cela peut arriver pour plusieurs raisons : les chercheurs espéraient une avancée majeure, mais n’ont obtenu qu’un progrès modeste ; les solutions précédentes au problème étaient plus gourmandes en ressources que la nouvelle solution ; ou tout simplement, le projet n’a pas atteint ses objectifs, mais la pression de la publication dans la recherche universitaire a contraint l’équipe à publier les résultats malgré tout (souvent de manière confidentielle). au milieu de l'avalanche (du jour de publication le plus chargé d'un portail).

Dans la littérature sur l'apprentissage automatique, cependant, une raison relativement nouvelle et assumée devient de plus en plus fréquente : que la caractéristique ou la fonctionnalité proposée est Actuellement disponible uniquement via des portails propriétaires à accès restreint par API..

J'examinais justement ce matin un article de ce genre – un collaboration entre les universités chinoises et Amazon, abordant le problème récurrent de échec de suppression de l'objet dans les systèmes de retouche d'images basés sur la diffusion, qui se contentent souvent de « remplir » l'espace cible avec un objet similaire :

À l'extrême gauche se trouve l'image originale ; à sa droite, le masque de segmentation rouge indique à l'IA quelle partie de l'image supprimer ; ensuite, « Notre solution » illustre une méthode de suppression d'objet réussie ; et les deux dernières images présentent des systèmes similaires qui, au lieu de supprimer le bus, en insèrent un autre. Source : https://arxiv.org/pdf/2603.27599v1

À l'extrême gauche se trouve l'image originale ; à sa droite, le masque de segmentation rouge qui indique à l'IA quelle partie de l'image supprimer ; ensuite, « Notre solution » illustre une méthode de suppression d'objet réussie – et les deux dernières images montrent des systèmes similaires qui, au lieu de supprimer le bus, en insèrent un autre.. Source

Dans l'exemple ci-dessus, l'image centrale montre la nouvelle approche qui permet de supprimer le bus et d'insérer un arrière-plan plausible, contrairement aux deux méthodes précédentes (les deux images de gauche) qui suppriment le bus, puis ajoutent un arrière-plan. différent Le bus réapparaît dans l'image !

Je t'ai eu!

Laissons de côté les tenants et les aboutissants de ce défi pour une autre fois (et c'est un intéressant sujet En lisant le nouvel article, je suis tombé sur un piège classique : les auteurs admettent que des systèmes propriétaires coûteux peuvent déjà effectuer cette tâche de manière tout à fait fiable – ce que je sais pour avoir utilisé Adobe pendant plusieurs années. Luciole dans Photoshop, entre autres systèmes à code source fermé :

« Les méthodes [basées sur la diffusion] hallucinent souvent en insérant des objets non intentionnels après avoir supprimé les objets cibles, ce qui conduit à des [résultats] contextuellement incohérents.

« D’autre part, les modèles multimodaux à code source fermé récents tels que ChatGPT et Nano Banana, bien que plus puissants en matière d’effacement d’objets, impliquent un grand nombre de paramètres et une surcharge de calcul importante, ce qui entrave leur déploiement pratique sur les appareils périphériques. »

« Il est donc tout à fait nécessaire de développer un modèle d'effacement d'objets dédié qui permette non seulement d'obtenir des performances d'effacement supérieures, mais aussi de bénéficier d'une faible latence d'inférence et d'un nombre de paramètres nettement inférieur. »

Cette explication, qui se concentre sur les obstacles techniques, occulte le fait évident que les architectures à code source fermé telles que ChatGPT et Nano Banana ne sont pas disponibles. du tout pour une installation locale. Bien que de tels systèmes capacité à produire des documents controversés Ces portails, qui ont donné une justification publique supplémentaire à leur contrôle d'accès au cours de l'année écoulée, sont principalement propriétaires en raison d'impératifs commerciaux.

En substance, ce nouvel article laisse entendre que même si le problème ciblé est résolu dans les systèmes commerciaux, Cela n'a peut-être aucune importance pour le reste d'entre nous., qui doivent apprendre à résoudre ce problème dans le « monde réel » – c’est-à-dire dans des systèmes open source, qu’ils puissent être installés localement ou non.

Développement parallèle

Cependant, pourquoi résoudre un problème qui dépend encore d'un système payant, non pas en raison de contraintes propriétaires, mais parce que la puissance de calcul GPU requise dépasse les capacités réalistes de toute configuration locale ? La plupart de ces nouveaux articles et dépôts de code « ouverts » présentent des configurations d'entraînement/d'inférence aux exigences de ressources exorbitantes, comme des clusters d'A100.

Eh bien, cela dépend de quel côté vous pensez que tous ces en attente, centres de données d'IA à fort impact économique Ces craintes se concrétiseront lorsqu'elles seront enfin mises en ligne. Les gens ordinaires comme les élites envisagent la mise en place de systèmes propriétaires, protégés par des douves et comparables à ChatGPT, qui supprimeront des emplois, tout en augmentant constamment les coûts d'abonnement et en réduisant la qualité des services, afin de satisfaire les premiers investisseurs en capital-risque qui ont dû attendre 3 à 5 ans avant de pouvoir les rendre opérationnels.

Mais une tendance croissante dans la littérature semble soutenir un avenir alternatif, et l'esprit marginal et individualiste de nombreuses communautés en ligne telles que le subreddit r/stablediffusion, qui compte actuellement 920 000 utilisateurs et qui interdit depuis longtemps les publications relatives aux systèmes de génération d'images/vidéos à code source fermé.

Dans ce futur alternatif, la nouvelle offre mondiale de centres de données d'IA facilitera la puissance de calcul brute pour les systèmes configurés et définis par l'utilisateur, plutôt que de répondre aux exigences de frameworks « boîte noire » monumentaux tels que ChatGPT et Adobe Firefly.

Frottement superficiel

En parcourant les tutoriels complexes sur les GPU à distance, extraits de Patreon et disponibles sur r/stablediffusion, tout semble impossible pour le moment : les modèles sont changer constamment les règles du jeu à chaque mise à jour ; leur déploiement local est difficile, même dans les frameworks les plus simples et les plus conviviaux ; et, en général, le niveau de friction impliqué suggère une activité réservée aux passionnés d’informatique et à cette catégorie plus audacieuse d’entreprises non directement impliquées dans l’IA, mais qui souhaitent développer et maintenir leurs propres systèmes locaux, au lieu de louer de telles capacités.

Cependant, au cours des trente dernières années, toutes les technologies pour lesquelles il existait une forte demande de simplification et de marchandisation ouvertes et démocratiques ont connu une telle évolution. a eu tendance à l'obtenirLes solutions les plus répandues émergent généralement des tensions entre les systèmes commerciaux et les alternatives et initiatives open source.

Des activités qui étaient autrefois réservées à des « nerds » spécialisés, comme les connexions internet, les systèmes de gestion de contenu et les plateformes de blogs, ainsi que la sécurité internet, la photographie et la gestion des médias, ont toutes évolué d'une complexité déroutante vers la simplicité et l'utilité.

Par conséquent, le paysage de l'IA à venir pourrait être plus diversifié et comporter davantage d'acteurs plus petits et véritablement concurrents que ne le souhaiteraient les leaders actuels du marché de l'IA.

L'accomplissement de soi, par nécessité

Paradoxalement, la « Big IA » contribue largement à l'émergence d'un esprit d'indépendance chez les utilisateurs finaux, en accaparant pour ses centres de données tous les composants informatiques – en particulier la DRAM – qui autrement seraient allés aux consommateurs « ordinaires ».

Par conséquent, nombreux sont ceux qui envisagent un avenir où les ressources d'« IA mondiale » à code source fermé seront accessibles via des clients légers sous-dimensionnés. développer un intérêt croissant dans l'entretien de leur équipement existant.

L’offensive de l’IA sur les chaînes d’approvisionnement technologiques a également contraint les fournisseurs de services technologiques à augmenter leurs prix Ces 3 à 6 derniers mois, soit parce que les petites entreprises sont réellement mises à rude épreuve par la pénurie de matériel, soit simplement… parce que l'IA.

Cela a conduit à une croissance de l'intérêt pour l'auto-hébergement et sur site – y compris réseaux d'apprentissage automatique auto-hébergés.

Je me suis moi-même laissé prendre au piège récemment, en migrant vers un stockage local (LAN) pour mes photos et vidéos, ainsi que pour mes sauvegardes de fichiers. Pour les photos et vidéos, j'utilise le serveur multimédia multiplateforme gratuit et open source Immich, ce qui m'a permis d'éviter les hausses de prix (et autres problèmes préoccupants) d'iCloud et d'autres fournisseurs de stockage cloud :

La plateforme gratuite Immich permet de stocker vos fichiers multimédias sur votre matériel et de les rendre privés sur vos propres chaînes. Dans mon cas, j'utilise également Immich sur Docker pour diffuser les données de ma carte graphique NVIDIA 3090 sur le réseau local où sont enregistrées les photos et vidéos. Ainsi, la puissance de cette carte graphique supérieure peut gérer les traitements d'images et de vidéos les plus exigeants.

La plateforme gratuite Immich permet de stocker vos fichiers multimédias sur votre matériel et de les rendre privés sur vos propres chaînes. Dans mon cas, j'utilise également Immich sur Docker pour déployer mon GPU NVIDIA 3090 sur le réseau local où sont enregistrées les photos et vidéos. Ainsi, le GPU plus puissant peut gérer les traitements d'images et de vidéos complexes nécessitant une intelligence artificielle.

Si mon expérience personnelle est un indicateur représentatif, codage d'ambiance - actuellement maudit dans de nombreuses communautés en ligne autrefois « pures » – alimente cette vague d'indépendance (même si elle peut menacer les dépôts open source sur lesquels il s'appuie).

Par exemple, la mise en réseau a toujours été mon point faible en informatique, l'assistance de l'IA était donc essentielle pour que je puisse mettre en place un VPS sécurisé, afin de prendre en charge une série de nouveaux services auto-hébergés.

Ainsi, l’« intelligence artificielle à grande échelle » donne sans doute plus de pouvoir à l’« intelligence artificielle à petite échelle » ; par conséquent, on peut peut-être considérer l’essor actuel des entreprises d’IA hyperscale et hypervalorisées comme un état transitoire nécessaire, mais seulement transitoire, avant l’émergence d’une société de l’IA plus démocratique et axée sur l’utilisateur, qui se débarrassera des entreprises cherchant à se créer un avantage concurrentiel durable et à s’enrichir par rente, comme de vieux propulseurs usés – à l’instar de l’éclatement de la bulle Internet en 2000. infrastructure exploitable laissée derrière ce qui accélérerait considérablement le développement du web, bien après la faillite des entreprises qui l'ont financé.

L'ère de la conformité

Bon, cela ne va probablement pas se reproduire cette fois-ci.

Même si nous Ces enclins à former une sorte de ex-douves société marginale, réglementation de l'IA, combinée à tendance mondiale actuelle vers la vérification de l'âge, semble susceptible d'anticiper et de bloquer ces voies de développement.

Le pilier de la prévention d'une « économie parallèle de l'IA » réside dans la réglementation. Déjà, des référentiels centraux tels que GitHub et Étreindre le visage En fonction des paramètres du dépôt, une connexion en ligne est souvent requise avant d'autoriser les utilisateurs à cloner des dépôts localement.

Par conséquent, des mécanismes existent déjà pour étendre la surveillance des cadres d'IA à un niveau plus global que celui actuellement en vigueur ; et vont Le renforcement de ce contrôle passe désormais par la consolidation d'initiatives gouvernementales individuelles. dans une impulsion mondiale.

Ainsi, si les forces du marché et l'ingéniosité du mouvement FOSS parviennent à lever les obstacles au déploiement occasionnel de l'IA, des freins semblent sur le point de réapparaître sous la forme de exigences de gouvernance: des exigences de conformité qui, bien que contraignantes, sont utiles aux entreprises, mais peut-être pas aux particuliers – similaires aux difficultés qui se sont ajoutées aux systèmes de paiement en ligne destinés aux consommateurs depuis… L'âge d'or de PayPal dans les 2000s.

Que ce soit Meta 2 milliards de dollars ont été dépensés en lobbying pour le contrôle de l'âge au niveau du système d'exploitation. en raison de leurs investissements importants dans l'IA, ou de leurs intérêts en matière de collecte de données, le résultat des géants de la tech soutien au contrôle de l'âge Il se pourrait que l'IA « locale » devienne aussi réglementée qu'une substance de classe A ; et, tout comme le DMCA l'était conçu pour criminaliser intention Plutôt qu'un mécanisme particulier de contournement des droits d'auteur, les réglementations internationales en matière d'IA pourraient, dans un tel scénario, faire de toute utilisation non conforme de l'apprentissage automatique un acte illégal, à un coût très faible (en termes de surveillance active).

Cela aurait pu paraître une vision excessivement dystopique il y a un an – mais c'était avant La Californie et systemd ont soutenu l'idée d'une vérification de l'âge au niveau matériel, actuellement vu par beaucoup comme substitut à un style PCC interdire sur l'anonymat en ligne.

Conclusion

Ainsi, tandis que le contexte juridique et législatif se prépare peut-être à intégrer l'IA dans un espace hautement réglementé, de sorte que les utilisateurs occasionnels ne puissent pas plus « faire leurs propres créations » qu'ils ne peuvent cultiver ou fermenter des substances réglementées sans autorisation, le secteur de la recherche maintient sa position plus optimiste : l'IA deviendra une force démocratisée et bénéfique pour la société en général, et pas seulement pour les adeptes du fournisseur propriétaire le plus populaire du moment.

Beaucoup dépendra de la façon dont les choses évolueront après l'éclatement de la bulle de l'IA – du moins dans la mesure où les fournisseurs se regrouperont ou que le marché se stabilisera dans une balkanisation à long terme – ce qui nécessiterait probablement une intervention réglementaire plus douce.

 

Première publication le mercredi 1 avril 2026

Rédacteur en apprentissage automatique, spécialiste du domaine de la synthèse d'images humaines. Ancien responsable du contenu de recherche chez Metaphysic.ai.
Site personnel : martinanderson.ai
Contact [email protected]
Twitter : @manders_ai