Des leaders d'opinion
Pourquoi la confidentialité des données sera le problème technologique déterminant de 2024

Sous les projecteurs du monde de la technologie, les chatbots basés sur l’IA comme ChatGPT attirent l’attention et remodèlent les industries telles que nous les connaissons. À chaque avancée, les rôles traditionnels deviennent obsolètes : les rédacteurs, les gourous du marketing et même les experts en informatique se retrouvent sur le billot. Rien qu’en juin 2023, un nombre stupéfiant de 3,900 XNUMX Américains perdu leurs tâches à l'IA. Pourtant, cette perturbation n’est qu’un prélude à ce qui nous attend.
Alors que l’IA poursuit ses conquêtes dans tous les secteurs, une vague d’appréhension grandit concernant les atteintes au droit d’auteur et à la vie privée. La question est vaste : comment pouvons-nous assurer un équilibre délicat entre progrès et confidentialité ?
Des étincelles d’inquiétude
Pour commencer, laissez-moi vous expliquer comment fonctionnent les modèles d'IA tels que ChatGPT. Ils génèrent des résultats à partir des données apprises lors de leur apprentissage. Si le modèle peut créer un texte qui semble avoir été écrit par Shakespeare dans le style de la littérature anglaise traditionnelle, cela signifie qu'il a déjà « vu » ce contenu lors de sa phase de préparation, avant sa publication.
En fait, les algorithmes d’apprentissage automatique (ML) derrière chaque modèle d’IA sont entraînés sur de grandes quantités de données pour fonctionner correctement. Par exemple, il existe des systèmes qui aident les médecins dans leurs diagnostics : ils analysent les tomodensitogrammes et détectent des anomalies pouvant indiquer des maladies spécifiques telles que le cancer du poumon. Ils sont généralement formés sur des millions d’images médicales. Sans cela, ils ne pourraient pas reconnaître les artefacts sur les scans.
Alors que la demande d’outils d’IA augmente de façon exponentielle, les géants de la technologie collectent de plus en plus de grandes quantités de données pour entraîner leurs modèles. Et parfois, ces données incluent des informations sensibles sur des personnes et des organisations. De plus, il est souvent obtenu en grattant des millions de pages Web sans aucun accord des propriétaires.
Cela suscite des inquiétudes du public concernant la confidentialité, la transparence et le contrôle des informations personnelles sur Internet. UN Sondage Deloitte 2023 dévoilé que la majorité des personnes interrogées recherchent davantage de protection et de contrôle sur la manière dont leurs données sont utilisées. Près de neuf personnes sur dix ont exprimé le souhait de consulter et de supprimer les données collectées, et 10 % d'entre elles estiment mériter une compensation pour les entreprises qui profitent de leurs données. Aux États-Unis seulement, les citoyens ont grandi davantage inquiet sur la manière dont leurs données sont utilisées, avec environ sept adultes américains sur dix (71 %) partageant ces préoccupations, contre 64 % en 2019.
Batailles juridiques
De plus, certaines organisations portent ces questions devant les tribunaux. Selon Fortune, en novembre 2023, il y avait ont été plus de 100 procès liés à l’IA naviguant dans le système juridique. Ces affaires couvrent un large éventail de préoccupations, notamment des litiges en matière de propriété intellectuelle, la propagation de contenus préjudiciables et des cas de discrimination.
Parmi ces cas figuraient des poursuites intentées par des artistes qui accusaient les développeurs de modèles d'apprentissage profond et de conversion texte-image tels que Stable Diffusion et Midjourney d'utiliser leur art numérique dans la formation à l'IA sans consentement. Ils argumenté que les entreprises à l'origine de ces produits avaient collecté des milliards d'images sur Internet, y compris les leurs, pour demander aux modèles de générer leurs propres images.
En décembre 2023, le grand journal américain The New York Times s’est lancé dans ces batailles juridiques en poursuivant OpenAI, le développeur à l’origine du florissant ChatGPT, pour violation du droit d’auteur. Le procès souligné que des millions d'articles publiés par les médias ont été utilisés pour former des chatbots automatisés, qui rivalisent désormais avec les médias en tant que source d'informations fiables.
Problèmes futurs
En réponse à ces préoccupations pressantes, les gouvernements du monde entier se mobilisent pour faire face aux inquiétudes du public. Par exemple, des représentants de douze organismes de réglementation dans le monde émis une déclaration commune en août 2023, axée sur le grattage des données et la protection de la vie privée. La déclaration provient des autorités d'Argentine, d'Australie, du Canada, de Colombie, de Hong Kong, de Jersey, du Mexique, du Maroc, de Nouvelle-Zélande, de Norvège, de Suisse et du Royaume-Uni. Pendant ce temps, en Californie, le Delete Act était signé dans la loi, ciblant les courtiers en données et établissant des réglementations supplémentaires pour la collecte et la gestion des données personnelles.
Malgré des efforts concertés, je prévois que les préoccupations en matière de confidentialité et de propriété des données conserveront leur importance dans le discours public tout au long de 2024 et au-delà . De plus, l’augmentation des poursuites en matière de propriété intellectuelle n’est que la pointe de l’iceberg. Nous assisterons probablement à une augmentation du nombre d’affaires portant sur l’exactitude et la sécurité des données, en particulier dans un contexte de prolifération effrénée des deepfakes et de la désinformation.
Si les secteurs public et privé doivent redoubler d'efforts, la prudence est de mise. Malgré des appréhensions croissantes, il convient de souligner que les données ouvertes continuent de jouer un rôle essentiel dans la recherche et le développement. Prenons par exemple le rôle précieux joué par l'accès public aux dossiers médicaux pendant la crise de la COVID-19, accélérant le développement de percées médicales vitales, telles que les vaccins mis au point par Moderna et Pfizer.
L’importance des données ouvertes est soulignée par l’exemple historique du projet américain sur le génome humain, où le partage public des données génétiques a transformé la recherche en génétique. De la même manière, l’analyse et l’apprentissage des données par l’IA peuvent bénéficier à la société, qu’il s’agisse de catégoriser les mutations génétiques ou de relever des défis urgents comme le changement climatique.
En entreprise, les données collectées par les web scrapers sont inestimables pour l’intelligence du marché, le suivi des concurrents et la reconnaissance des tendances dominantes. Si le web scraping devient plus restreint, les entreprises pourraient être confrontées à un accès limité à des données vitales pour prendre des décisions éclairées, ce qui pourrait conduire à une réduction de la concurrence et de la transparence des prix, à un obstacle à l'innovation et à une expérience utilisateur médiocre en raison d'une mise à jour des données plus lente et moins précise.
Pourtant, face à ces défis croissants, il existe des solutions pour les affronter de front. Je fais confiance aux proxys pour naviguer dans ces eaux troubles. Ces technologies innovantes masquent les adresses IP d'origine des utilisateurs, canalisant leurs activités en ligne vers des serveurs alternatifs. Non seulement elles renforcent la sécurité des données, mais elles s'avèrent également des outils indispensables pour concilier progrès technologique et protection des libertés individuelles.