Suivez nous sur

Pourquoi la confidentialité des données sera le problème technologique déterminant de 2024

Des leaders d'opinion

Pourquoi la confidentialité des données sera le problème technologique déterminant de 2024

mm

Sous les projecteurs du monde de la technologie, les chatbots basĂ©s sur l’IA comme ChatGPT attirent l’attention et remodèlent les industries telles que nous les connaissons. Ă€ chaque avancĂ©e, les rĂ´les traditionnels deviennent obsolètes : les rĂ©dacteurs, les gourous du marketing et mĂŞme les experts en informatique se retrouvent sur le billot. Rien qu’en juin 2023, un nombre stupĂ©fiant de 3,900 XNUMX AmĂ©ricains perdu leurs tâches Ă  l'IA. Pourtant, cette perturbation n’est qu’un prĂ©lude Ă  ce qui nous attend.

Alors que l’IA poursuit ses conquêtes dans tous les secteurs, une vague d’appréhension grandit concernant les atteintes au droit d’auteur et à la vie privée. La question est vaste : comment pouvons-nous assurer un équilibre délicat entre progrès et confidentialité ?

Des Ă©tincelles d’inquiĂ©tude 

Pour commencer, laissez-moi vous expliquer comment fonctionnent les modèles d'IA tels que ChatGPT. Ils gĂ©nèrent des rĂ©sultats Ă  partir des donnĂ©es apprises lors de leur apprentissage. Si le modèle peut crĂ©er un texte qui semble avoir Ă©tĂ© Ă©crit par Shakespeare dans le style de la littĂ©rature anglaise traditionnelle, cela signifie qu'il a dĂ©jĂ  « vu Â» ce contenu lors de sa phase de prĂ©paration, avant sa publication.

En fait, les algorithmes d’apprentissage automatique (ML) derrière chaque modèle d’IA sont entraĂ®nĂ©s sur de grandes quantitĂ©s de donnĂ©es pour fonctionner correctement. Par exemple, il existe des systèmes qui aident les mĂ©decins dans leurs diagnostics : ils analysent les tomodensitogrammes et dĂ©tectent des anomalies pouvant indiquer des maladies spĂ©cifiques telles que le cancer du poumon. Ils sont gĂ©nĂ©ralement formĂ©s sur des millions d’images mĂ©dicales. Sans cela, ils ne pourraient pas reconnaĂ®tre les artefacts sur les scans. 

Alors que la demande d’outils d’IA augmente de façon exponentielle, les géants de la technologie collectent de plus en plus de grandes quantités de données pour entraîner leurs modèles. Et parfois, ces données incluent des informations sensibles sur des personnes et des organisations. De plus, il est souvent obtenu en grattant des millions de pages Web sans aucun accord des propriétaires.

Cela suscite des inquiĂ©tudes du public concernant la confidentialitĂ©, la transparence et le contrĂ´le des informations personnelles sur Internet. UN Sondage Deloitte 2023 dĂ©voilĂ© que la majoritĂ© des personnes interrogĂ©es recherchent davantage de protection et de contrĂ´le sur la manière dont leurs donnĂ©es sont utilisĂ©es. Près de neuf personnes sur dix ont exprimĂ© le souhait de consulter et de supprimer les donnĂ©es collectĂ©es, et 10 % d'entre elles estiment mĂ©riter une compensation pour les entreprises qui profitent de leurs donnĂ©es. Aux États-Unis seulement, les citoyens ont grandi davantage inquiet sur la manière dont leurs donnĂ©es sont utilisĂ©es, avec environ sept adultes amĂ©ricains sur dix (71 %) partageant ces prĂ©occupations, contre 64 % en 2019. 

Batailles juridiques 

De plus, certaines organisations portent ces questions devant les tribunaux. Selon Fortune, en novembre 2023, il y avait ont été plus de 100 procès liés à l’IA naviguant dans le système juridique. Ces affaires couvrent un large éventail de préoccupations, notamment des litiges en matière de propriété intellectuelle, la propagation de contenus préjudiciables et des cas de discrimination.

Parmi ces cas figuraient des poursuites intentées par des artistes qui accusaient les développeurs de modèles d'apprentissage profond et de conversion texte-image tels que Stable Diffusion et Midjourney d'utiliser leur art numérique dans la formation à l'IA sans consentement. Ils argumenté que les entreprises à l'origine de ces produits avaient collecté des milliards d'images sur Internet, y compris les leurs, pour demander aux modèles de générer leurs propres images.

En décembre 2023, le grand journal américain The New York Times s’est lancé dans ces batailles juridiques en poursuivant OpenAI, le développeur à l’origine du florissant ChatGPT, pour violation du droit d’auteur. Le procès souligné que des millions d'articles publiés par les médias ont été utilisés pour former des chatbots automatisés, qui rivalisent désormais avec les médias en tant que source d'informations fiables.

Problèmes futurs 

En rĂ©ponse Ă  ces prĂ©occupations pressantes, les gouvernements du monde entier se mobilisent pour faire face aux inquiĂ©tudes du public. Par exemple, des reprĂ©sentants de douze organismes de rĂ©glementation dans le monde Ă©mis une dĂ©claration commune en aoĂ»t 2023, axĂ©e sur le grattage des donnĂ©es et la protection de la vie privĂ©e. La dĂ©claration provient des autoritĂ©s d'Argentine, d'Australie, du Canada, de Colombie, de Hong Kong, de Jersey, du Mexique, du Maroc, de Nouvelle-ZĂ©lande, de Norvège, de Suisse et du Royaume-Uni. Pendant ce temps, en Californie, le Delete Act Ă©tait signĂ© dans la loi, ciblant les courtiers en donnĂ©es et Ă©tablissant des rĂ©glementations supplĂ©mentaires pour la collecte et la gestion des donnĂ©es personnelles. 

Malgré des efforts concertés, je prévois que les préoccupations en matière de confidentialité et de propriété des données conserveront leur importance dans le discours public tout au long de 2024 et au-delà. De plus, l’augmentation des poursuites en matière de propriété intellectuelle n’est que la pointe de l’iceberg. Nous assisterons probablement à une augmentation du nombre d’affaires portant sur l’exactitude et la sécurité des données, en particulier dans un contexte de prolifération effrénée des deepfakes et de la désinformation.

Si les secteurs public et privé doivent redoubler d'efforts, la prudence est de mise. Malgré des appréhensions croissantes, il convient de souligner que les données ouvertes continuent de jouer un rôle essentiel dans la recherche et le développement. Prenons par exemple le rôle précieux joué par l'accès public aux dossiers médicaux pendant la crise de la COVID-19, accélérant le développement de percées médicales vitales, telles que les vaccins mis au point par Moderna et Pfizer.

L’importance des données ouvertes est soulignée par l’exemple historique du projet américain sur le génome humain, où le partage public des données génétiques a transformé la recherche en génétique. De la même manière, l’analyse et l’apprentissage des données par l’IA peuvent bénéficier à la société, qu’il s’agisse de catégoriser les mutations génétiques ou de relever des défis urgents comme le changement climatique.

En entreprise, les données collectées par les web scrapers sont inestimables pour l’intelligence du marché, le suivi des concurrents et la reconnaissance des tendances dominantes. Si le web scraping devient plus restreint, les entreprises pourraient être confrontées à un accès limité à des données vitales pour prendre des décisions éclairées, ce qui pourrait conduire à une réduction de la concurrence et de la transparence des prix, à un obstacle à l'innovation et à une expérience utilisateur médiocre en raison d'une mise à jour des données plus lente et moins précise.

Pourtant, face à ces défis croissants, il existe des solutions pour les affronter de front. Je fais confiance aux proxys pour naviguer dans ces eaux troubles. Ces technologies innovantes masquent les adresses IP d'origine des utilisateurs, canalisant leurs activités en ligne vers des serveurs alternatifs. Non seulement elles renforcent la sécurité des données, mais elles s'avèrent également des outils indispensables pour concilier progrès technologique et protection des libertés individuelles.

William Belov est le PDG de Infatique, un rĂ©seau proxy mondial de premier plan. Son expĂ©rience couvre les investissements, les fusions et acquisitions, ainsi que diverses technologies, le tout soutenu par une attention particulière portĂ©e au dĂ©veloppement commercial. William est titulaire de deux diplĂ´mes de mĂ©decine et d'un EMBA.