Leader del pensiero
Perché la privacy dei dati sarà il problema tecnologico determinante del 2024
Sotto i riflettori del mondo tecnologico, i chatbot basati sull’intelligenza artificiale come ChatGPT stanno attirando l’attenzione, rimodellando i settori come li conosciamo. Con ogni progresso, i ruoli tradizionali stanno svanendo verso l’obsolescenza: scrittori, guru del marketing e persino esperti IT si ritrovano sul ceppo. Solo nel giugno 2023, l’incredibile cifra di 3,900 americani perso il loro lavoro all'intelligenza artificiale. Tuttavia, questa interruzione è semplicemente un preludio a ciò che ci aspetta.
Mentre l’intelligenza artificiale continua le sue conquiste in tutti i settori, cresce un’ondata di apprensione per quanto riguarda la violazione del copyright e della privacy. La domanda incombe: come possiamo garantire un delicato equilibrio tra progresso e privacy?
Scintille di preoccupazione
Per iniziare, vorrei spiegare come funzionano i modelli di intelligenza artificiale come ChatGPT. Generano risultati basati sui dati appresi durante l'addestramento. Se il modello riesce a creare un testo che sembra scritto da Shakespeare nello stesso stile della letteratura inglese, significa che ha già "visto" quel contenuto durante la fase di preparazione, prima della sua pubblicazione.
In effetti, gli algoritmi di machine learning (ML) alla base di ogni modello di intelligenza artificiale sono addestrati su grandi quantità di dati per funzionare bene. Ad esempio, esistono sistemi che aiutano i medici nella diagnostica: analizzano le scansioni TC e trovano anomalie che possono indicare malattie specifiche come il cancro ai polmoni. Di solito vengono addestrati su milioni di immagini mediche. Senza ciò non potrebbero riconoscere gli artefatti sulle scansioni.
Poiché la domanda di strumenti di intelligenza artificiale aumenta in modo esponenziale, i giganti della tecnologia raccolgono sempre più grandi quantità di dati per addestrare i loro modelli. E a volte tali dati includono informazioni sensibili su persone e organizzazioni. Inoltre, spesso viene ottenuto raschiando milioni di pagine web senza alcun accordo da parte dei proprietari.
Ciò suscita preoccupazioni nell’opinione pubblica in merito alla privacy, alla trasparenza e al controllo sulle informazioni personali su Internet. UN Sondaggio Deloitte 2023 svelato che la maggior parte degli intervistati cerca maggiore protezione e controllo sul modo in cui vengono utilizzati i propri dati. Quasi nove su 10 hanno espresso il desiderio di visualizzare ed eliminare i dati raccolti, e l’80% ritiene di meritare un compenso per le aziende che traggono profitto dai propri dati. Solo negli Usa i cittadini sono cresciuti di più preoccupato su come vengono utilizzati i loro dati, con circa sette adulti statunitensi su dieci (71%) che condividono queste preoccupazioni, rispetto al 64% del 2019.
Battaglie legali
Inoltre, alcune organizzazioni stanno portando questi problemi in tribunale. Secondo Fortune, a novembre 2023, lì sono stati oltre 100 cause legali legate all’intelligenza artificiale che attraversano il sistema legale. Questi casi coprono una serie di preoccupazioni, tra cui controversie sulla proprietà intellettuale, diffusione di contenuti dannosi e casi di discriminazione.
Tra questi casi c'erano azioni legali intentate da artisti che accusavano gli sviluppatori di modelli di deep learning e text-to-image come Stable Diffusion e Midjourney di utilizzare la loro arte digitale nella formazione sull'intelligenza artificiale senza consenso. Essi sostenuto che le aziende dietro questi prodotti avevano raccolto miliardi di immagini da Internet, comprese le loro, per istruire i modelli a generare le proprie immagini.
Nel dicembre 2023, il principale quotidiano americano The New York Times è entrato in queste battaglie legali facendo causa a OpenAI, lo sviluppatore dietro il fiorente ChatGPT, per violazione del copyright. La causa enfatizzato che milioni di articoli pubblicati dalle organizzazioni dei media sono stati utilizzati per addestrare chatbot automatizzati, che ora rivaleggiano con i notiziari come fonte di informazioni affidabili.
Problemi futuri
In risposta a queste pressanti preoccupazioni, i governi di tutto il mondo si stanno mobilitando per affrontare le ansie pubbliche. Ad esempio, i rappresentanti di dodici organismi di regolamentazione a livello globale rilasciato una dichiarazione congiunta nell'agosto 2023, incentrata sullo scraping dei dati e sulla protezione della privacy. La dichiarazione è arrivata dalle autorità di Argentina, Australia, Canada, Colombia, Hong Kong, Jersey, Messico, Marocco, Nuova Zelanda, Norvegia, Svizzera e Regno Unito. Nel frattempo, in California, è stato adottato il Delete Act firmato in legge, prendendo di mira gli intermediari di dati e stabilendo norme aggiuntive per la raccolta e la gestione dei dati personali.
Nonostante gli sforzi concertati, prevedo che le preoccupazioni sulla privacy e sulla proprietà dei dati manterranno la loro importanza nel discorso pubblico per tutto il 2024 e oltre. Inoltre, l’aumento delle cause legali sulla proprietà intellettuale segnala solo la punta dell’iceberg. Probabilmente assisteremo a un aumento dei casi incentrati sull’accuratezza e sulla sicurezza dei dati, in particolare nel contesto della dilagante proliferazione di deepfake e disinformazione.
Sebbene sia il settore pubblico che quello imprenditoriale debbano raddoppiare i loro sforzi, un approccio cauto è imperativo. Nonostante le crescenti preoccupazioni, vale la pena notare che i dati aperti continuano a svolgere un ruolo fondamentale nel promuovere la ricerca e lo sviluppo. Si pensi, ad esempio, al ruolo inestimabile che l'accesso pubblico alle cartelle cliniche ha svolto durante la crisi del COVID-19, accelerando lo sviluppo di innovazioni mediche salvavita come i vaccini sviluppati da Moderna e Pfizer.
L’importanza dei dati aperti è sottolineata dall’esempio storico del Progetto Genoma Umano degli Stati Uniti, dove la condivisione pubblica dei dati genetici ha trasformato la ricerca genetica. In modo simile, l’analisi dell’intelligenza artificiale e l’apprendimento dai dati possono apportare benefici alla società, dalla categorizzazione delle mutazioni genetiche all’affrontare sfide urgenti come il cambiamento climatico.
Negli affari, i dati raccolti dai web scraper sono preziosi per l’intelligence del mercato, il monitoraggio della concorrenza e il riconoscimento delle tendenze prevalenti. Se il web scraping diventa più limitato, le aziende potrebbero trovarsi ad affrontare un accesso limitato a dati vitali per prendere decisioni informate, portando potenzialmente a una riduzione della concorrenza e della trasparenza nei prezzi, ostacoli all’innovazione e un’esperienza utente scadente a causa di un aggiornamento dei dati più lento e meno accurato.
Eppure, nonostante queste crescenti sfide, esistono strade per affrontarle a testa alta. Ripongo la mia fiducia nel potere dei proxy per navigare in queste acque turbolente. Queste tecnologie innovative mascherano gli indirizzi IP originali degli utenti, incanalando le loro attività online attraverso server alternativi. Non solo rafforzano la sicurezza dei dati, ma si rivelano anche strumenti indispensabili per armonizzare il progresso tecnologico con la tutela delle libertà individuali.












