Leader di pensiero
Perché la privacy dei dati sarà la questione tecnologica definitiva del 2024
Sotto i riflettori del mondo tecnologico, chatbot guidati dall’intelligenza artificiale come ChatGPT stanno attirando l’attenzione, ridisegnando le industrie come le conosciamo. Con ogni avanzamento, i ruoli tradizionali stanno scomparendo – scrittori, guru del marketing, addirittura gli esperti di IT si trovano sul blocco dei tagli. Nel giugno 2023 solo, un numero sbalorditivo di 3.900 americani hanno perso il loro lavoro a causa dell’AI. Eppure, questa disruption è solo un preludio a ciò che ci attende.
Mentre l’AI continua le sue conquiste attraverso le industrie, una onda di apprensione si sta formando riguardo alla violazione del copyright e alle violazioni della privacy. La domanda si pone in modo preoccupante: come possiamo garantire un equilibrio delicato tra progresso e privacy?
Scintille di preoccupazione
Per iniziare, lasciate che vi spieghi come funzionano i modelli di AI come ChatGPT. Essi generano risultati in base ai dati che apprendono durante l’addestramento. Se il modello può creare testi che sembrano essere stati scritti da Shakespeare nello stile della vecchia letteratura inglese, significa che ha già “visto” quel contenuto prima durante il periodo di preparazione, prima del suo rilascio.
In realtà, gli algoritmi di apprendimento automatico (ML) dietro ogni modello di AI sono addestrati su grandi quantità di dati per eseguire bene. Ad esempio, ci sono sistemi che aiutano i medici nella diagnostica – analizzano le scansione TC e trovano anomalie che possono indicare malattie specifiche come il cancro ai polmoni. Sono solitamente addestrati su milioni di immagini mediche. Senza di esse, non potrebbero riconoscere artefatti sulle scansioni.
Mentre la domanda di strumenti di AI aumenta esponenzialmente, i giganti della tecnologia stanno raccogliendo sempre più dati per addestrare i loro modelli. E a volte quei dati includono informazioni sensibili su persone e organizzazioni. Inoltre, sono spesso ottenuti attraverso lo scraping di milioni di pagine web senza alcun accordo con i proprietari.
Ciò scatena preoccupazioni pubbliche sulla privacy, sulla trasparenza e sul controllo delle informazioni personali su Internet. Un sondaggio Deloitte del 2023 ha rivelato che la maggioranza dei rispondenti cerca una maggiore protezione e controllo su come vengono utilizzati i loro dati. Quasi nove su dieci hanno espresso il desiderio di visualizzare e cancellare i dati raccolti, con l’80% che si sente meritevole di un indennizzo per le aziende che traggono profitto dai loro dati. Negli Stati Uniti solo, i cittadini sono diventati più preoccupati su come vengono utilizzati i loro dati, con circa sette adulti su dieci (71%) che condividono queste preoccupazioni, in aumento rispetto al 64% del 2019.
Battaglie legali
Inoltre, alcune organizzazioni stanno portando queste questioni in tribunale. Secondo Fortune, a novembre 2023, c’erano oltre 100 cause legate all’AI in corso nel sistema giudiziario. Questi casi coprono una gamma di preoccupazioni, tra cui dispute sulla proprietà intellettuale, la diffusione di contenuti dannosi e casi di discriminazione.
Tra questi casi c’erano cause intentate da artisti che accusavano gli sviluppatori di apprendimento profondo e modelli di testo-immagine come Stable Diffusion e Midjourney di utilizzare la loro arte digitale per l’addestramento dell’AI senza il loro consenso. hanno sostenuto che le aziende dietro questi prodotti avevano raccolto miliardi di immagini da Internet, tra cui le loro, per istruire i modelli a generare le proprie immagini.
A dicembre 2023, il grande quotidiano americano The New York Times è entrato in queste battaglie legali citando in giudizio OpenAI, lo sviluppatore dietro il prospero ChatGPT, per violazione del copyright. La causa ha sottolineato che milioni di articoli pubblicati da organizzazioni dei media sono stati utilizzati per addestrare chatbot automatizzati, che ora rivaleggiano con l’organo di stampa come fonte di informazioni attendibili.
Questioni future
In risposta a queste preoccupazioni urgenti, i governi di tutto il mondo stanno unendosi per affrontare le ansie pubbliche. Ad esempio, rappresentanti di dodici organismi di regolamentazione a livello globale hanno rilasciato una dichiarazione congiunta ad agosto 2023, concentrandosi sullo scraping dei dati e sulla protezione della privacy. La dichiarazione proveniva da autorità in Argentina, Australia, Canada, Colombia, Hong Kong, Jersey, Messico, Marocco, Nuova Zelanda, Norvegia, Svizzera e Regno Unito. Nel frattempo, in California, il Delete Act è stato firmato in legge, prendendo di mira i broker di dati e stabilendo ulteriori regolamenti per la raccolta e la gestione dei dati personali.
Nonostante gli sforzi concertati, prevedo che le preoccupazioni sulla privacy e la proprietà dei dati continueranno a mantenere la loro rilevanza nel discorso pubblico durante il 2024 e oltre. Inoltre, l’aumento delle cause legate alla proprietà intellettuale segnala solo la punta dell’iceberg. Siamo probabilmente destinati a vedere un aumento di casi che si concentrano sull’accuratezza e la sicurezza dei dati, in particolare tra la diffusione incontrollata di deepfake e disinformazione.
Mentre sia il settore governativo che quello aziendale devono raddoppiare gli sforzi, un approccio cauto è imperativo. Nonostante le crescenti preoccupazioni, vale la pena notare che i dati aperti continuano a svolgere un ruolo fondamentale nel guidare la ricerca e lo sviluppo. Prendete, ad esempio, il ruolo inestimabile dell’accesso pubblico ai registri sanitari durante la crisi del COVID-19, che ha accelerato lo sviluppo di innovazioni mediche salvavita come i vaccini sviluppati da Moderna e Pfizer.
L’importanza dei dati aperti è sottolineata dall’esempio storico del Progetto Genoma Umano degli Stati Uniti, dove la condivisione pubblica dei dati genetici ha trasformato la ricerca genetica. In modo simile, l’AI che analizza e apprende dai dati può beneficiare la società, dalla categorizzazione delle mutazioni genetiche all’affrontare sfide urgenti come il cambiamento climatico.
Nel business, i dati raccolti dagli scraper web sono inestimabili per l’intelligence di mercato, il tracciamento dei concorrenti e il riconoscimento delle tendenze prevalenti. Se lo scraping web diventa più restrittivo, le aziende potrebbero affrontare un accesso limitato a dati vitali per prendere decisioni informate, potenzialmente portando a una ridotta concorrenza e trasparenza nei prezzi, un ostacolo all’innovazione e un’esperienza utente scadente a causa di aggiornamenti dei dati più lenti e meno precisi.
Eppure, tra queste sfide in aumento, esistono strade per affrontarle direttamente. Io ripongo la mia fiducia nel potere dei proxy per navigare queste acque turbolente. Queste tecnologie innovative mascherano gli indirizzi IP originali degli utenti, canalandoli attraverso server alternativi. Non solo rafforzano la sicurezza dei dati, ma emergono anche come strumenti indispensabili nell’armonizzare il progresso tecnologico con la salvaguardia delle libertà individuali.












