Etica

Google Rivela l’Utilizzo di Dati Web Pubblici per l’Addestramento dell’Intelligenza Artificiale

Pubblicato il 5 luglio 2023

Aggiornato il 23 maggio 2026

Alex McFarland

Nell’ambito di un aggiornamento della sua politica sulla privacy, Google ha ammesso apertamente di utilizzare informazioni pubblicamente disponibili sul web per addestrare i suoi modelli di intelligenza artificiale. Questa divulgazione, segnalata da Gizmodo, include servizi come Bard e Cloud AI. La portavoce di Google, Christa Muldoon, ha dichiarato a The Verge che l’aggiornamento chiarisce semplicemente che nuovi servizi come Bard sono anch’essi inclusi in questa pratica e che Google incorpora principi e salvaguardie di privacy nello sviluppo delle sue tecnologie di intelligenza artificiale.

La trasparenza nelle pratiche di addestramento dell’intelligenza artificiale è un passo nella direzione giusta, ma solleva anche una serie di domande. Come fa Google a garantire la privacy degli individui quando utilizza dati pubblicamente disponibili? Quali misure sono in atto per prevenire l’uso improprio di questi dati?

Le Implicazioni dei Metodi di Addestramento dell’Intelligenza Artificiale di Google

La politica sulla privacy aggiornata afferma ora che Google utilizza le informazioni per migliorare i suoi servizi e sviluppare nuovi prodotti, funzionalità e tecnologie che beneficiano gli utenti e il pubblico. La politica specifica inoltre che l’azienda può utilizzare informazioni pubblicamente disponibili per addestrare i modelli di intelligenza artificiale di Google e costruire prodotti e funzionalità come Google Translate, Bard e capacità di Cloud AI.

Tuttavia, la politica non chiarisce come Google intenda prevenire l’inclusione di materiali protetti da copyright nel pool di dati utilizzato per l’addestramento. Molti siti web pubblicamente accessibili hanno politiche che proibiscono la raccolta di dati o lo scraping del web per l’addestramento di grandi modelli linguistici e altri set di strumenti di intelligenza artificiale. Questo approccio potrebbe potenzialmente entrare in conflitto con regolamenti globali come il GDPR che proteggono le persone contro l’uso improprio dei loro dati senza il loro permesso espresso.

L’utilizzo di dati pubblicamente disponibili per l’addestramento dell’intelligenza artificiale non è di per sé problematico, ma lo diventa quando viola le leggi sul copyright e la privacy degli individui. È un equilibrio delicato che aziende come Google devono navigare con attenzione.

L’Impatto più Ampio delle Pratiche di Addestramento dell’Intelligenza Artificiale

L’utilizzo di dati pubblicamente disponibili per l’addestramento dell’intelligenza artificiale è stato un argomento controverso. Sistemi di intelligenza artificiale generativa popolari come GPT-4 di OpenAI sono stati reticenti sulle loro fonti di dati e se includono post sui social media o opere protette da copyright di artisti e autori umani. Questa pratica attualmente si trova in una zona grigia legale, scatenando varie cause legali e spingendo i legislatori di alcune nazioni a introdurre leggi più severe per regolare come le aziende di intelligenza artificiale raccolgono e utilizzano i loro dati di addestramento.

Il più grande editore di giornali degli Stati Uniti, Gannett, sta citando in giudizio Google e la sua società madre, Alphabet, sostenendo che i progressi nella tecnologia dell’intelligenza artificiale hanno aiutato il gigante della ricerca a detenere un monopolio sul mercato degli annunci digitali. Nel frattempo, piattaforme social come Twitter e Reddit hanno adottato misure per prevenire che altre aziende raccolgano liberamente i loro dati, portando a una reazione negativa dalle loro rispettive comunità.

Questi sviluppi sottolineano la necessità di linee guida etiche robuste per l’intelligenza artificiale. Man mano che l’intelligenza artificiale continua a evolversi, è cruciale per le aziende bilanciare il progresso tecnologico con considerazioni etiche. Ciò include il rispetto delle leggi sul copyright, la protezione della privacy degli individui e il garantire che l’intelligenza artificiale benefici tutta la società, non solo una selezione di individui.

L’aggiornamento recente della politica sulla privacy di Google ha gettato luce sulle pratiche di addestramento dell’intelligenza artificiale dell’azienda. Tuttavia, solleva anche domande sull’impatto etico dell’utilizzo di dati pubblicamente disponibili per l’addestramento dell’intelligenza artificiale, la possibile violazione delle leggi sul copyright e l’impatto sulla privacy degli utenti. Man mano che procediamo, è essenziale continuare questa conversazione e lavorare verso un futuro in cui l’intelligenza artificiale sia sviluppata e utilizzata in modo responsabile.

Alex McFarland

Alex McFarland è un giornalista e scrittore di intelligenza artificiale che esplora gli ultimi sviluppi nel campo dell'intelligenza artificiale. Ha collaborato con numerose startup di intelligenza artificiale e pubblicazioni in tutto il mondo.

Unite.AI

Google Rivela l’Utilizzo di Dati Web Pubblici per l’Addestramento dell’Intelligenza Artificiale

Le Implicazioni dei Metodi di Addestramento dell’Intelligenza Artificiale di Google

L’Impatto più Ampio delle Pratiche di Addestramento dell’Intelligenza Artificiale

Scopri di più