Connect with us

Quando la ‘conoscenza’ dell’AI ha 50 anni: il rischio di conformità che non puoi ignorare

Leader di pensiero

Quando la ‘conoscenza’ dell’AI ha 50 anni: il rischio di conformità che non puoi ignorare

mm

La questione delle false intuizioni dell’AI è una sfida urgente mentre le imprese aumentano l’uso di strumenti generativi. Nonostante l’entusiasmo diffuso sull’adozione dell’AI, c’è anche una forte corrente di critica. I commentatori critici spesso puntano a inesattezze apparentemente casuali e imprevedibili nell’output dell’AI, che minano il suo valore – e possono addirittura minacciare un danno reale agli esseri umani, in particolare in settori come la sanità e i trasporti, dove le uscite false potrebbero teoricamente portare a tutto, dalla prescrizione sbagliata a treni su una rotta di collisione.

Spesso, queste inesattezze sono state attribuite alle “allucinazioni” dell’AI – istanze in cui l’AI genera una risposta di “miglior ipotesi”, comunicata con la stessa fiducia di una risposta “autentica”, piuttosto che informare l’utente di una lacuna nella sua conoscenza o capacità. Le allucinazioni possono essere difficili da rilevare a prima vista – ma c’è un problema più silenzioso e altrettanto serio che è ancora più difficile da rilevare.

Debito di qualità dei dati: il tallone d’Achille dell’AI

Quando i sistemi di AI attingono a dati obsoleti, incompleti o inesatti, si verificano output falsi ma sono meno immediatamente riconoscibili. Ad esempio, potresti chiedere a un’AI di identificare i sintomi di una condizione medica e ricevere una risposta basata su un articolo di 50 anni fa invece che sulla ricerca attuale. Il risultato è improbabile che appaia ovviamente, ridicolmente sbagliato – ma quella prima apparenza di plausibilità rappresenta un rischio reale per il paziente in questione e il fornitore di assistenza sanitaria.

Lo stesso vale per tutti i settori – se i dati forniti al modello di AI includono informazioni vecchie, obsolete o parziali, c’è un alto rischio di output falsi. E poiché più aziende integrano l’AI in processi aziendali critici, il rischio di trarre conclusioni false da dati scarsamente governati cresce.

Precisione per il regolatore

Questo non è solo un problema per le operazioni quotidiane – è anche una sfida di conformità significativa. I requisiti normativi stanno evolvendo rapidamente per affrontare le preoccupazioni relative all’AI inaccurata. Ad esempio, sono state intraprese diverse azioni normative precoci sull’AI; in particolare, quando l’Italia ha temporaneamente vietato ChatGPT per motivi di privacy, e il Consiglio europeo per la protezione dei dati ha lanciato un gruppo di lavoro dedicato per coordinare potenziali azioni di applicazione contro ChatGPT.

Una delle modifiche normative più significative è stata l’approvazione del Regolamento AI dell’UE, il primo quadro giuridico globale per l’AI. Il Regolamento stabilisce obblighi in base al livello di rischio dei sistemi di AI, dai sistemi a “rischio inaccettabile”, che sono vietati, ai sistemi a “rischio elevato”, che sono soggetti a requisiti rigorosi in materia di trasparenza, qualità dei dati, governance e controllo umano.

La significatività del Regolamento AI dell’UE non risiede nel suo ambizioso scopo, ma importante è il precedente che stabilisce. I regolatori stanno rendendo chiaro che l’AI sarà soggetta a regole vincolanti e che le organizzazioni devono trattare la conformità e la trasparenza su dove e come viene utilizzata l’AI come parte integrante dell’adozione dell’AI e non come un ripensamento.

Il Regolamento ha un ampio ambito di applicazione, con il potenziale di influenzare una grande parte degli sviluppi dell’AI. Al suo cuore c’è il rendere l’AI sicura, rispettando i diritti e i valori fondamentali. All’interno di questo nuovo ecosistema basato su principi, c’è la diagnosi delle potenziali fonti di inesattezze dell’AI, compresi i dati e i set di dati che alimentano i modelli, l’opacità del modello e l’accesso, e la progettazione e l’uso del sistema. Le soluzioni di AI sono una costruzione di tutti e tre – problemi con uno di questi possono avere un esito negativo. Inoltre, i dati che vengono utilizzati per la progettazione, lo sviluppo, il dispiegamento e l’operazione dell’AI sono probabilmente composti principalmente da registri aziendali, che sono a loro volta soggetti a vari requisiti di conformità.

In altre parole, l’ambiente normativo che circonda l’AI sta diventando sempre più rigoroso – e questo vale sia per i dati di input che per i dati di output, anche se quest’ultimo riceve molte più attenzioni.

Cinque passaggi per alimentare l’AI con dati conformi, attuali e rilevanti

Per risolvere questa duplice sfida – assicurare sia la gestione dei dati conforme che un input di alta qualità che consenta un output di alta qualità – le aziende devono avere il controllo sui dati di training e di inferenza. Purtroppo, questo è qualcosa che molte aziende ancora non possiedono.

Almeno, le organizzazioni dovrebbero applicare i loro programmi di conformità e governance più ampi alle iniziative di AI. Devono iniziare a catturare e mantenere registri appropriati sui dati che alimentano i modelli di AI, su come i modelli e i sistemi sono progettati, nonché sulle decisioni e il contenuto generato tramite AI.

Tuttavia, sta diventando criticamente importante per le organizzazioni andare oltre e assicurarsi di avere il pieno controllo su tutti i dati che potrebbero essere utilizzati nelle distribuzioni di AI, sia per l’addestramento iniziale che per il lavoro “live”. Ciò richiede una strategia di gestione e archiviazione dei dati di alta qualità, assicurando che tutti i dati rilevanti vengano intelligentemente raccolti, puliti, archiviati, classificati e intitolati. Per raggiungere ciò, le organizzazioni devono considerare quattro passaggi chiave:

1. Lineage e provenienza dei dati

Ciò include mantenere un registro della fonte dei dati, della sua origine, della proprietà e di eventuali modifiche dei metadati (se consentite) durante l’intero ciclo di vita. Ciò significa anche mantenere metadati ricchi e tutti i documenti o artefatti sottostanti da cui è derivato.

2. Autenticità dei dati

Ciò richiede mantenere una chiara catena di custodia per tutti i dati, archiviare gli oggetti nelle loro forme native e hashare gli oggetti ricevuti per dimostrare che i dati rimangono invariati. Inoltre, le organizzazioni devono mantenere una storia di audit completa per ogni oggetto e per tutte le azioni e gli eventi relativi a eventuali modifiche.

3. Classificazione dei dati

Stabilire la natura di un set o tipo di dati è importante. Le organizzazioni devono essere in grado di governare i dati strutturati, semi-strutturati e set di dati strutturati. Assegnare uno schema univoco a ogni classe può consentire alle organizzazioni di gestire set di dati diversi senza un’ontologia fissa a misura unica – evitando che i dati vengano inutilmente manipolati per forzarli in una struttura di dati inflessibile.

4. Normalizzazione dei dati

Stabilire definizioni e formati comuni di metadati è importante per l’uso nelle analisi e nelle soluzioni di AI. Schemi chiaramente definiti sono un elemento importante, insieme a strumenti che possono trasformare o mappare i dati per mantenere viste coerenti e normalizzate di dati correlati.

5. Autorizzazioni dei dati

Le aziende hanno bisogno di controlli di autorizzazione granulari, inclusi a livello di oggetto o campo, in base ai profili utente o di sistema. Ciò significa che i dati giusti sono disponibili per gli utenti e i sistemi che hanno il diritto di accedervi, mentre si limita o si limita l’accesso a coloro che non lo sono.

Con questi elementi cruciali in atto, le aziende saranno meglio posizionate per assicurarsi che i dati forniti ai modelli di AI siano sia di alta qualità che conformi. L’AI guiderà miglioramenti ed efficienze in tutti i settori – ma affinché ciò accada, una solida base di dati è essenziale.

George Tziahanas è il VP di Compliance e Associate General Counsel di Archive360. George è un leader esecutivo con una profonda comprensione di tecnologie complesse, regolamentazioni bancarie, governance dei dati e gestione dei rischi. E, lavora a stretto contatto con clienti attuali e potenziali per garantire che siano soddisfatte le complesse esigenze di governance e conformità dei dati, allineandosi con le soluzioni di Archive360.