Seguici sui social

Ripulire i nostri dati disordinati: come l'intelligenza artificiale sta cambiando le regole del gioco

Leader del pensiero

Ripulire i nostri dati disordinati: come l'intelligenza artificiale sta cambiando le regole del gioco

mm

Stiamo annegando nei dati. Ogni piattaforma, smartwatch e smartphone frammenta le nostre vite in frammenti quantificabili, ma la maggior parte di essi rimane incoerente e inutilizzabile. 

Le aziende lo sanno, ecco perché il gigante tecnologico Meta investito 14 miliardi di dollari la scorsa estate per acquisire una quota del 49% nella startup di etichettatura dei dati Scale AI, compiendo una mossa calcolata e strategica per garantire dati di formazione di alta qualità per i suoi modelli di intelligenza artificiale.

L'affidabilità dei modelli linguistici di grandi dimensioni dipende interamente dalla qualità dei dati con cui vengono alimentati: in breve, "garbage in, garbage out". Oggi, tuttavia, la vera sfida che le aziende devono affrontare è trasformare un flusso di informazioni grezze in dati fruibili. 

La soluzione potrebbe essere nascosta in bella vista: l'intelligenza artificiale stessa può dare una mano, generando strategie per aggirare il noioso compito di etichettare enormi set di dati o di setacciare infiniti fogli di calcolo, trasformando il caos in intelligenza umana utilizzabile. 

Quando i dati diventano disordinati: i costi nascosti per le aziende

Secondo Ricerca Gartner dal 2020, la scarsa qualità dei dati costa alle organizzazioni almeno 12.9 milioni di dollari all'anno, incidendo sulla produttività e portando a decisioni poco informate e a report imprecisi. 

Le conseguenze di dati disordinati sono ancora più evidenti in settori come quello sanitario. Cartelle cliniche incomplete, dettagli di fatturazione e dati non corrispondenti tra i sistemi possono portare a diagnosi errate, errori di trattamento e un'allocazione inefficiente delle risorse. Nel lungo termine, ciò fa aumentare i costi e mina la fiducia in questi sistemi.

Nel frattempo, nella logistica, la mancata corrispondenza dei dati tra fornitori e distributori può causare ritardi o carenze di inventario. Un indirizzo di consegna errato o un registro delle scorte obsoleto possono avere ripercussioni a catena sull'intera catena di fornitura, con conseguenti ritardi nel rispetto delle scadenze e insoddisfazione dei clienti. 

“Essendo in grado di anticipare o comprendere cosa potrebbe accadere [lungo il percorso] – sulla base di dati combinati e passati – è possibile davvero ridurre queste inefficienze”, Asparuh Koev, CEO di un'azienda di intelligenza artificiale per la logistica Transmetrica, notato durante una conversazione con Unisci l'IA.

In termini più pratici, i dati disordinati sono costosi. La regola 1-10-100 lo dimostra: costa 1 dollaro controllare i dati durante l'inserimento, 10 dollari ripulirli in seguito e 100 dollari se non si interviene.

Cosa offrono le piattaforme basate sull'intelligenza artificiale

Mentre le aziende si confrontano con quantità crescenti di dati "sporchi", si rivolgono all'intelligenza artificiale per trovare soluzioni. Le piattaforme emergenti basate sull'intelligenza artificiale ora automatizzano il processo di pulizia dei dati, garantendo economicità e migliorando l'accuratezza.

Roberto Giardina, Fondatore della Claritype, una di queste piattaforme, ha spiegato il processo dell'IA: 

“Converge i dati in un formato comune: parte del processo consiste nel convertire ogni dato in un formato canonico adatto all'azienda.” 

Tuttavia, l'intelligenza artificiale di Claritype va oltre la semplice standardizzazione. La riparazione supervisionata della piattaforma consente alle organizzazioni di superare i confini del sistema alla ricerca di risposte alle loro domande più urgenti, abbattendo i silos. 

"I sistemi che in precedenza erano tenuti separati contengono ciascuno una parte della risposta a domande che abbracciano l'intera attività aziendale", ha detto Giardina Unisci l'IA

Ad esempio, se un fornitore chiave subisce un ritardo nella spedizione, solo collegando i fornitori agli ordini e alla cronologia dei clienti un'azienda può determinare quale dei suoi principali clienti debba essere informato per primo del ritardo.

"Il nostro obiettivo finale è estendere questo pensiero interconnesso per unificare ogni frammento di dati nell'azienda, in modo da poter rispondere a ogni domanda in modo semplice e immediato", ha affermato Giardina. 

Questo tipo di pensiero interconnesso è rappresentativo del più ampio cambiamento di mentalità che si sta verificando nelle aziende oggi, mentre passano da ad hoc dalla pulizia dei dati alla governance sistematica dei dati. Invece di trattare la qualità dei dati come una soluzione una tantum, le organizzazioni stanno sviluppando processi strutturati per garantire coerenza e affidabilità in tutti i loro sistemi.

La governance dei dati è ormai considerata un prezioso processo aziendale, non solo un compito IT. Integrando la gestione dei dati nelle loro strategie complessive, le aziende possono prendere decisioni migliori e ottenere informazioni più significative dai propri dati.

Come l'intelligenza artificiale pulisce i dati e le sfide che deve affrontare

Affidarsi eccessivamente all'intelligenza artificiale può essere pericoloso. Per Giardina, "le conversioni automatiche dei dati più preoccupanti sono quelle che vanno oltre la standardizzazione e si trasformano in congetture". 

Ad esempio, alcune abbreviazioni potrebbero essere facilmente fraintese. "International Business Machines, Inc." o "IBM", ad esempio, verrebbero solitamente convertite in "IBM", ma se la conversione fosse automatizzata e "IB" venisse accidentalmente convertita in "IBM", ciò potrebbe causare problemi significativi per entrambe le aziende.

Dati mancanti e inaccurati sono due dei problemi più comuni, e affidarsi esclusivamente all'intelligenza artificiale per colmare le lacune in base al contesto può facilmente ritorcersi contro. Come sottolinea Giardina, "quando gli effetti sono in qualche modo significativi, abbiamo bisogno di un essere umano che approvi ogni ipotesi". 

Bilanciare l'automazione con l'intuizione umana

I dati disordinati evidenziano profonde carenze nel modo in cui le organizzazioni gestiscono le informazioni. Per progredire e migliorare il processo decisionale, le aziende devono smettere di considerare i dati come una questione puramente tecnica e orientarsi verso modelli di governance che combinino competenza umana, consapevolezza etica e una visione strategica a lungo termine. 

Dati più puliti creano un'intelligenza artificiale più efficace, che a sua volta contribuisce a migliorare la qualità dei dati; questo ciclo di reciproco rafforzamento è promettente, ma serve a ricordare che l'automazione da sola non risolverà il nostro disordinato problema di dati. Questo potenziale può essere realizzato solo abbinando la precisione algoritmica al giudizio umano e alla consapevolezza dei pregiudizi che può introdurre, garantendo trasparenza e maggiore fiducia nei sistemi che costruiamo.

Alex Sandoval, CEO di un'azienda di intelligenza artificiale per la produzione, Allie AI, ha anche sottolineato come i copiloti dell'intelligenza artificiale generativa non funzionino solo con algoritmi, ma si basino piuttosto sulla competenza umana nella logica della fabbrica. 

"Le implementazioni di maggior successo odierne non si limitano a fornire ai modelli una vasta gamma di dati provenienti da PLC (controllori logici programmabili), note operatore e protocolli di conformità. Dipendono da un nuovo tipo di operatore in prima linea: qualcuno in grado di tradurre il comportamento della macchina in intuizione digitale", ha concluso.

Gabrielle Degeorge Giornalista e specialista in comunicazione multilingue, vive a Roma. Ha conseguito un Master in Traduzione Specializzata presso l'Università di Ginevra e il suo lavoro si concentra su come l'intelligenza artificiale interagisca con gli esseri umani per il miglioramento delle industrie e della società.