Connect with us

Intelligenza artificiale

Potenzia i tuoi sforzi di ML e AI con la trasformazione dei dati – Leader di pensiero

mm

Maggiore è la varietà, la velocità e il volume di dati che abbiamo, più diventa fattibile utilizzare analisi predittive e modellazione per prevedere la crescita e identificare aree di opportunità e miglioramento. Tuttavia, ottenere il massimo valore dagli strumenti di reporting, machine learning (ML) e intelligenza artificiale (AI) richiede che un’organizzazione acceda ai dati da molte fonti e assicuri che i dati siano di alta qualità e affidabili. Ciò è spesso il più grande ostacolo per trasformare i big data in strategia aziendale.

I professionisti dei dati spendono così tanto tempo a raccogliere e convalidare i dati per prepararli all’uso che hanno poco tempo per concentrarsi sul loro scopo principale: analizzare i dati e derivare valore aziendale da essi. Non sorprendentemente, il 76 percento dei data scientist afferma che la preparazione dei dati è la parte meno piacevole del loro lavoro. Inoltre, gli sforzi di preparazione dei dati attuali come data wrangling e ETL tradizionale richiedono uno sforzo manuale da parte dei professionisti IT e non sono sufficienti per gestire la scala e la complessità dei big data.

Le aziende che desiderano sfruttare il potere dell’AI devono allontanarsi da questi processi tediosi e in gran parte manuali che aumentano il rischio di risultati “spazzatura dentro, spazzatura fuori”. Invece, hanno bisogno di processi di trasformazione dei dati che estraggono i dati grezzi in più fonti e formati, li uniscono e li normalizzano, e aggiungono valore con logica aziendale e metriche per renderli pronti per l’analisi. Con la trasformazione dei dati complessi, possono essere sicuri che i modelli AI/ML siano basati su dati puliti e precisi che forniscono risultati affidabili.

Sfruttare il potere del cloud con ELT

Il miglior posto per preparare e trasformare i dati oggi è un cloud data warehouse (CDW) come Amazon Redshift, Google BigQuery, Microsoft Azure Synapse o Snowflake. Mentre gli approcci tradizionali alla gestione dei dati richiedono che i dati vengano estratti e trasformati prima di poter essere caricati, un CDW sfrutta la scalabilità e le prestazioni del cloud per un’ingestione e trasformazione dei dati più veloce e rende possibile estrarre e caricare i dati da molte fonti di dati disparate prima di trasformarli all’interno del CDW.

Idealmente, il modello ELT sposta inizialmente i dati in una sezione del CDW riservata ai dati di staging grezzi. Da lì, il CDW può utilizzare le risorse di calcolo quasi illimitate disponibili per i lavori di integrazione e ETL che puliscono, aggregano, filtrano e uniscono i dati in staging. I dati possono quindi essere trasformati in uno schema diverso – data vault o Star Schema, ad esempio – ottimizzando i dati per la creazione di report e analisi

L’approccio ELT consente inoltre di replicare i dati grezzi all’interno del CDW per una preparazione e trasformazione successive quando e come necessario. Ciò ti consente di utilizzare strumenti di business intelligence che determinano lo schema in fase di lettura e producono trasformazioni specifiche su richiesta, consentendoti essenzialmente di trasformare gli stessi dati in più modi man mano che scopri nuovi utilizzi per essi.

Accelerare i modelli di machine learning

Questi esempi del mondo reale mostrano come due aziende di diversi settori stanno sfruttando la trasformazione dei dati in un CDW per guidare le iniziative AI.

Un’agenzia di marketing e pubblicità boutique ha costruito una piattaforma di gestione dei clienti proprietaria per aiutare i suoi clienti a identificare, comprendere e motivare meglio i loro clienti. Trasformando i dati all’interno di un CDW, la piattaforma integra rapidamente e facilmente i dati dei clienti in tempo reale attraverso canali in una vista a 360 gradi del cliente che informa i modelli AI/ML della piattaforma per rendere le interazioni con i clienti più coerenti, tempestive e personalizzate.

Un’azienda di logistica globale che effettua 100 milioni di consegne a 37 milioni di clienti unici in 72 paesi ha bisogno di grandi quantità di dati per alimentare le sue operazioni quotidiane. L’adozione della trasformazione dei dati all’interno di un CDW ha consentito all’azienda di distribuire 200 modelli di machine learning in un solo anno. Questi modelli effettuano 500.000 previsioni ogni giorno, migliorando notevolmente l’efficienza e guidando un servizio clienti superiore che ha ridotto le chiamate al call center del 40 percento.

Migliori pratiche per iniziare

Le aziende che desiderano supportare le iniziative AI/ML con il potere della trasformazione dei dati nel cloud devono comprendere il proprio caso d’uso e le proprie esigenze. Iniziare con ciò che si desidera fare con i propri dati – ridurre i costi del carburante ottimizzando le rotte di consegna, aumentare le vendite fornendo le migliori offerte successive agli agenti del servizio clienti in tempo reale, ecc. – consente di progettare al contrario i processi in modo da poter identificare quali dati forniranno risultati rilevanti.

Una volta determinato quali dati il progetto AI/ML necessita per costruire i propri modelli, è necessaria una soluzione ELT cloud-native che renderà i dati adatti all’uso. Cerca una soluzione che:

  • Sia neutra per il fornitore e in grado di lavorare con la tua attuale pila tecnologica

  • Sia sufficientemente flessibile per scalare in alto e in basso e adattarsi man mano che la pila tecnologica cambia

  • Possano gestire trasformazioni dei dati complesse da più fonti di dati

  • Offra un modello di prezzi pay-as-you-go in cui paghi solo per ciò che utilizzi

  • Sia progettata per il tuo CDW preferito in modo da poter sfruttare appieno le funzionalità del CDW per eseguire i lavori più velocemente e trasformare i dati in modo trasparente.

Una soluzione di trasformazione dei dati cloud che si rivolge ai denominatori comuni di tutti i CDW può fornire un’esperienza coerente, ma solo una soluzione che consente le funzionalità differenzianti potenti del tuo CDW scelto può offrire le prestazioni elevate che accelerano il tempo di insight. La soluzione giusta ti consentirà di alimentare i tuoi progetti AI/ML con più dati puliti e affidabili da più fonti in meno tempo – e generare risultati più rapidi e affidabili che guidano un valore aziendale e un’innovazione precedentemente irrealizzati.

David Langton è un professionista del software esperto con oltre 20 anni di esperienza nella creazione di tecnologie e prodotti vincitori di premi. David attualmente ricopre il ruolo di VP of Product presso Matillion, un fornitore di soluzioni per la trasformazione dei dati. Prima del suo ruolo in Matillion, ha lavorato come manager di data warehouse e come contractor nel settore finanziario.