Connect with us

Artificiell intelligens

Ge din ML och AI-insatser med dataomvandling – Tankeledare

mm

Ju större variation, hastighet och volym av data vi har, desto mer möjligt blir det att använda prediktiv analys och modellering för att förutsäga tillväxt och identifiera områden för förbättring. Men för att få ut det största värdet från rapporterings-, maskinlärnings- (ML) och artificiell intelligens (AI) verktyg måste en organisation ha tillgång till data från många källor och säkerställa att data är av hög kvalitet och pålitlig. Detta är ofta den största barriären för att omvandla stora mängder data till affärsstrategi.

Dataexperter lägger så mycket tid på att samla in och validera data för att förbereda dem för användning att de har lite tid kvar att fokusera på sitt primära syfte: att analysera data och dra affärsnytta av dem. Det är inte förvånande att 76 procent av dataforskare säger att datavorberedning är den minst angenäma delen av deras jobb. Dessutom kräver nuvarande datavorberedningsinsatser som datawrangling och traditionell ETL manuellt arbete från IT-proffs och räcker inte för att hantera omfattningen och komplexiteten hos stora mängder data.

Företag som vill utnyttja kraften från AI måste bryta sig loss från dessa tråkiga och i stor utsträckning manuella processer som ökar risken för “skräp in, skräp ut”-resultat. Istället behöver de dataomvandlingsprocesser som extraherar rådata från flera källor och format, sammanfogar och normaliserar dem och lägger till värde med affärslogik och mått för att göra dem redo för analys. Med komplex dataomvandling kan de vara säkra på att AI/ML-modellerna baseras på ren, exakt data som levererar tillförlitliga resultat.

Att utnyttja kraften från molnet med ELT

Den bästa platsen att förbereda och omvandla data idag är ett molnbaserat datalager (CDW) som Amazon Redshift, Google BigQuery, Microsoft Azure Synapse eller Snowflake. Medan traditionella tillvägagångssätt för datawarehousing kräver att data extraheras och omvandlas innan de kan laddas, utnyttjar ett CDW molnets skalbarhet och prestanda för snabbare datainmatning och omvandling och gör det möjligt att extrahera och ladda data från många olika datakällor innan de omvandlas inuti CDW.

Idealt sett flyttar ELT-modellen initialt data till en sektion av CDW som är reserverad för råstagningsdata. Därifrån kan CDW använda sina nästintill obegränsade beräkningsresurser som är tillgängliga för dataintegrerings- och ETL-arbetsuppgifter som rensar, aggregerar, filtrerar och sammanfogar de stagade data. Data kan sedan omvandlas till ett annat schema – data vault eller Star Schema, till exempel – för att optimera data för rapportering och analys

ELT-tillvägagångssättet tillåter också att du replikerar rådata inom CDW för senare förberedelse och omvandling när och som behövs. Detta låter dig använda affärsintelligensverktyg som bestämmer schema på läsning och producerar specifika omvandlingar på begäran, vilket i princip låter dig omvandla samma data på flera sätt allteftersom du upptäcker nya användningsområden för dem.

Att accelerera maskinlärningsmodeller

Dessa verkliga exempel visar hur två företag inom olika branscher utnyttjar dataomvandling i ett CDW för att driva AI-initiativ.

En boutique-marknadsförings- och annonsbyrå byggde en egen kundhanteringsplattform för att hjälpa sina kunder att bättre identifiera, förstå och motivera sina kunder. Genom att omvandla data inom ett CDW kunde plattformen snabbt och enkelt integrera kunddata i realtid över kanaler till en 360-graders kundvy som informerar plattformens AI/ML-modeller för att göra kundinteraktioner mer konsekventa, tidiga och personliga.

Ett globalt logistikföretag som gör 100 miljoner leveranser till 37 miljoner unika kunder i 72 länder behöver stora mängder data för att driva sin dagliga verksamhet. Genom att anta dataomvandling inom ett CDW kunde företaget distribuera 200 maskinlärningsmodeller på ett år. Dessa modeller gör 500 000 förutsägelser varje dag, vilket avsevärt förbättrar effektiviteten och driver en överlägsen kundservice som har minskat inkommande samtal till kundtjänst med 40 procent.

Bästa praxis för att komma igång

Företag som vill stödja sina AI/ML-initiativ med kraften från dataomvandling i molnet måste förstå sitt specifika användningsfall och behov. Att börja med vad du vill göra med din data – minska bränslekostnader genom att optimera leveransrutter, öka försäljningen genom att leverera nästa bästa erbjudanden till kundtjänstmedarbetare i realtid osv. – låter dig backa processerna så att du kan identifiera vilken data som kommer att leverera relevanta resultat.

När du har bestämt vilken data ditt AI/ML-projekt behöver för att bygga sina modeller, behöver du en molnbaserad ELT-lösning som gör din data användbar. Sök efter en lösning som:

  • Är leverantörsneutral och kan fungera med din nuvarande tekniska stack

  • Är tillräckligt flexibel för att skala upp och ned och anpassa sig efter att din tekniska stack förändras

  • Kan hantera komplexa dataomvandlingar från flera datakällor

  • Erhåller en betalningsmodell per användning där du bara betalar för det du använder

  • Är specialbyggt för din föredragna CDW så att du kan utnyttja CDW:s funktioner fullt ut för att köra jobb snabbare och omvandla data sömlöst.

En molnbaserad dataomvandlingslösning som tillgodoser de gemensamma nämnarna för alla CDW kan ge en konsekvent upplevelse, men endast den som möjliggör de kraftfulla differentierande funktionerna i din valda CDW kan leverera den höga prestanda som påskyndar tiden till insikt. Rätt lösning kommer att möjliggöra för dig att driva dina AI/ML-projekt med mer ren, pålitlig data från fler källor på kortare tid – och generera snabbare, mer tillförlitliga resultat som driver tidigare outnyttjad affärsnytta och innovation.

David Langton är en erfaren mjukvaruprofessionell med över 20 års erfarenhet av att skapa prisbelönt teknologi och produkter. David är för närvarande VP of Product på Matillion, en leverantör av datatransformationslösningar. Före sin roll på Matillion arbetade han som datalagringschef och konsult inom finansbranschen.