Connect with us

Kunstig intelligens

Aktivér dine ML- og AI-bestræbelser med dataomdannelse – Tankeledere

mm

Jo større variation, hastighed og mængde af data, vi har, jo mere kan vi bruge predictive analytics og modellering til at forudsige vækst og identificere områder for forbedring og forbedring. Men for at få den største værdi fra rapportering, machine learning (ML) og kunstig intelligens (AI)-værktøjer kræver det, at en organisation har adgang til data fra mange kilder og sikrer, at data er af høj kvalitet og troværdig. Dette er ofte den største barriere for at omdanne big data til forretningsstrategi.

Datafagfolk bruger så meget tid på at indsamle og validere data for at forberede dem til brug, at de har lidt tid tilbage til at fokusere på deres primære formål: at analysere data og udlede forretningsværdi fra dem. Det er ikke overraskende, at 76 procent af datavidenskabsmænd siger, at dataforberedelse er den mindst behagelige del af deres job. Desuden kræver nuværende dataforberedelsesindsats som data-wrangling og traditionel ETL manuel indsats fra IT-fagfolk og er ikke nok til at håndtere skalaen og kompleksiteten af big data.

Virksomheder, der ønsker at udnytte kraften af AI, må bryde ud af disse kedelige og overvejende manuelle processer, der øger risikoen for “skrald ind, skrald ud”-resultater. I stedet har de brug for dataomdannelsesprocesser, der udtrækker rådata i multiple kilder og formater, sammenføjer og normaliserer dem og tilføjer værdi med forretningslogik og -metrikker for at gøre dem klar til analytics. Med kompleks dataomdannelse kan de være sikre på, at AI/ML-modellerne er baseret på rene, nøjagtige data, der leverer troværdige resultater.

At udnytte kraften af skyen med ELT

Det bedste sted at forberede og omdanne data i dag er en cloud data warehouse (CDW) som Amazon Redshift, Google BigQuery, Microsoft Azure Synapse eller Snowflake. Mens traditionelle tilgange til datawarehousing kræver, at data udtrækkes og omdannes, før de kan indlæses, udnytter en CDW skyens skalerbarhed og ydelse til hurtigere dataindtagelse og -omdannelse og gør det muligt at udtrække og indlæse data fra mange forskellige datakilder, før de omdannes inde i CDW.

Ideelt set flytter ELT-modellen først data ind i en sektion af CDW, der er reserveret til rå staging-data. Herfra kan CDW bruge sin næsten ubegrænsede beregningsressourcer til dataintegration og ETL-jobs, der rensker, aggregaterer, filterer og sammenføjer de stagede data. Data kan derefter omdannes til en anden skema – data vault eller Star Schema, for eksempel, optimerer data til rapportering og analytics

ELT-tilgangen tillader også, at du replikerer rådata inden for CDW til senere forberedelse og omdannelse, når og som det er nødvendigt. Dette giver dig mulighed for at bruge business intelligence-værktøjer, der bestemmer skema på læsning og producerer specifikke omdannelser på krav, effektivt giver dig mulighed for at omdanne de samme data på flere måder, mens du opdager nye brugsområder for dem.

At accelerere machine learning-modeller

Disse virkelige eksempler viser, hvordan to virksomheder i forskellige brancher udnytter dataomdannelse i en CDW til at drive AI-initiativer.

En boutique-markedsførings- og reklamebureau opbyggede en proprietær kundeadministrationsplatform for at hjælpe deres kunder med bedre at identificere, forstå og motivere deres kunder. Ved at omdanne data inden for en CDW integrerede platformen hurtigt og let realtidskundedata på tværs af kanaler i en 360-graders kundevisning, der underrettede platformens AI/ML-modeller til at gøre kundeinteraktioner mere konsekvente, rettidige og personlige.

En global logistikvirksomhed, der leverer 100 millioner leverancer til 37 millioner unikke kunder i 72 lande, har brug for enorme mængder data for at drive deres daglige operationer. Ved at antage dataomdannelse inden for en CDW kunne virksomheden udvikle 200 machine learning-modeller på ét år. Disse modeller laver 500.000 forudsigelser hver dag, hvilket betydeligt forbedrer effektiviteten og driver en overlegen kundeservice, der har reduceret indgående opkald til callcenteret med 40 procent.

Bedste praksis for at komme i gang

Virksomheder, der ønsker at støtte deres AI/ML-initiativer med kraften af dataomdannelse i skyen, må forstå deres specifikke brugstilfælde og behov. Ved at starte med, hvad du vil gøre med dine data – reducere brændstofomkostningerne ved at optimere leveringsruter, øge salget ved at levere næste bedste tilbud til kundeserviceagenter i realtid osv. – kan du omvendt udvikle dine processer, så du kan identificere, hvilke data der vil levere relevante resultater.

Når du har bestemt, hvilke data din AI/ML-projekt har brug for til at bygge sine modeller, har du brug for en cloud-nativ ELT-løsning, der kan gøre dine data klar til brug. Søg efter en løsning, der:

  • Er vendor-uafhængig og kan arbejde med din nuværende teknologi-stack

  • Er tilstrækkelig fleksibel til at skala op og ned og tilpasse sig, mens din teknologi-stack ændrer sig

  • Kan håndtere komplekse dataomdannelser fra multiple datakilder

  • Tilbyder en betal-per-brug-prismodel, hvor du kun betaler for, hvad du bruger

  • Er specialbygget til din foretrukne CDW, så du kan fuldt udnytte CDW’s funktioner til at køre jobs hurtigere og omdanne data uden problemer.

En cloud dataomdannelsesløsning, der tilgodeser fællesnævnerne for alle CDW’er, kan give en konsekvent oplevelse, men kun en, der aktiverer de kraftfulde differentierende funktioner i din valgte CDW, kan levere den høje ydelse, der accelererer tid til indsigt. Den rette løsning giver dig mulighed for at aktivere dine AI/ML-projekter med mere ren, troværdig data fra flere kilder på kortere tid – og genererer hurtigere, mere pålidelige resultater, der driver tidligere urealiseret forretningsværdi og innovation.

David Langton er en erfaren software-professionel med over 20 års erfaring med at skabe prisvindende teknologi og produkter. David fungerer i øjeblikket som VP of Product hos Matillion, en leverandør af data-transformation-løsninger. Før sin rolle hos Matillion, arbejdede han som datawarehouse-manager og entreprenør i den finansielle branche.