Connect with us

Zapněte své úsilí o ML a AI s transformací dat – Thought Leaders

Umělá inteligence

Zapněte své úsilí o ML a AI s transformací dat – Thought Leaders

mm

Čím větší je rozmanitost, rychlost a objem dat, které máme, tím více je možné použít prediktivní analytiku a modelování pro předpověď růstu a identifikaci oblastí příležitostí a zlepšení. Nicméně, aby organizace získala最大 hodnotu z reportingu, nástrojů pro strojové učení (ML) a umělé inteligence (AI), je třeba získat přístup k datům z mnoha zdrojů a zajistit, aby data byla vysoce kvalitní a důvěryhodná. To je často největší bariéra pro transformaci velkých dat do obchodní strategie.

Odborníci na data tráví tolik času shromažďováním a ověřováním dat, aby je připravili pro použití, že mají málo času na to, aby se soustředili na svůj primární účel: analýzu dat a získání obchodní hodnoty z nich. Nelze se divit, že 76 procent odborníků na data říká, že příprava dat je nejméně příjemnou částí jejich práce. Kromě toho současné úsilí o přípravu dat, jako je zpracování dat a tradiční ETL, vyžaduje manuální úsilí od IT odborníků a není dostatečné pro zpracování rozsahu a složitosti velkých dat.

Společnosti, které chtějí využít sílu AI, musí se od těchto únavných a převážně manuálních procesů odvrátit. Místo toho potřebují procesy transformace dat, které extrahují surová data z více zdrojů a formátů, spojují a normalizují je a přidávají hodnotu pomocí obchodního logického a metrik, aby je připravily pro analytiku. S komplexní transformací dat mohou být jistí, že modely AI/ML jsou založeny na čistých, přesných datech, která poskytují důvěryhodné výsledky.

Využití síly cloudu s ELT

Nejlepším místem pro přípravu a transformaci dat dnes je cloudový datový sklad (CDW), jako je Amazon Redshift, Google BigQuery, Microsoft Azure Synapse nebo Snowflake. Zatímco tradiční přístupy k datovému skladu vyžadují, aby data byla extrahována a transformována předtím, než mohou být načtena, cloudový datový sklad využívá škálovatelnost a výkon cloudu pro rychlejší načtení a transformaci dat a umožňuje načíst a načíst data z mnoha rozdílných zdrojů dat předtím, než je transformuje uvnitř CDW.

Ideálně se model ELT nejprve přesune do sekce CDW vyhrazené pro surová data ve fázi. Odtud může CDW použít své téměř neomezené výpočetní zdroje dostupné pro úlohy integrace dat a ETL, které čistí, agregují, filtrování a spojují data ve fázi. Data lze pak transformovat do jiného schématu – data vault nebo Star Schema, například, optimalizuje data pro reportování a analytiku

Přístup ELT také umožňuje replikovat surová data uvnitř CDW pro pozdější přípravu a transformaci, kdykoli a podle potřeby. To umožňuje použít nástroje pro obchodní inteligenci, které určují schéma při čtení a produkují konkrétní transformace na vyžádání, efektivní využití stejného dat ve více způsobech, jakmile se objeví nové použití pro ně.

Zrychlení modelů strojového učení

Tyto reálné příklady ukazují, jak dvě společnosti z různých odvětví využívají transformaci dat v CDW pro řízení iniciativ AI.

Butiková marketingová a reklamní agentura vytvořila proprietární platformu pro správu zákazníků, aby svým klientům pomohla lépe identifikovat, pochopit a motivovat své zákazníky. Transformací dat uvnitř CDW může platforma rychle a snadno integrovat data zákazníků v reálném čase napříč kanály do 360stupňového zobrazení zákazníka, které informuje modely AI/ML platformy pro provádění interakcí se zákazníky více konzistentních, včasných a personalizovaných.

Globální logistická společnost, která provádí 100 milionů dodávek 37 milionům jedinečným zákazníkům v 72 zemích, potřebuje obrovské množství dat pro své denní operace. Přijetí transformace dat uvnitř CDW umožnilo společnosti nasadit 200 modelů strojového učení za jeden rok. Tyto modely provádějí 500 000 předpovědí denně, což významně zlepšuje efektivitu a pohání nadřazenou službu zákazníkům, která snížila příchozí hovory do call centra o 40 procent.

Nejlepší postupy pro začátek

Společnosti, které chtějí podporovat své iniciativy AI/ML pomocí síly transformace dat v cloudu, musí pochopit své konkrétní použití a potřeby. Začínající s tím, co chcete udělat se svými daty – snižování nákladů na palivo optimalizací tras dodávek, zvyšování prodeje dodáním nejlepších nabídek zákazníkům v reálném čase atd. – umožňuje zpětně inženýrské procesy, aby jste mohli identifikovat, která data budou poskytovat relevantní výsledky.

Jakmile určíte, která data vaše projekt AI/ML potřebuje k sestavení svých modelů, budete potřebovat cloudovou nativní řešení ELT, které učiní vaše data vhodnými pro použití. Hledejte řešení, které:

  • Je vendor-neutrální a schopné pracovat s vaším současným technologickým stackem

  • Je dostatečně flexibilní, aby škálovalo nahoru a dolů a přizpůsobilo se, jak se mění váš technologický stack

  • Může zpracovat komplexní transformace dat z více zdrojů dat

  • Nabízí model cenového plánování, ve kterém platíte pouze za to, co používáte

  • Je speciálně navrženo pro váš preferovaný CDW, aby jste mohli plně využít funkcí CDW pro spuštění úloh rychleji a transformovat data bezproblémově.

Řešení pro transformaci dat v cloudu, které se přizpůsobí společným jmenovatelům všech CDW, může poskytnout konzistentní zkušenost, ale pouze takové, které umožňuje silné rozlišující funkce vašeho zvoleného CDW, může dodat vysoký výkon, který urychluje čas na vhled. Správné řešení vám umožní napájet vaše projekty AI/ML více čistými, důvěryhodnými daty z více zdrojů v kratším čase – a generovat rychlejší, spolehlivější výsledky, které pohánějí dříve neuskutečněné obchodní hodnoty a inovace.

David Langton je zkušený odborník na software s více než 20 lety zkušeností s vytvářením ocenění technologických produktů. David目前 působí jako VP of Product ve společnosti Matillion, poskytovateli řešení pro transformaci dat. Před svým působením v Matillion pracoval jako manažer datového skladu a dodavatel v finančním průmyslu.