Connect with us

Saket Saurabh, CEO a spoluzakladatel Nexla – rozhovorová série

Rozhovory

Saket Saurabh, CEO a spoluzakladatel Nexla – rozhovorová série

mm

Saket Saurabh, CEO a spoluzakladatel Nexla, je podnikatel s hlubokou vášní pro data a infrastrukturu. Věnuje se vývoji nové generace automatizované platformy pro inženýrství dat, která má přinést škálovatelnost a rychlost těm, kteří s daty pracují.

Předtím založil Saurabh úspěšný mobilní startup, který dosáhl významných milníků, včetně akvizice, IPO a růstu do multi-milionového podniku. Přispěl také k několika inovativním produktům a technologiím během svého působení v Nvidia.

Nexla umožňuje automatizaci inženýrství dat, aby data mohla být připravena k použití. Toho dosahuje pomocí jedinečného přístupu Nexsets – datových produktů, které usnadňují integraci, transformaci, dodání a monitorování dat.

Co vás inspirovalo k založení Nexla a jak vaše zkušenosti s inženýrstvím dat formovaly vaši vizi pro společnost?

Před založením Nexla jsem začal svou cestu v inženýrství dat v Nvidia, kde jsem budoval vysoce škálovatelné a vyspělé technologie na straně výpočtu. Poté jsem vedl svůj předchozí startup prostřednictvím akvizice a IPO v oblasti mobilní reklamy, kde byly velké množství dat a strojové učení klíčovou součástí naší nabídky, zpracovávající asi 300 miliard záznamů dat denně.

Podívejte se na krajinu v roce 2015 po veřejné nabídce mých předchozích společností, hledal jsem další velkou výzvu, která mě bavila. Přicházející z obou pozadí, bylo mi jasné, že výzvy v datech a výpočtech se sbližují, protože průmysl se pohybuje směrem k pokročilejším aplikacím poháněným daty a umělou inteligencí.

Zatímco jsme nevěděli v té době, že Generativní AI (GenAI) bude postupovat tak rychle, jak postupuje, bylo zřejmé, že strojové učení a AI budou základem pro využití dat. Tak jsem začal přemýšlet o tom, jaký druh infrastruktury je potřebný pro lidi, aby byli úspěšní při práci s daty, a jak můžeme udělat možné, aby kdokoli, nejen inženýři, využili data ve své denní profesionální činnosti.

To vedlo k vizi pro Nexla – zjednodušit a automatizovat inženýrství za daty, protože inženýrství dat bylo ve většině společností velmi speciální řešením, zejména při řešení složitých nebo velkých datových problémů. Cílem bylo učinit data přístupná a srozumitelná pro širší okruh uživatelů, nejen pro inženýry dat. Mé zkušenosti s budováním škálovatelných datových systémů a aplikací poháněly tuto vizi demokratizovat přístup k datům prostřednictvím automatizace a zjednodušení.

Jak Nexsets představují misi Nexla učinit data připravená k použití pro každého, a proč je tato inovace zásadní pro moderní podniky?

Nexsets představují misi Nexla učinit data připravená k použití pro každého řešením základního výzvy dat. 3V dat – objem, rychlost a varieta – byly trvalým problémem. Průmysl udělal nějaký pokrok v řešení výzev s objemem a rychlostí. Nicméně varieta dat zůstala významnou překážkou, protože proliferace nových systémů a aplikací vedla k neustále se zvyšující rozmanitosti datových struktur a formátů.

Přístup Nexla spočívá v automatickém modelování a propojení dat z různých zdrojů do konzistentní, zabalené entity, datového produktu, který nazýváme Nexset. To umožňuje uživatelům přístup a práci s daty bez nutnosti rozumět základní složitosti různých zdrojů dat a struktur. Nexset působí jako brána, poskytující jednoduché, přímé rozhraní k datům.

To je zásadní pro moderní podniky, protože umožňuje více lidem, nejen inženýrům dat, využít data ve své denní práci. Abstrahováním od variety a složitosti dat Nexsets ermögňují, aby obchodní uživatelé, analytici a jiní přímo interagovali s daty, které potřebují, bez nutnosti rozsáhlých technických znalostí.

Pracovali jsme také na tom, aby integrace byla snadno použitelná pro méně technické spotřebitele dat – od uživatelského rozhraní a toho, jak lidé spolupracují a řídí data, až po to, jak staví transformace a pracovní postupy. Abstrahování složitosti dat je klíčové pro demokratizaci přístupu k datům a umožnění širšímu okruhu uživatelů, aby odvodili hodnotu ze svých informačních aktiv. To je kritická schopnost pro moderní podniky, které se snaží stát se více datově orientovanými a využít datové poznatky napříč organizací.

Co dělá data “GenAI-připravená” a jak Nexla účinně řeší tyto požadavky?

Odpověď částečně závisí na tom, jak používáte GenAI. Většina společností implementuje GenAI Retrieval Augmented Generation (RAG). To vyžaduje nejprve přípravu a kódování dat pro načtení do vektorové databáze a poté načtení dat prostřednictvím vyhledávání jako kontextu pro vstup do Large Language Model (LLM), který nebyl vyškolen pomocí těchto dat. Takže data potřebují být připravena tak, aby fungovala dobře pro vektorová vyhledávání i pro LLM.

Nezависle na tom, zda používáte RAG, Retrieval Augmented Fine-Tuning (RAFT) nebo provádíte modelové školení, existují beberapa klíčových požadavků:

  • Formát dat: GenAI LLM často funguje nejlépe s daty ve specifickém formátu. Data potřebují být strukturována způsobem, který modely mohou snadno přijmout a zpracovat. Měly by být také “chunkovány” způsobem, který pomáhá LLM lépe využívat data.
  • Připojení: GenAI LLM potřebují být schopny dynamicky přistupovat k relevantním zdrojům dat, spíše než spoléhat se na statická data sady. To vyžaduje kontinuální připojení k různým podnikovým systémům a úložištím dat.
  • Zabezpečení a governance: Při použití citlivých podnikových dat je kritické mít robustní zabezpečení a governance kontroly na místě. Přístup k datům a jejich použití potřebují být zabezpečeny a v souladu s existujícími organizačními zásadami. Je také třeba řídit data používaná LLM, aby se předešlo únikům dat.
  • Škálovatelnost: GenAI LLM mohou být datově a výpočetně náročné, takže podkladová datová infrastruktura potřebuje být schopna škálovat, aby splnila požadavky těchto modelů.

Nexla řeší tyto požadavky pro přípravu dat pro GenAI několika způsoby:

  • Dynamické přístup k datům: Platforma pro integraci dat Nexla poskytuje jednotný způsob připojení k stovkám zdrojů a používá různé styly integrace a rychlosti dat, spolu s orchestrací, aby GenAI LLM poskytla nejaktuálnější data, když je potřebuje, spíše než spoléhat se na statická data sady.
  • Příprava dat: Nexla má schopnost extrahovat, transformovat a připravovat data ve formátech optimalizovaných pro každý případ použití GenAI, včetně vestavěného chunkingu a podpory více kódovacích modelů.
  • Samoopsluha a spolupráce: S Nexla mohou spotřebitelé dat nejen přistupovat k datům sami a budovat Nexsets a pracovní postupy. Mohou také spolupracovat a sdílet svou práci prostřednictvím tržiště, které zajišťuje, že data jsou ve správném formátu a zlepšuje produktivitu prostřednictvím opakovaného použití.
  • Automatická generace: Integrace a GenAI jsou obě náročné. Nexla automaticky generuje mnoho kroků, které jsou potřebné na základě voleb spotřebitele dat – pomocí AI a dalších technik – aby uživatelé mohli sami provádět práci.
  • Governance a zabezpečení: Nexla zahrnuje robustní zabezpečení a governance kontroly po celou dobu, včetně spolupráce, aby se zajistilo, že citlivá podniková data jsou přístupná a používána způsobem, který je zabezpečen a v souladu.
  • Škálovatelnost: Platforma Nexla je navržena tak, aby škálovala a zvládala nároky GenAI úloh, poskytující potřebnou výpočetní sílu a elastickou škálovatelnost.

Konvergovaná integrace, samoopsluha a spolupráce, automatická generace a governance dat potřebují být postaveny společně, aby ermögňovaly demokratizaci dat.

Jak rozmanité typy a zdroje dat přispívají k úspěchu modelů GenAI a jaká je role Nexla při zjednodušení procesu integrace?

Modely GenAI potřebují přístup ke všem druhům informací, aby poskytly nejlepší poznatky a generovaly relevantní výstupy. Pokud jim tyto informace neposkytnete, neměli byste očekávat dobré výsledky. Je to stejné jako u lidí.

Modely GenAI potřebují být školeny na širokém spektru dat, od strukturovaných databází po nestrukturované dokumenty, aby získaly komplexní pochopení světa. Různé zdroje dat, jako jsou články, finanční zprávy a interakce zákazníků, poskytují cenné kontextuální informace, které tyto modely mohou využít. Expozice rozmanitým datům také umožňuje modelům GenAI stát se flexibilnějšími a adaptabilnějšími, aby zvládly širší rozsah dotazů a úkolů.

Nexla abstrahuje rozmanitost všech těchto dat pomocí Nexsets a usnadňuje přístup téměř k jakémukoli zdroji, poté extrahuje, transformuje, orchestrace a načítá data, aby spotřebitelé dat mohli soustředit pouze na data a na to, aby je připravili pro GenAI.

Jaké trendy formují ekosystém dat v roce 2025 a dále, zejména s růstem GenAI?

Společnosti se většinou soustředily na používání GenAI pro stavbu asistentů nebo kopilotů, aby pomohly lidem najít odpovědi a učinit lepší rozhodnutí. Agentní AI, agenti, kteří automatizují úkoly bez zapojení lidí, je určitě rostoucí trend, jak se pohybujeme do roku 2025. Agenti, stejně jako kopiloti, potřebují integraci, aby zajistili, že data proudí bezproblémově – ne jen v jednom směru, ale také při umožnění AI jednat na základě těchto dat.

Dalším významným trendem pro rok 2025 je rostoucí složitost AI systémů. Tyto systémy se stávají sofistikovanějšími kombinací komponent z různých zdrojů, aby vytvořily ucelená řešení. Je to podobné jako to, jak lidé spoléhají na různé nástroje po celý den, aby dokončili úkoly. Empowered AI systémy budou následovat tento přístup, orchestrace多ných nástrojů a komponent. Tato orchestrace představuje významnou výzvu, ale také klíčovou oblast vývoje.

Z hlediska trendů vidíme tlak na generativní AI, aby pokročila za jednoduché rozpoznávání vzorců až k skutečnému uvažování. Existuje mnoho technologického pokroku v tomto prostoru. Ačkoli tyto pokroky nemusí být plně přeloženy do komerční hodnoty v roce 2025, reprezentují směr, kterým se pohybujeme.

Dalším klíčovým trendem je rostoucí aplikace urychlených technologií pro AI inferencing, zejména u společností jako Nvidia. Tradičně byly GPU široce používány pro školení AI modelů, ale runtime inferencing – bod, ve kterém je model aktivně používán – se stává stejně důležitým. Můžeme očekávat pokroky v optimalizaci inferencing, aby bylo více efektivní a dopadné.

Kromě toho existuje uvědomění, že dostupná školicí data byla z velké části maximálně využita. To znamená, že další zlepšení modelů nepijdou z přidání více dat během školení, ale z toho, jak modely fungují během inferencing. Během runtime je využívání nových informací pro zlepšení výsledků modelu kritickou oblastí.

Zatímco některé zajímavé technologie začínají dosahovat svých limitů, nové přístupy budou pokračovat v objevování, nakonec zdůrazňujících důležitost agility pro organizace, které přijímají AI. Co funguje dobře dnes, může se stát zastaralým do šesti měsíců až roku, takže je důležité být připraveni přidat nebo nahradit zdroje dat a jakékoli komponenty AI potrubí. Zůstávání adaptabilní a otevřené vůči změnám je kritické pro udržení kroků s rychle se vyvíjejícím prostředím.

Jaké strategie mohou organizace přijmout, aby rozlomily datové sila a zlepšily tok dat napříč svými systémy?

Nejdříve lidé potřebují přijmout, že datové sila budou vždy existovat. To vždy bylo případem. Mnoho organizací se snaží centralizovat všechna svá data na jednom místě, věříc, že to vytvoří ideální nastavení a odemkne významnou hodnotu, ale to se často ukáže jako dlouhý, nákladný, víceletý projekt, zejména pro velké podniky.

Takže realita je, že datové sila jsou zde, aby zůstaly. Jakmile jsme to přijali, otázka se stává: Jak můžeme pracovat s datovými silami efektivněji?

Pomocným analogem je přemýšlet o velkých společnostech. Žádná významná korporace nefunguje z jednoho úřadu, kde všichni pracují společně globálně. Místo toho se dělí na sídlo a mnoho kanceláří. Cílem není odolávat tomuto přirozenému rozdělení, ale zajistit, aby tyto kanceláře mohly efektivně spolupracovat. To je důvod, proč investujeme do produktivních nástrojů, jako je Zoom nebo Slack, aby propojily lidi a umožnily bezproblémové pracovní postupy napříč umístěními.

Podobně datové sila jsou fragmentované systémy, které budou vždy existovat napříč týmy, divizemi nebo jinými hranicemi. Klíčem není je eliminovat, ale zajistit, aby fungovaly hladce. Vědět o tom, můžeme se soustředit na technologie, které usnadňují tyto spojení.

Například technologie, jako jsou Nexsets, poskytují společné rozhraní nebo abstrakční vrstvu, která funguje napříč různými zdroji dat. Jako brána k datovým silám zjednodušují proces interoperability s daty rozloženými napříč různými silami. To vytváří efektivitu a minimalizuje negativní dopady sil.

V podstatě by strategie měla být o zlepšení spolupráce mezi silami, spíše než o tom, aby se proti nim bojovalo. Mnoho podniků dělá chybu, když se snaží konsolidovat vše do obrovského datového jezera. Ale upřímně, to je téměř nemožný boj vyhrát.

Jak moderní datové platformy zvládají výzvy, jako je rychlost a škálovatelnost, a co odlišuje Nexla při řešení těchto otázek?

Způsob, jakým to vidím, mnoho nástrojů v moderním datovém stacku bylo původně navrženo se zaměřením na snadné použití a rychlost vývoje, což přišlo z toho, že nástroje jsou více přístupné – umožňující marketingovým analytikům přesunout svá data z marketingové platformy přímo do nástroje pro visualizaci, například.

Evolution těchto nástrojů často zahrnovala vývoj bodových řešení, nebo nástrojů navržených pro řešení specifických, úzce definovaných problémů.

Když mluvíme o škálovatelnosti, lidé často myslí na škálování ve smyslu zvládání větších objemů dat. Ale skutečná výzva škálovatelnosti pochází ze dvou hlavních faktorů: Zvyšujícího se počtu lidí, kteří potřebují pracovat s daty, a rostoucí variety systémů a typů dat, které organizace potřebují spravovat.

Moderní nástroje, being highly specializované, tendují řešit pouze malou část těchto výzev. Jako výsledek, organizace končí s použitím mnoha nástrojů, každý řeší jeden problém, což nakonec vytváří své vlastní výzvy, jako je přetížení nástroji a neefektivita.

Nexla řeší tuto otázku tím, že nachází pečlivou rovnováhu mezi snadným použitím a flexibilitou. Na jedné straně poskytujeme jednoduchost prostřednictvím funkcí, jako jsou šablony a uživatelsky přívětivé rozhraní. Na druhé straně nabízíme flexibilitu a vývojářsky přívětivé schopnosti, které umožňují týmům neustále vylepšovat platformu. Vývojáři mohou přidávat nové funkce do systému, ale tyto vylepšení zůstávají přístupné jako jednoduchá tlačítka a kliknutí pro netechnické uživatele. Tento přístup se vyhýbá pasti příliš specializovaných nástrojů, zatímco dodává širokou škálu podnikových funkcí.

Co skutečně odlišuje Nexla je jeho schopnost spojit snadné použití se škálovatelností a šíří vyžadovanou organizacemi. Naše platforma spojuje tyto dva světy bezproblémově, umožňující týmům pracovat efektivně, aniž by musely kompromitovat na síle nebo flexibilitě.

Jedna z hlavních sil Nexla spočívá v jeho abstraktní architektuře. Například, zatímco uživatelé mohou vizuálně navrhnout datový potrubí, způsob, jakým toto potrubí vykonává, je vysoce adaptabilní. V závislosti na požadavcích uživatele – jako je zdroj, destinace nebo zda data potřebují být v reálném čase – platforma automaticky mapuje potrubí na jednu ze šesti různých motorů. To zajišťuje optimální výkon, aniž by uživatelé museli spravovat tyto složitosti ručně.

Platforma je také volně spojená, což znamená, že zdrojové systémy a systémy destinace jsou odděleny. To umožňuje uživatelům snadno přidávat více destinací k existujícím zdrojům, přidávat více zdrojů k existujícím destinacím a umožňovat oboustranné integrace mezi systémy.

Důležité je, že Nexla abstrahuje návrh potrubí, aby uživatelé mohli zvládat dávková data, proudová data a data v reálném čase, aniž by museli měnit své pracovní postupy nebo návrhy. Platforma automaticky se přizpůsobí těmto potřebám, což usnadňuje uživatelům pracovat s daty v jakémkoli formátu nebo rychlosti. To je více o promyšleném designu než o specifikách programovacích jazyků, zajišťujícím bezproblémový uživatelský zážitek.

Všechno toto ilustruje, že jsme postavili Nexla s koncovým spotřebitelem dat na mysli. Mnoho tradičních nástrojů bylo navrženo pro ty, kteří produkují data nebo spravují systémy, ale my se zaměřujeme na potřeby spotřebitelů dat, kteří chtějí konzistentní, přímá rozhraní pro přístup k datům, bez ohledu na jejich zdroj. Prioritou spotřebitelovy zkušenosti jsme mohli navrhnout platformu, která zjednodušuje přístup k datům, zatímco udržuje flexibilitu potřebnou pro podporu různých případů použití.

Můžete sdílet příklady toho, jak funkce no-code a low-code transformovaly inženýrství dat pro vaše zákazníky?

Funkce no-code a low-code transformovaly proces inženýrství dat na skutečně colaborativní zkušenost pro uživatele. Například v minulosti potřeboval tým účetních operací DoorDash, který spravuje data pro obchodníky, poskytnout požadavky inženýrskému týmu. Inženýři by pak stavěli řešení, vedoucí k iterativnímu procesu, který spotřeboval mnoho času.

Nyní, s funkcemi no-code a low-code, se tato dynamika změnila. Tým denních operací může použít low-code rozhraní pro řešení svých úkolů přímo. Zatímco inženýrský tým může rychle přidávat nové funkce a schopnosti prostřednictvím stejné low-code platformy, umožňující okamžité aktualizace. Tým operací může pak bezproblémově používat tyto funkce, aniž by byly zpožděny.

Tento posun proměnil proces na colaborativní úsilí, spíše než na tvořivou úzkou hrdlo. To vedlo k významným úsporám času. Zákazníci hlásili, že úkoly, které dříve trvaly dva až tři měsíce, mohou být nyní dokončeny za méně než dva týdny – 5x až 10x zlepšení rychlosti.

Jak se role inženýrství dat vyvíjí, zejména s rostoucí adopcí AI?

Inženýrství dat se vyvíjí rychle, poháněno automatizací a pokroky, jako je GenAI. Mnoho aspektů oboru, jako je generování kódu a tvorba konektorů, se stává rychlejší a efektivnější. Například s GenAI se tempo, ve kterém lze generovat, testovat a nasazovat konektory, dramaticky zlepšilo. Ale tento pokrok také přináší nové výzvy, včetně zvýšené složitosti, bezpečnostních obav a potřeby robustní governance.

Jedním z naléhavých problémů je potenciální zneužití podnikových dat. Společnosti se obávají, že jejich proprietární data budou náhodně použita pro školení AI modelů a ztratí tak svou konkurenční výhodu nebo budou čelit úniku dat, protože data budou prozrazena ostatním. Rostoucí složitost systémů a obrovský objem dat vyžadují, aby týmy inženýrství dat přijaly širší perspektivu, zaměřenou na přehledné systémové problémy, jako je zabezpečení, governance a zajištění integrity dat. Tyto výzvy nelze vyřešit pouze pomocí AI.

Zatímco generativní AI může automatizovat nižší úrovně úkolů, role inženýrství dat se posouvá směrem k orchestraci širšího ekosystému. Inženýři dat nyní působí více jako dirigenti, spravující řadu propojených komponent a procesů, jako je nastavení ochrany proti chybám nebo neoprávněnému přístupu, zajišťující soulad s governance standardy a monitorování toho, jak jsou AI-generované výstupy používány v obchodních rozhodnutích.

Chyby a chyby v těchto systémech mohou být nákladné. Například AI systémy mohou načíst zastaralé politické informace, vedoucí k nesprávným odpovědím, jako je slib návratu peněz zákazníkovi, když to není povoleno. Tyto typy problémů vyžadují přísnou kontrolu a dobře definované postupy pro odhalení a řešení těchto chyb, než budou mít dopad na podnik.

Další klíčovou odpovědností pro týmy inženýrství dat je adaptace na posun v uživatelské demografii. Nástroje AI již nejsou omezeny na analytiky nebo technické uživatele, kteří mohou zpochybnit platnost zpráv a dat. Tyto nástroje jsou nyní používány lidmi na okrajích organizace, jako jsou agenti zákaznického podpory, kteří nemusí mít odborné znalosti, aby zpochybnili nesprávné výstupy. Tento širší trend demokratizace technologií zvyšuje odpovědnost týmů inženýrství dat za zajištění přesnosti a spolehlivosti dat.

Co nových funkcí nebo pokroků lze očekávat od Nexla, jak se obor inženýrství dat bude dále vyvíjet?

Soustředíme se na několik pokroků, aby řešit vznikající výzvy a příležitosti, jak se inženýrství dat bude dále vyvíjet. Jedním z nich je AI-poháněná řešení pro řešení variety dat. Jednou z hlavních výzev v inženýrství dat je spravování variety dat z různých zdrojů, takže využíváme AI ke streamlinování tohoto procesu. Například, když přijímáme data od stovek různých obchodníků, systém může automaticky namapovat je do standardní struktury. Dnes tento proces často vyžaduje významný lidský vstup, ale AI-poháněné schopnosti Nexla mají minimalizovat manuální úsilí a zlepšit efektivitu.

Pracujeme také na vylepšení naší technologie konektorů, aby podpořila novou generaci datových pracovních postupů, včetně schopnosti snadno generovat nové agenty. Tyto agenty umožňují bezproblémové spojení se systémy a umožňují uživatelům provádět konkrétní akce v těchto systémech. To je zejména zaměřeno na rostoucí potřeby uživatelů GenAI a usnadňuje integraci a interakci s různými platformami.

Třetím je, že pokračujeme v inovacích na zlepšení monitorování a zajištění kvality. Jak více uživatelů spotřebuje data napříč různými systémy, důležitost monitorování a zajištění kvality dat se dramaticky zvýšila. Naším cílem je poskytnout robustní nástroje pro systémové monitorování a zajištění kvality, aby data zůstala spolehlivá a akční, i když se používají v širším měřítku.

Nakonec Nexla také podniká kroky k otevření některých našich základních schopností. Myšlenka je, že sdílením naší technologie s širší komunitou, můžeme umožnit více lidem využít pokročilá inženýrství dat a řešení, což nakonec odráží náš závazek k podpoře inovace a spolupráce v oboru.

Děkuji za skvělé odpovědi, čtenáři, kteří chtějí se dozvědět více, by měli navštívit Nexla.

Antoine je vizionářský líder a zakládající partner Unite.AI, poháněný neotřesitelnou vášní pro formování a propagaci budoucnosti AI a robotiky. Jako sériový podnikatel věří, že AI bude mít na společnost stejně disruptivní vliv jako elektřina, a často je chycen při tom, jak hovoří o potenciálu disruptivních technologií a AGI. Jako futurist, je zasvěcen prozkoumání toho, jak tyto inovace budou formovat náš svět. Kromě toho je zakladatelem Securities.io, platformy zaměřené na investice do špičkových technologií, které předefinovávají budoucnost a mění celé sektory.