Tankeledare

Data Teams Är Döda, Länge Leve Data Teams

mm

Ja, rubriken är klickvärd och provokativ, men som CTO med många år i data har jag bevittnat en transformation som rättfärdigar dramat. Den traditionella ”data team” – bakkontorspersonalen som kör rapporter och instrumentpaneler – är i praktiken död. I dess ställe dyker en ny sorts data team upp: en AI-först, produkt驱r kraft med direkt påverkan på intäkterna. De är inte längre en kostnadsenhet, utan en vinstgenererande grupp.

Resan från Business Intelligence till Maskinlärande

Det var inte så länge sedan data teams var synonyma med business intelligence (BI). Vi var företagets datahistoriker, som levde i SQL och kalkylblad, med uppgift att svara på “Vad hände förra kvartalet?” När stora data-teknologier som Hadoop uppstod och begreppet ”data scientist” blev det nya modejobbet, utvecklades data teams. I mitten av 2010-talet gjorde vi mer än rapporter; vi gick in i data visualisering och interaktiv analys, och producerade dynamiska instrumentpaneler för varje avdelning. Jobbet handlade om data hantering, blandning av data från olika källor och former, och försök att förstå domänkunskap.

Sedan kom den sena 2010-talet och maskinlärande eran. Data teams började anställa data scientists för att bygga prediktiva modeller och avslöja insikter i stora datamängder. Vi skiftade från att beskriva det förflutna till att förutsäga framtiden: avhoppningsmodeller, rekommendationsmotorer, efterfråganprognoser – du namnger det. Men även då var våra utdata presentationsbilder och insikter, inte levande produkter. Vi fungerade som en intern servicebyrå, som rådde företaget genom analys. Med andra ord var vi kostnadsenheter – värdefulla, ja, men ett steg ifrån kärnprodukten och intäkterna.

I de bästa fallen var maskinlärande team utspridda i separata enheter eller inbäddade i produktgrupper, så att deras modeller och inferenser kunde integreras fullständigt i plattformar. Den stora klyftan ledde till många misslyckade projekt, sänkta investeringar och förlorade möjligheter.

GenAI: Från Stödfunktion till Vinstcenter

Sedan anlände GenAI och allt förändrades. Utgivningen av kraftfulla stora språkmodeller, som GPT-familjen och öppen källkodsvarianter som Llama, vände landskapet virtuellt över en natt. Plötsligt var data teams inte bara analyserande företaget, utan blev en integrerad del av att bygga AI-produkter och upplevelser. När du lyckas integrera en LLM i en kundvänd applikation eller en intern arbetsflöde, är du inte längre bara informerande företaget; du driver det. Ett välgenomfört GenAI-system kan automatisera kundsupport, generera marknadsinnehåll, anpassa användarupplevelser eller till och med ge den data som behövs för att informera och utbilda framväxande agenter AI-system. Dessa förmågor påverkar direkt intäktsströmmar. I verkligheten har data teams arbetsprodukt skiftat från PowerPoint-bilder till levande AI-drivna applikationer.

GenAI-team började med innovationsgrupper, som levererade bevis för koncept som genererade “wow-faktor”. Och snart nog var alla AI-tekniker, som spriddes över organisationer.

Data teams upptäckte snart att de stod inför en ny fråga: “När kommer du att bli ett vinstcenter?” När AI-tekniker började skapa fantastiska verktyg, var det tydligt att tiden var mogen att slå samman två team: de som kontrollerade data och de som byggde applikationerna.

Överväg ett detaljhandelsföretag som distribuerar en GenAI-chattbot för att hantera försäljningsförfrågningar, eller en bank som lanserar en AI-driven, personlig investeringsrådgivare. Dessa är inte traditionella IT-sidoprojekt – de är digitala produkter som skapar kundvärde och genererar intäkter. Men samtidigt, för att skapa dessa system i stor skala, behöver AI-teknikerteam kunna komma åt och operationalisera data som traditionella team har förberett.

Cheferna har märkt det. Förväntningarna på data teams är himmelhöga nu, med styrelser och VD:ar som ser till oss för att leverera nästa AI-bränsle för tillväxt. Vi har gått från att vara bakom kulisserna analytiker till frontline innovatörer. Det är en spännande position att vara i, men det kommer med intensivt tryck för att leverera resultat i stor skala.

Från Utforskning till Produkt – En Enkelriktad Dörr

Skiftet från utforskande analys till produktcentrerad AI är profound och oåterkallelig. Varför oåterkallelig? Eftersom GenAI:s påverkan på företaget visar sig vara för stor för att återgå till en R&D-leksak. Enligt en nyligen global undersökning, 96% av IT-chefer har nu integrerat AI i sina kärnprocesser – upp från 88% bara ett år tidigare. Med andra ord, nästan varje företag har gått från att experimentera med AI till att införliva det i uppdragskritiska arbetsflöden. När du väl har korsat den tröskeln där AI levererar värde i produktion, finns det ingen återvändo.

Denna nya AI-drivna fokus förändrar takten och mentaliteten hos data teams. I det förflutna hade vi lyxen av långa upptäcktsprojekt och öppna analyser. Idag, om vi bygger en AI-funktion, behöver den vara produktionsklar, kompatibel och tillförlitlig – som vilken kundvänd produkt som helst. Vi har gått in i vad vissa kallar “Autonomous Age” av data science. Frågan som vägleder vårt arbete är inte längre “vilka insikter kan vi avslöja?” utan “vilket intelligent system kan vi bygga som agerar på insikter i realtid?”

GenAI-system är inte bara svar på frågor; de börjar fatta beslut. Det är en enkelriktad dörr: efter att ha upplevt denna typ av autonomi och påverkan, kommer företag inte att nöja sig med statiska rapporter och manuell beslutsfattning. Nu mer än någonsin behöver data teams vara intressent- och produktorienterade.

Den Hårda Sanningen: Varför De Flesta GenAI-Initiativ Misslyckas

Mitt i all spänning finns en sansad verklighet: de flesta GenAI-initiativ misslyckas. Det visar sig att att framgångsrikt distribuera GenAI är extremt utmanande. En nyligen MIT-studie fann att en förbluffande 95% av företags GenAI-pilotprojekt aldrig levererar en mätbar ROI. Bara cirka 5% av AI-piloter uppnår snabba intäktsvinster eller meningsfull affärspåverkan. Detta beror inte på brist på potential – det beror på komplexiteten i att göra AI rätt.

När vi gräver djupare i orsakerna till misslyckanden, målar MIT-forskningen en tydlig bild. Många projekt snubblar på grund av “hype över hårt arbete” – team jagar flashiga demoanvändningsfall i stället för att investera i de tråkiga grundläggningarna för integration, validering och övervakning. Andra misslyckas på grund av det klassiska “skräp in, skräp ut”-syndromet – dålig datakvalitet och siloade datapipeliner dömer projektet innan AI ens får chansen att göra sitt jobb. Ofta är det inte AI-modellen som är fel, utan den omgivande miljön. Som forskarna säger, misslyckas GenAI inte i labbet; det misslyckas i företaget när det krockar med otydliga mål, dålig data och organisatorisk tröghet. I praktiken stannar de flesta AI-piloter vid proof-of-concept-stadiet och går aldrig vidare till full produktion.

Denna verklighetscheck är en värdefull läxa. Den berättar för oss att även om data teams nu är i rampljuset, kämpar de flesta för att möta de höjda förväntningarna. För att GenAI ska lyckas i stor skala, måste vi korsa en betydligt högre ribba än vi gjorde under de gamla BI-dagarna.

Bortom Lista Prompts: Data, Styrning & Infrastruktur Är Viktiga

Vad skiljer de 5% av AI-projekt som blomstrar från de 95% som sviktar? I min erfarenhet (och som forskning bekräftar), fokuserar vinnarna på grundläggande förmågor – data, styrning och infrastruktur. GenAI är inte magi; det byggs på data. Utan högkvalitativa, välstyrda datapipeliner som matar modellerna, kommer även den bästa AI att producera ojämnt resultat. Summit Partners uttryckte det väl i en nyligen analys: ”lyckandet för något system eller process som använder AI hänger på kvaliteten, strukturen och tillgängligheten av den data som driver det.”

I praktiska termer betyder detta att organisationer måste dubbla ner på dataarkitektur och styrning när de antar GenAI. Har du enhetliga, tillgängliga data lagrar som din AI kan dra nytta av (och jag menar ALLA data lagrar, inklusive datacenter, hyperscalers och tredjeparts SaaS-system, bland andra)? Är den datan ren, kuraterad och förenlig med regler? Finns det tydlig datahärstamning och granskbarhet (så att du kan lita på AI-utdata och veta hur de kom till)? Dessa frågor är nu i förgrunden.

GenAI Tvingar Företag Att Slutligen Få Ordning På Sitt Datahus

Styrning har också tagit på sig ny betydelse. När en AI-modell kan potentiellt generera ett felaktigt svar (eller ett stötande), är robust styrning inte valfri – det är obligatoriskt. Kontroller som versionering, partiskhetskontroll, mänsklig granskning och stränga säkerhetsåtgärder kring känsliga datainmatningar är essentiella. Utan ordentlig styrning, utbildning och tydligt definierade mål, kommer även en stark AI-verktyg att kämpa för att få fäste i företaget.

Och låt oss inte glömma infrastruktur. Distribution av GenAI i stor skala kräver betydande beräkningskraft och rigorös ingenjörskonst. Modeller behöver serveras i realtid, över möjligtvis miljontals förfrågningar med låg latens. De behöver ofta GPU:er eller specialiserad maskinvara, samt kontinuerlig övervakning, underhåll och livscykelhantering. Kort sagt, du behöver industriell AI-infrastruktur som är säker, skalbar och robust. Detta är där konceptet Private AI kommer in som ramverket som förenar infrastruktur med data och styrning. Private AI syftar på utvecklingen av AI inom en kontrollerad och säker miljö, som säkerställer datasäkerhet och förenlighet.

Slutsatsen är att GenAI:s framgång beror på harmonin mellan tre pelare: data, styrning och infrastruktur. Utan en av dem riskerar du att hamna bland de 95% av projekt som aldrig når utanför demo-stadiet.

Varför AI-Ingenjörer Inte Kan Göra Det Enbart

Med tanke på dessa krav är det tydligt att att bara anställa några begåvade AI-tekniker inte är en silverkula. Vi har lärt oss denna läxa under de senaste åren i dataindustrin. I början av data science-boomen försökte företag hitta “enhörningar”-data scientists som kunde göra allt – bygga modeller, skriva kod, hantera data och distribution. Den myten har sedan dess avslöjats. Som en erfaren data scientist uttryckte det, ”en modell som sitter i en anteckningsbok gör inte någonting för företaget.” Du behöver inbädda den modellen i en applikation eller process för att den ska skapa värde. Och det kräver ett lagarbete som spänner över flera kompetenser.

I slutet av 2010-talet såg vi data teams diversifieras i distinkta roller: dataingenjörer började bygga robusta pipelines, maskinlärande ingenjörer fokuserade på produktion av modeller, analytiska ingenjörer hanterade den analytiska lagret, och så vidare.

Idag höjer GenAI ribban ännu högre. Ja, du behöver AI-specialister (prompt-tekniker, LLM-fintuners, etc.), men dessa specialister kommer att stöta på ett vägg om de inte har mogna datapipeliner, styrningsramverk och säkra plattformar att arbeta med. En AI-tekniker kan prototypa en bra språkmodell i en sandlåda, men att förvandla den till en produkt som används av tusentals eller miljontals kräver samarbete med säkerhetsteam, förenlighetschefer, dataarkitekter, webbplats-tillförlitlighetstekniker och mer.

AI är ett lagsport. Det är frestande att tro att du kan släppa en state-of-the-art-modell i ditt företag och plötsligt ha ett AI-driven företag. Företagen som lyckas med AI är de som har byggt tvärfunktionella team, eller “AI-fabriker”, som förenar alla dessa bitar. Deras data teams har i praktiken utvecklats till full-stack AI-produktteam, som blandar data, modellering, ingenjörskonst och driftskompetens. De bygger och distribuerar sina verktyg på ett data-driven, produktlett sätt, med värdeskapande inbäddat i varje KPI.

Nästa Generation av Data Teams

Så, vad har framtiden att bjuda på för den nya “data team”? Här är en glimt av vad som kommer för dessa team under de närmaste åren:

  • Mindre manuell ETL/ELT: Tråkig datahantering kommer att minska. Med mer automatiserade datapipeliner och AI-assisterad integration, kommer team inte att spendera halva sin tid på att rensa och flytta data. Gruntarbetet med dataförberedelse kommer att hanteras alltmer av intelligenta system, vilket tillåter människor att fokusera på högre design och kvalitetskontroll.
  • Färre instrumentpaneler: Erans av ändlöst justering av instrumentpanelsfilter är på väg ut. AI kommer att möjliggöra mer naturlig språkförfrågan och dynamisk insikt-leverans. I stället för förbyggda instrumentpaneler för varje fråga, kommer användare att få konversationssvar från AI (med källdata bifogad). Data teams kommer att spendera mindre tid på att utveckla statiska rapporter och mer tid på att träna AI för att generera insikter på flyget.
  • Mer AI-nativ produktutveckling: Data teams kommer att vara i hjärtat av produktinnovation. Antingen utvecklar de en ny kundvänd AI-funktion eller en intern AI-verktyg som optimerar verksamheten, kommer dessa team att agera som produktteam. De kommer att använda programvaruutvecklingspraxis, snabb prototypning, A/B-testning och användarupplevelse-design – inte bara dataanalys. Varje data team kommer i praktiken att bli ett AI-produktteam som levererar direkt affärsvärde.
  • Autonoma agenter på uppgång: I en inte alltför avlägsen framtid, kommer data teams att distribuera autonoma AI-agenter för att hantera rutinbeslut och uppgifter. I stället för att bara förutsäga resultat, kommer dessa agenter att vara auktoriserade att vidta vissa åtgärder (med tillsyn). Tänk dig en AI-opsagent som kan upptäcka en avvikelse och automatiskt öppna en åtgärdsbiljett, eller en försäljnings AI-agent som justerar e-handelspriser i realtid. Data teams kommer att vara ansvariga för att bygga och hantera dessa agenter, och driva gränserna för vad automation kan uppnå.

I ljuset av dessa förändringar, kan man verkligen säga “data teams som vi kände dem är döda.” Excelspecialisterna och instrumentpanelsrörmokarna har gett plats för något nytt: AI-första team som är flytande i data, kod och affärsstrategi. Men långt ifrån att vara en dödsruna, är detta en firande. Den nya generationen av data teams är just början, och de är mer värdefulla än någonsin

Så, kom ihåg, dataingenjören är död, länge leve dataingenjören! Data teams som vi kände dem är borta, men länge leve de nya data teams – må de regera i denna AI-drivna värld med insikt, ansvar och djärvhet.

Sergio Gago är CTO på Cloudera, med över 20 års erfarenhet av AI/ML, kvantberäkning och datastyrd arkitektur. Tidigare var han Managing Director för AI/ML och kvant på Moodys Analytics, och han har också haft CTO-roller på Rakuten, Qapacity och Zinio. Sergio är en stark förespråkare för tillförlitlig datainfrastruktur och tror att AI kommer att utvecklas till företagets operativsystem år 2030.