Connect with us

Equipes de Dados Estão Mortas, Longa Vida às Equipes de Dados

Líderes de pensamento

Equipes de Dados Estão Mortas, Longa Vida às Equipes de Dados

mm

Sim, o título é sensacionalista e provocativo, mas como um CTO com muitos anos em dados, testemunhei uma transformação que justifica o drama. A equipe de dados tradicional – a equipe de back-office que processa relatórios e dashboards – está efetivamente morta. Em seu lugar, surge um novo tipo de equipe de dados: uma equipe impulsionada por IA, orientada por produtos, com impacto direto nos lucros. Já não são um centro de custos, mas um grupo gerador de lucros.

A Jornada de Inteligência de Negócios para Aprendizado de Máquina

Não faz muito tempo, as equipes de dados eram sinônimas de inteligência de negócios (BI). Éramos os historiadores dos dados da empresa, vivendo em SQL e planilhas, encarregados de responder “O que aconteceu no último trimestre?” À medida que as tecnologias de big data, como Hadoop, surgiam e o termo “cientista de dados” se tornou o novo emprego sexy, as equipes de dados evoluíram. No meio da década de 2010, estávamos fazendo mais do que relatórios; aventuramo-nos em visualização de dados e análises interativas, produzindo dashboards dinâmicos para todos os departamentos. O trabalho era sobre manipulação de dados, misturando conjuntos de dados de fontes e formatos diferentes e tentando entender o conhecimento do domínio.

Então, o final da década de 2010 trouxe a era do aprendizado de máquina. As equipes de dados começaram a contratar cientistas de dados para construir modelos preditivos e descobrir insights em vastos conjuntos de dados. Passamos de descrever o passado para prever o futuro: modelos de churn, motores de recomendação, previsões de demanda – você nomeia. Mas mesmo então, nossas saídas eram apresentações e insights, não produtos ao vivo. Funcionávamos como uma agência de serviços interna, aconselhando os negócios por meio de análises. Em outras palavras, éramos centros de custos – valiosos, sim, mas um passo afastado do produto e dos lucros principais.

Nos melhores casos, as equipes de aprendizado de máquina foram dispersas em unidades separadas ou incorporadas a grupos de produtos, para que seus modelos e inferências pudessem ser totalmente integrados às plataformas. A grande divisão levou a numerosos projetos fracassados, investimentos perdidos e oportunidades perdidas.

GenAI: Da Função de Suporte ao Centro de Lucros

Então, o GenAI chegou e tudo mudou. O lançamento de poderosos modelos de linguagem grande, como a família GPT e variantes de código aberto como Llama, virou o cenário virtualmente da noite para o dia. De repente, as equipes de dados não estavam apenas analisando os negócios, mas se tornaram fundamentais para construir produtos e experiências de IA. Quando você integra com sucesso um LLM em um aplicativo voltado para o cliente ou em um fluxo de trabalho interno, você não está apenas informando os negócios; você está impulsionando-os. Um sistema GenAI bem implementado pode automatizar o suporte ao cliente, gerar conteúdo de marketing, personalizar experiências de usuário ou até fornecer os dados necessários para informar e treinar sistemas de IA emergentes. Essas capacidades afetam diretamente as receitas. Em essência, o produto de trabalho da equipe de dados mudou de slides do PowerPoint para aplicativos ao vivo impulsionados por IA.

As equipes GenAI começaram com grupos de inovação, entregando provas de conceito que geraram “fator de surpresa”. E logo, todos eram engenheiros de IA, espalhando TI sombra em organizações.

As equipes de dados logo se viram diante de uma nova pergunta: “Quando você se tornará um centro de lucros?” À medida que os engenheiros de IA começaram a criar ferramentas incríveis, ficou claro que era hora de mesclar duas equipes: aquelas que controlavam os dados e aquelas que construíam os aplicativos.

Considere uma empresa varejista que implanta um chatbot GenAI para lidar com consultas de vendas ou um banco que lança um consultor de investimentos personalizados impulsionado por IA. Esses não são projetos laterais tradicionais de TI – são produtos digitais que criam valor para o cliente e geram receita. No entanto, ao mesmo tempo, para criar esses sistemas em escala, as equipes de engenharia de IA precisam ser capazes de acessar e operacionalizar os dados que as equipes tradicionais prepararam.

Os executivos notaram. As expectativas das equipes de dados são altíssimas agora, com conselhos e CEOs olhando para nós para entregar o próximo vetor de crescimento impulsionado por IA. Passamos de ser analistas atrás das cenas para inovadores de linha de frente. É uma posição emocionante para estar, mas vem com uma pressão intensa para entregar resultados em escala.

Da Exploração ao Produto – Uma Porta de Mão Única

A mudança da análise exploratória para o AI centrado em produtos é profunda e irreversível. Por que irreversível? Porque o impacto do GenAI nos negócios está se provando grande demais para reverter para um brinquedo de P&D. De acordo com uma pesquisa global recente, 96% dos líderes de TI agora integraram IA em seus processos principais – um aumento em relação aos 88% apenas um ano antes. Em outras palavras, quase todas as empresas passaram de experimentar IA para incorporá-la em fluxos de trabalho de missão crítica. Uma vez que você cruza esse limiar em que a IA está entregando valor em produção, não há volta.

Essa nova ênfase em IA muda o ritmo e a mentalidade das equipes de dados. No passado, tínhamos o luxo de projetos de descoberta longos e análise de fim aberto. Hoje, se estamos construindo uma característica de IA, ela precisa estar pronta para produção, em conformidade e confiável – como qualquer produto voltado para o cliente. Entramos no que alguns chamam de “Era Autônoma” da ciência de dados. A pergunta que orienta nosso trabalho não é mais “quais insights podemos descobrir?” mas “qual sistema inteligente podemos construir que age sobre insights em tempo real?”

Os sistemas GenAI não estão apenas respondendo perguntas; estão começando a tomar decisões. É uma porta de mão única: após experimentar esse tipo de autonomia e impacto, as empresas não se contentarão com relatórios estáticos e tomada de decisão manual. Agora mais do que nunca, as equipes de dados precisam ser orientadas por partes interessadas e produtos.

A Verdade Dura: Por Que a Maioria das Iniciativas GenAI Falha

Em meio a todo o entusiasmo, há uma realidade sóbria: a maioria das iniciativas GenAI falha. Fica claro que implantar GenAI com sucesso é extremamente desafiador. Um estudo recente do MIT encontrou que um impressionante 95% dos projetos piloto de GenAI de empresa nunca entregam um ROI mensurável. Apenas cerca de 5% dos pilotos de IA realmente alcançam ganhos de receita rápidos ou impacto comercial significativo. Isso não se deve à falta de potencial – se deve à complexidade de fazer IA corretamente.

Ao investigar as causas do fracasso, a pesquisa do MIT pinta um quadro claro. Muitos projetos tropeçam porque “hype sobre trabalho árduo” – as equipes perseguem casos de uso de demonstração impressionantes em vez de investir nos fundamentos entediantes de integração, validação e monitoramento. Outros falham por causa do clássico “lixo para lixo” – a má qualidade dos dados e os pipelines de dados isolados condenam o projeto antes que a IA faça seu trabalho. Muitas vezes, não é o modelo de IA que está com defeito, é o ambiente circundante. Como os pesquisadores colocam, o GenAI não falha no laboratório; falha na empresa quando colide com metas vagas, dados ruins e inércia organizacional. Na prática, a maioria dos pilotos de IA para no estágio de conceito e nunca se forma para implantação completa de produção.

Essa verificação de realidade é uma lição valiosa. Ela nos diz que, embora as equipes de dados agora estejam em evidência, a maioria está lutando para atender às expectativas aumentadas. Para que o GenAI tenha sucesso em escala, devemos ultrapassar uma barra muito mais alta do que fizemos nos velhos dias de BI.

Além de Promptos Inteligentes: Dados, Governança e Infraestrutura Importam

O que separa os 5% de projetos de IA que prosperam dos 95% que falham? Em minha experiência (e como a pesquisa confirma), os vencedores se concentram em capacidades fundamentais – dados, governança e infraestrutura. O GenAI não é mágico; é construído em dados. Sem pipelines de dados de alta qualidade, bem governados, alimentando seus modelos, mesmo a melhor IA produzirá resultados erráticos. Summit Partners colocou bem em uma análise recente: “o sucesso de qualquer sistema ou processo que usa IA depende da qualidade, estrutura e acessibilidade dos dados que o alimentam.”

Em termos práticos, isso significa que as organizações devem dobrar a aposta na arquitetura de dados e governança à medida que adotam o GenAI. Você tem lojas de dados unificadas, acessíveis, que sua IA possa usar (e quero dizer todas as lojas de dados, incluindo centros de dados, hyperscalers e sistemas SaaS de terceiros, entre outros)? Esses dados estão limpos, curados e em conformidade com as regulamentações? Há linhagem de dados clara e auditabilidade (para que você possa confiar nas saídas da IA e saber como elas foram geradas)? Essas perguntas agora estão à frente.

O GenAI Está Forçando as Empresas a Finalmente Organizar a Casa de Dados.

A governança também ganhou um novo significado. Quando um modelo de IA pode potencialmente gerar uma resposta errada (ou ofensiva), uma governança robusta não é opcional – é obrigatória. Controles como versionamento, verificação de viés, revisão humana no loop e medidas de segurança estritas em torno de entradas de dados sensíveis são essenciais. Sem uma governança adequada, treinamento e metas claramente definidas, mesmo uma ferramenta de IA forte lutará para ganhar tração nos negócios.

E não esqueçamos a infraestrutura. Implantar GenAI em escala exige poder computacional significativo e engenharia rigorosa. Os modelos precisam ser servidos em tempo real, em possivelmente milhões de consultas com baixa latência. Eles muitas vezes precisam de GPUs ou hardware especializado, bem como monitoramento, retenção e gerenciamento de ciclo de vida contínuo. Em resumo, você precisa de infraestrutura de IA de classe industrial que seja segura, escalável e resiliente. É aqui que o conceito de Private AI entra como o quadro que une infraestrutura com dados e governança. Private AI refere-se ao desenvolvimento de IA dentro de um ambiente controlado e seguro, garantindo segurança e conformidade de dados.

O bottom line é que o sucesso do GenAI depende da harmonia de três pilares: dados, governança e infraestrutura. Sem um, você arrisca se juntar aos 95% dos projetos que nunca escalonam além do estágio de demonstração.

Por Que os Engenheiros de IA Não Podem Fazer Isso Sozinhos

Dadas essas exigências, está claro que simplesmente contratar alguns engenheiros de IA talentosos não é uma bala de prata. Aprendemos essa lição nos últimos anos na indústria de dados. Nos primeiros dias do boom de ciência de dados, as empresas tentaram encontrar “unicórnios” cientistas de dados que pudessem fazer tudo – construir modelos, escrever código, lidar com dados e implantação. Esse mito desde então foi desmascarado. Como um veterano cientista de dados brincou, “um modelo sentado em uma caderno não faz nada para o negócio.” Você precisa incorporar esse modelo em um aplicativo ou processo para criar valor. E fazer isso exige um esforço de equipe que abrange várias habilidades.

No final da década de 2010, vimos as equipes de dados se diversificarem em papéis distintos: os engenheiros de dados começaram a construir pipelines robustos, os engenheiros de aprendizado de máquina se concentraram na produção de modelos, os engenheiros de análise gerenciaram a camada de análise, e assim por diante.

Hoje, o GenAI eleva a barra ainda mais. Sim, você precisa de especialistas em IA (engenheiros de prompt, ajustadores de LLM, etc.), mas esses especialistas atingirão um limite se não tiverem pipelines de dados maduros, estruturas de governança e plataformas seguras para trabalhar. Um engenheiro de IA pode prototipar um grande modelo de linguagem em um sandbox, mas transformar isso em um produto usado por milhares ou milhões exige colaboração com equipes de segurança, oficiais de conformidade, arquitetos de dados, engenheiros de confiabilidade do site e mais.

A IA é um esporte de equipe. É tentador pensar que você pode colocar um modelo de estado da arte em seu negócio e ter uma empresa impulsionada por IA de repente. As empresas que estão tendo sucesso com a IA são aquelas que construíram equipes multifuncionais, ou “fábricas de IA”, que reúnem todas essas peças. Suas equipes de dados efetivamente evoluíram para equipes de produtos de IA de pilha completa, mesclando expertise em dados, modelagem, engenharia e operações. Eles estão construindo e implantando suas ferramentas de forma orientada por dados e liderada por produtos, com geração de valor incorporada em cada KPI.

A Próxima Geração de Equipes de Dados

Então, o que o futuro reserva para a nova “equipe de dados”? Aqui está um vislumbre do que está por vir para essas equipes nos próximos anos:

  • Menos ETL/ELT manual: A tediosa manipulação de dados diminuirá. Com pipelines de dados mais automatizados e integração assistida por IA, as equipes não gastarão metade do tempo limpando e movendo dados. O trabalho braçal de preparação de dados será cada vez mais tratado por sistemas inteligentes, permitindo que os humanos se concentrem em design e controle de qualidade de nível superior.
  • Menos dashboards: A era de ajuste contínuo de filtros de dashboard está desaparecendo. A IA permitirá consultas de linguagem natural mais naturais e entrega de insights dinâmicos. Em vez de dashboards pré-construídos para cada pergunta, os usuários obterão respostas conversacionais da IA (com dados de origem anexados). As equipes de dados gastarão menos tempo desenvolvendo relatórios estáticos e mais tempo treinando a IA para gerar insights em tempo real.
  • Mais desenvolvimento de produtos nativos de IA: As equipes de dados estarão no coração da inovação de produtos. Seja desenvolvendo uma nova característica de IA voltada para o cliente ou uma ferramenta interna de IA que otimiza operações, essas equipes agirão como equipes de produtos. Elas empregarão práticas de desenvolvimento de software, prototipagem rápida, testes A/B e design de experiência do usuário – não apenas análise de dados. Cada equipe de dados, em essência, se tornará uma equipe de produtos de IA que entrega valor de negócios direto.
  • Agentes autônomos em ascensão: No futuro não muito distante, as equipes de dados implantarão agentes autônomos de IA para lidar com decisões e tarefas rotineiras. Em vez de apenas prever resultados, esses agentes estarão autorizados a tomar certas ações (com supervisão). Imagine um agente de IA de operações que pode detectar uma anomalia e abrir automaticamente um ticket de remediação, ou um agente de vendas de IA que ajusta os preços de e-commerce em tempo real. As equipes de dados serão responsáveis por construir e gerenciar esses agentes, empurrando os limites do que a automação pode alcançar.

À luz dessas mudanças, alguém poderia dizer com razão “as equipes de dados como as conhecíamos estão mortas.” Os especialistas em planilhas e encanadores de dashboards deram lugar a algo novo: equipes de primeira linha de IA que são fluentes em dados, código e estratégia de negócios. Mas longe de ser um elogio fúnebre, isso é um celebração. A nova geração de equipes de dados está apenas começando, e elas são mais valiosas do que nunca.

Então, lembre-se, o engenheiro de dados está morto, longa vida ao engenheiro de dados! As equipes de dados como as conhecíamos estão mortas, mas longa vida às novas equipes de dados – que elas reinem neste mundo impulsionado por IA com insight, responsabilidade e audácia.

Sergio Gago é CTO da Cloudera, trazendo mais de 20 anos de experiência em AI/ML, computação quântica e arquiteturas orientadas a dados. Anteriormente Diretor Geral de AI/ML & Quantum na Moody’s Analytics, ele também ocupou funções de CTO na Rakuten, Qapacity e Zinio. Sergio é um forte defensor de infraestrutura de dados confiáveis, acreditando que a IA evoluirá para o sistema operacional da empresa até 2030.