Líderes de pensamento

Equipes de Dados Estão Mortas, Longa Vida às Equipes de Dados

mm

Sim, o título é sensacionalista e provocativo, mas como um CTO com muitos anos em dados, eu testemunhei uma transformação que justifica o drama. A equipe de dados tradicional – a equipe de escritório que processa relatórios e dashboards – está efetivamente morta. Em seu lugar, um novo tipo de equipe de dados está surgindo: uma equipe de produto impulsionada por IA, com impacto direto na receita. Eles não são mais um centro de custos, mas um grupo que gera lucro.

A Jornada da Inteligência de Negócios para a Aprendizagem de Máquina

Não faz muito tempo, as equipes de dados eram sinônimas com inteligência de negócios (BI). Éramos os historiadores dos dados da empresa, vivendo em SQL e planilhas, encarregados de responder “O que aconteceu no último trimestre?” À medida que as tecnologias de big data, como o Hadoop, surgiram e o termo “cientista de dados” se tornou o novo emprego sexy, as equipes de dados evoluíram. No meio da década de 2010, estávamos fazendo mais do que relatórios; aventuramo-nos em visualização de dados e análise interativa, produzindo dashboards dinâmicos para todos os departamentos. O trabalho era sobre manipulação de dados, misturando conjuntos de dados de fontes e formas diferentes, e tentando entender o conhecimento do domínio.

Em seguida, o final da década de 2010 trouxe a era da aprendizagem de máquina. As equipes de dados começaram a contratar cientistas de dados para construir modelos preditivos e descobrir insights em vastos conjuntos de dados. Mudamos de descrever o passado para prever o futuro: modelos de churn, motores de recomendação, previsões de demanda – você nomeia. Mas mesmo então, nossas saídas eram apresentações e insights, não produtos ao vivo. Funcionamos como um escritório de serviços internos, aconselhando os negócios por meio da análise. Em outras palavras, éramos centros de custos – valiosos, sim, mas um passo afastado do produto e da receita.

Nas melhores hipóteses, as equipes de aprendizagem de máquina foram dispersas em unidades separadas ou incorporadas a grupos de produtos, para que seus modelos e inferências pudessem ser totalmente integrados às plataformas. A grande divisão levou a numerosos projetos fracassados, investimentos perdidos e oportunidades perdidas.

GenAI: Da Função de Suporte ao Centro de Lucro

Então, o GenAI chegou e tudo mudou. O lançamento de poderosos modelos de linguagem grande, como a família GPT e variantes de código aberto como Llama, virou o cenário virtualmente da noite para o dia. De repente, as equipes de dados não estavam mais apenas analisando os negócios, mas se tornaram integrais para construir produtos e experiências de IA. Quando você integra com sucesso um LLM em um aplicativo orientado ao cliente ou em um fluxo de trabalho interno, você não está mais apenas informando os negócios; você está impulsionando-os. Um sistema GenAI bem implementado pode automatizar o suporte ao cliente, gerar conteúdo de marketing, personalizar experiências do usuário ou até fornecer os dados necessários para informar e treinar sistemas de IA emergentes. Essas capacidades afetam diretamente as receitas. Em essência, o produto de trabalho da equipe de dados mudou de slides do PowerPoint para aplicativos ao vivo impulsionados por IA.

As equipes GenAI começaram com grupos de inovação, entregando provas de conceito que geraram “fator de surpresa”. E logo, todos eram engenheiros de IA, espalhando TI sombra em organizações.

As equipes de dados logo se viram enfrentando uma nova pergunta: “Quando você se tornará um centro de lucro?” À medida que os engenheiros de IA começaram a criar ferramentas incríveis, ficou claro que era hora de mesclar duas equipes: aquelas que controlavam os dados e aquelas que construíam os aplicativos.

Considere uma empresa de varejo que implanta um chatbot GenAI para lidar com consultas de vendas ou um banco que lança um consultor de investimentos personalizados impulsionado por IA. Esses não são projetos de TI tradicionais – são produtos digitais que criam valor para o cliente e geram receita. No entanto, ao mesmo tempo, para criar esses sistemas em escala, as equipes de engenharia de IA precisam ser capazes de acessar e operacionalizar os dados que as equipes tradicionais prepararam.

Os executivos notaram. As expectativas das equipes de dados são altas agora, com conselhos e CEOs procurando por nós para entregar o próximo vetor de crescimento impulsionado por IA. Passamos de ser analistas de bastidores para inovadores de linha de frente. É uma posição emocionante para estar, mas vem com uma pressão intensa para entregar resultados em escala.

Da Exploração ao Produto – Uma Porta de Mão Única

A mudança da análise exploratória para o produto centrado em IA é profunda e irreversível. Por que irreversível? Porque o impacto do GenAI nos negócios está se provando muito grande para reverter para um brinquedo de R&D. De acordo com uma pesquisa global recente, 96% dos líderes de TI já integraram IA em seus processos principais – contra 88% apenas um ano antes. Em outras palavras, quase todas as empresas passaram de experimentar com IA para incorporá-la em fluxos de trabalho críticos. Uma vez que você cruza esse limiar em que a IA está entregando valor em produção, não há volta.

Essa nova ênfase em IA muda o ritmo e a mentalidade das equipes de dados. No passado, tínhamos o luxo de projetos de descoberta longos e análise aberta. Hoje, se estamos construindo uma característica de IA, ela precisa estar pronta para produção, compatível e confiável – como qualquer produto orientado ao cliente. Entramos naquilo que alguns chamam de “Era Autônoma” da ciência de dados. A pergunta que orienta nosso trabalho não é mais “quais insights podemos descobrir?” mas “qual sistema inteligente podemos construir que age em insights em tempo real?”

Os sistemas GenAI não estão apenas respondendo perguntas; estão começando a tomar decisões. É uma porta de mão única: após experimentar esse tipo de autonomia e impacto, as empresas não se contentarão com relatórios estáticos e tomada de decisão manual. Agora mais do que nunca, as equipes de dados precisam ser orientadas por partes interessadas e produto.

A Verdade Difícil: Por Que a Maioria das Iniciativas GenAI Falha

Em meio a todo o entusiasmo, há uma realidade sóbria: a maioria das iniciativas GenAI falha. Fica claro que implantar com sucesso o GenAI é extremamente desafiador. Um estudo recente do MIT descobriu que um impressionante 95% dos projetos piloto de GenAI de empresas nunca entregam um ROI mensurável. Apenas cerca de 5% dos pilotos de IA realmente alcançam ganhos de receita rápidos ou impacto comercial significativo. Isso não se deve à falta de potencial – é devido à complexidade de fazer IA corretamente.

Investigando as causas do fracasso, a pesquisa do MIT pinta um quadro claro. Muitos projetos tropeçam devido ao “hype sobre o trabalho árduo” – as equipes perseguem casos de uso de demonstração impressionantes em vez de investir nos fundamentos entediantes da integração, validação e monitoramento. Outros falham com a síndrome clássica de “lixo dentro, lixo fora” – a qualidade ruim dos dados e os pipelines de dados isolados condenam o projeto antes que a IA faça seu trabalho. Muitas vezes, não é o modelo de IA que está com defeito, é o ambiente ao seu redor. Como os pesquisadores colocam, o GenAI não falha no laboratório; falha na empresa quando colide com metas vagas, dados ruins e inércia organizacional. Na prática, a maioria dos pilotos de IA para no estágio de prova de conceito e nunca se forma em implantação de produção completa.

Essa verificação de realidade é uma lição valiosa. Ela nos diz que, embora as equipes de dados agora estejam em evidência, a maioria está lutando para atender às expectativas aumentadas. Para que o GenAI tenha sucesso em escala, devemos ultrapassar uma barra muito mais alta do que a que tínhamos nos velhos dias de BI.

Além de Promptos Inteligentes: Dados, Governança e Infraestrutura Importam

O que separa os 5% de projetos de IA que prosperam dos 95% que tropeçam? Em minha experiência (e como a pesquisa confirma), os vencedores se concentram em capacidades fundamentais – dados, governança e infraestrutura. O GenAI não é mágico; é construído em dados. Sem pipelines de dados de alta qualidade, bem governados, alimentando seus modelos, mesmo a melhor IA produzirá resultados erráticos. Summit Partners colocou bem em uma análise recente: “o sucesso de qualquer sistema ou processo que usa IA depende da qualidade, estrutura e acessibilidade dos dados que o alimentam.”

Em termos práticos, isso significa que as organizações devem dobrar a aposta na arquitetura de dados e governança à medida que adotam o GenAI. Você tem lojas de dados unificadas e acessíveis que sua IA pode usar (e eu quero dizer todas as lojas de dados, incluindo centros de dados, hyperscalers e sistemas de SaaS de terceiros, entre outros)? Esses dados estão limpos, curados e compatíveis com regulamentos? Há uma linhagem de dados clara e auditoria (para que você possa confiar nas saídas da IA e saber como elas foram geradas)? Essas perguntas agora estão à frente.

O GenAI Está Forçando as Empresas a Finalmente Organizar Sua Casa de Dados

A governança também assumiu um novo significado. Quando um modelo de IA pode potencialmente gerar uma resposta errada (ou ofensiva), uma governança robusta não é opcional – é obrigatória. Controles como versionamento, verificação de viés, revisão humana no loop e medidas de segurança estritas em torno de entradas de dados sensíveis são essenciais. Sem governança adequada, treinamento e metas claramente definidas, mesmo uma ferramenta de IA forte lutará para ganhar tração nos negócios.

E não esqueçamos a infraestrutura. Implantar o GenAI em escala exige poder computacional significativo e engenharia rigorosa. Os modelos precisam ser servidos em tempo real, em possivelmente milhões de consultas com baixa latência. Eles muitas vezes precisam de GPUs ou hardware especializado, bem como monitoramento, retenção e gerenciamento de ciclo de vida contínuos. Em resumo, você precisa de infraestrutura de IA industrial que seja segura, escalável e resiliente. É aqui que o conceito de IA Privada entra como o quadro que une infraestrutura com dados e governança. A IA Privada refere-se ao desenvolvimento de IA dentro de um ambiente controlado e seguro, garantindo segurança e conformidade de dados.

A linha de fundo é que o sucesso do GenAI depende da harmonia de três pilares: dados, governança e infraestrutura. Sem um, você arrisca se juntar aos 95% de projetos que nunca escalonam além do estágio de demonstração.

Por Que os Engenheiros de IA Não Podem Fazer Isso Sozinhos

Dadas essas exigências, é claro que contratar apenas alguns engenheiros de IA talentosos não é uma bala de prata. Aprendemos essa lição ao longo dos últimos anos na indústria de dados. Nos primeiros dias do boom da ciência de dados, as empresas tentaram encontrar “unicórnios” cientistas de dados que pudessem fazer tudo – construir modelos, escrever código, lidar com dados e implantação. Esse mito desde então foi desmascarado. Como um veterano cientista de dados brincou, “um modelo sentado em um notebook não faz realmente nada para o negócio.” Você precisa incorporar esse modelo em um aplicativo ou processo para que ele crie valor. E fazer isso requer um esforço de equipe que abrange várias habilidades.

No final da década de 2010, vimos as equipes de dados se diversificarem em papéis distintos: engenheiros de dados começaram a construir pipelines robustos, engenheiros de aprendizagem de máquina se concentraram na produção de modelos, engenheiros de análise gerenciaram a camada de análise e assim por diante.

Hoje, o GenAI eleva a barra ainda mais. Sim, você precisa de especialistas em IA (engenheiros de prompt, ajustadores de LLM, etc.), mas esses especialistas atingirão um muro se não tiverem pipelines de dados maduros, estruturas de governança e plataformas seguras para trabalhar. Um engenheiro de IA pode prototipar um grande modelo de linguagem em um sandbox, mas transformar isso em um produto usado por milhares ou milhões exige colaboração com equipes de segurança, oficiais de conformidade, arquitetos de dados, engenheiros de confiabilidade do site e mais.

A IA é um esporte de equipe. É tentador pensar que você pode soltar um modelo de estado da arte em seu negócio e ter uma empresa impulsionada por IA de repente. As empresas que estão tendo sucesso com a IA são aquelas que construíram equipes multifuncionais, ou “fábricas de IA”, que reúnem todas essas peças. Suas equipes de dados efetivamente evoluíram para equipes de produto de IA de pilha completa, misturando dados, modelagem, engenharia e especialização em operações. Eles estão construindo e implantando suas ferramentas de uma maneira orientada a dados e liderada por produtos, com geração de valor incorporada em cada KPI.

A Próxima Geração de Equipes de Dados

Então, o que o futuro reserva para a nova “equipe de dados”? Aqui está um vislumbre do que está por vir para essas equipes nos próximos anos:

  • Menos ETL/ELT manual: A tediosa manipulação de dados diminuirá. Com pipelines de dados mais automatizados e integração assistida por IA, as equipes não passarão metade do tempo limpando e movendo dados. O trabalho braçal da preparação de dados será cada vez mais tratado por sistemas inteligentes, permitindo que os humanos se concentrem em design e controle de qualidade de nível superior.
  • Menos dashboards: A era de ajustar infinitamente os filtros do dashboard está desaparecendo. A IA permitirá uma consulta de linguagem natural mais natural e entrega de insights dinâmicos. Em vez de dashboards pré-construídos para cada pergunta, os usuários obterão respostas conversacionais da IA (com dados de origem anexados). As equipes de dados passarão menos tempo desenvolvendo relatórios estáticos e mais tempo treinando a IA para gerar insights em tempo real.
  • Desenvolvimento de produtos mais nativos da IA: As equipes de dados estarão no coração da inovação de produtos. Seja desenvolvendo uma nova característica de IA orientada ao cliente ou uma ferramenta interna de IA que otimiza as operações, essas equipes agirão como equipes de produtos. Elas empregarão práticas de desenvolvimento de software, prototipagem rápida, teste A/B e design de experiência do usuário – não apenas análise de dados. Cada equipe de dados, em essência, se tornará uma equipe de produto de IA que entrega valor de negócios direto.
  • Agentes autônomos em ascensão: No futuro não muito distante, as equipes de dados implantarão agentes autônomos de IA para lidar com decisões e tarefas rotineiras. Em vez de apenas prever resultados, esses agentes estarão autorizados a tomar certas ações (com supervisão). Imagine um agente de operações de IA que pode detectar uma anomalia e abrir automaticamente um ticket de remediação, ou um agente de vendas de IA que ajusta os preços de comércio eletrônico em tempo real. As equipes de dados serão responsáveis por construir e gerenciar esses agentes, empurrando os limites do que a automação pode alcançar.

À luz dessas mudanças, alguém poderia dizer que “as equipes de dados como as conhecíamos estão mortas.” Os especialistas em planilhas e encanadores de dashboards deram lugar a algo novo: equipes de primeira linha de IA que são fluentes em dados, código e estratégia de negócios. Mas longe de ser um elogio fúnebre, isso é uma celebração. A nova geração de equipes de dados está apenas começando, e elas são mais valiosas do que nunca

Então, lembre-se, o engenheiro de dados está morto, longa vida ao engenheiro de dados! As equipes de dados como as conhecíamos estão mortas, mas longa vida às novas equipes de dados – que elas possam reinar nesse mundo impulsionado por IA com insight, responsabilidade e audácia.

Sergio Gago é CTO da Cloudera, trazendo mais de 20 anos de experiência em AI/ML, computação quântica e arquiteturas orientadas a dados. Anteriormente, Diretor Geral de AI/ML e Quantum na Moody's Analytics, ele também ocupou cargos de CTO na Rakuten, Qapacity e Zinio. Sergio é um forte defensor da infraestrutura de dados confiáveis, acreditando que a IA evoluirá para o sistema operacional da empresa até 2030.