Entre em contato

2026: O ano em que os custos da IA ​​obrigarão todas as empresas a repensar suas estratégias.

Líderes de pensamento

2026: O ano em que os custos da IA ​​obrigarão todas as empresas a repensar suas estratégias.

mm

Nos últimos anos, testemunhei em primeira mão a rapidez com que o cenário de dados e IA está mudando, principalmente à medida que as empresas se esforçam para modernizar arquiteturas complexas, mantendo um desempenho confiável em escala global. A pressão sobre os líderes está aumentando conforme as expectativas em torno da IA ​​se aceleram e a lacuna entre o que as organizações desejam alcançar e o que sua infraestrutura pode suportar de forma realista se amplia. Essa tensão está remodelando as prioridades do setor e preparando o terreno para o que está por vir. Com base na minha experiência no setor e na liderança da Teradata em diversas transformações, aqui estão minhas três previsões para o que podemos esperar em 2026.

1. O avanço da produção de IA Agencial

2026 marcará o ano em que as empresas finalmente cruzarão o abismo entre os projetos-piloto e a IA ativa em escala de produção. Enquanto 2025 testemunhou o Paradoxo da IA, com 92% das empresas estão aumentando os investimentos em IA, mas apenas 1% atingiu a maturidade.Em 2026, os vencedores serão separados dos perdedores. O gargalo na produção de IA nunca foi a construção de modelos ou a geração de ideias; tratava-se de implantar IA em escala empresarial com confiança, contexto e eficiência econômica.

No próximo ano, veremos as interações entre agentes se tornarem comuns em pelo menos um grande setor B2B, seja ele de compras, cadeia de suprimentos ou atendimento ao cliente. As organizações que se prepararem para as enormes demandas computacionais da IA ​​com agentes ficarão tão à frente que será quase impossível para os concorrentes alcançá-las. Ao contrário dos aplicativos tradicionais que fazem algumas consultas por minuto, os sistemas de IA com agentes, com potencial de consulta ininterrupta (24 horas por dia, 7 dias por semana), geram 25 vezes mais solicitações de banco de dados e consomem de 50 a 100 vezes mais recursos computacionais enquanto raciocinam sobre problemas, coletam contexto e executam tarefas.

Esses números não são apenas maiores; representam uma mudança fundamental na forma como a infraestrutura empresarial deve operar. O desafio da infraestrutura é profundo e exige arquiteturas de processamento massivamente paralelo — uma abordagem computacional que utiliza inúmeros processadores para realizar cálculos simultaneamente em diferentes partes de um grande conjunto de dados — capazes de lidar com cargas de trabalho mistas em escala. À medida que as empresas implantam potencialmente milhares desses agentes, avaliando milhões de relacionamentos em milhares de tabelas para tomar uma única decisão, milissegundos começarão a importar. Não estamos mais falando de assistentes de IA isolados; estamos falando de ecossistemas inteiros de agentes especializados trabalhando juntos, cada um consultando dados, analisando opções e coordenando-se com outros agentes em tempo real. As empresas que descobrirem como lidar com esse volume de forma eficiente e com custos previsíveis dominarão o mercado, enquanto aquelas pegas de surpresa pelo aumento vertiginoso dos custos de infraestrutura enfrentarão dificuldades.

Até o final de 2026, espero histórias de retorno sobre o investimento (ROI) quantificáveis, na casa das centenas de milhões, e não apenas projeções otimistas. As primeiras implementações em produção demonstrarão valor comercial concreto que vai além dos ganhos de produtividade, rumo a uma verdadeira transformação dos negócios. Não se trata de simples chatbots ou resumidores de documentos; serão sistemas inteligentes que mudarão fundamentalmente a forma como o trabalho é realizado em toda a organização.

2. A Guerra das Plataformas de Conhecimento: Quando Milissegundos se Tornam Milhões

Em 2026, as empresas descobrirão que seus agentes de IA são tão inteligentes quanto sua infraestrutura de dados. Quando um sistema de agentes realiza 10,000 consultas para responder a uma única pergunta do cliente, a diferença entre um tempo de resposta de 100 ms e 10 ms não se resume à experiência do usuário: é a diferença entre uma fatura mensal de infraestrutura de US$ 50,000 e uma de US$ 5 milhões.

Os dados do setor comprovam essa mudança. O FutureScape 2026 da IDC Prevê-se que, até 2028, 45% das interações com produtos e serviços de TI utilizarão agentes como interface principal para operações contínuas. Pesquisa da McKinsey sobre o estado da IA ​​em 2025 A pesquisa revelou que, onde o potencial de penetração da IA ​​é alto, os sistemas de agentes estão transformando rapidamente a forma como as organizações consomem tecnologia. Os primeiros testes de produção mostram que os fluxos de trabalho com agentes geram 25 vezes mais consultas a bancos de dados do que os aplicativos tradicionais. Uma única interação de atendimento ao cliente com IA, que antes exigia três chamadas de API, agora desencadeia milhares de consultas contextuais à medida que o agente analisa as opções, valida as informações e sintetiza as respostas.

Os data warehouses tradicionais em nuvem, otimizados para análises em lote, não suportarão essas demandas de agentes em tempo real. A natureza sempre ativa das plataformas de agentes entra em conflito fundamental com ambientes de computação dinâmicos, projetados para serem ativados para cargas de trabalho agendadas e desativados para reduzir custos. Iniciativa NANDA do MIT Descobriu-se que 95% dos programas piloto de IA não conseguem gerar impacto mensurável nos resultados financeiros, não por causa da qualidade do modelo, mas devido a uma "lacuna de aprendizado" em que os sistemas não conseguem se adaptar com rapidez suficiente aos fluxos de trabalho corporativos. Quando a latência da infraestrutura agrava essa lacuna, até mesmo os agentes mais sofisticados se tornam ineficazes. As organizações perceberão que a otimização de consultas — antes considerada um problema resolvido e relegado aos administradores de banco de dados — tornou-se o principal gargalo no retorno sobre o investimento em IA.

É aqui que as plataformas construídas sobre arquiteturas de processamento massivamente paralelo encontram o futuro da IA. Sistemas construídos desde o início para cargas de trabalho mistas (lidando com consultas operacionais e cargas de trabalho analíticas simultaneamente, sem degradação de desempenho) separarão os vencedores daqueles que ficarem para trás. Quando cada milissegundo de desempenho de consulta impacta diretamente a inteligência do agente, a qualidade da resposta e os resultados de negócios, as decisões de infraestrutura se tornam imperativos estratégicos.

Já estamos observando isso com clientes que executam agentes de IA em produção. Eles ficam chocados ao descobrir que seu data warehouse em nuvem "moderno" adiciona de 2 a 3 segundos a cada interação do agente, fazendo com que a IA pareça lenta e sem resposta. Multiplique essa latência por milhares de interações diárias e a experiência do usuário se torna insustentável. Até o final de 2026, o desempenho das consultas se tornará o principal critério de avaliação para decisões de infraestrutura de IA, substituindo os custos de armazenamento e a escalabilidade como as principais preocupações.

A dinâmica de poder muda drasticamente quando as empresas podem implantar IA diretamente em infraestruturas de dados otimizadas, com décadas de experiência em análise de decisões já incorporadas. Em vez de ficarem limitadas por arquiteturas de fornecedores que não conseguem lidar com o volume de consultas de agentes, elas têm a flexibilidade para inovar na velocidade da IA, oferecer experiências de agentes responsivas e evitar os problemas de desempenho decorrentes de uma infraestrutura inadequada à carga de trabalho.

Essa mudança forçará uma reformulação em todo o cenário de plataformas de dados. Os fornecedores que sobreviverem serão aqueles que puderem comprovar que suas arquiteturas foram construídas para este momento: onde tempos de resposta de consulta inferiores a um segundo em escala massiva não são um diferencial, mas sim a base da automação inteligente.

3. O Renascimento Híbrido: A Soberania dos Dados Torna-se Estratégica

O pêndulo está oscilando novamente em direção a ambientes híbridos, à medida que as empresas percebem que não se trata apenas de escolher entre nuvem e infraestrutura local. Trata-se de operar com eficiência em ambos os ambientes para atender às diversas necessidades de negócios. Em 2026, a soberania de dados se provará não apenas uma questão de conformidade, mas também de vantagem competitiva estratégica e, cada vez mais, de sobrevivência econômica.

Os aspectos econômicos são inegáveis: à medida que a IA ativa impulsiona volumes exponenciais de consultas, os custos da nuvem estão prestes a disparar. Gartner prevê que até 2030Empresas que não otimizarem o ambiente de computação de IA subjacente pagarão mais de 50% a mais do que aquelas que o fizerem, enquanto 50% dos recursos de computação em nuvem serão dedicados a cargas de trabalho de IA até 2029, um aumento em relação aos menos de 10% atuais – um aumento de cinco vezes nas cargas de trabalho em nuvem relacionadas à IA. As organizações estão descobrindo que o modelo híbrido não é uma relíquia do passado; é o caminho pragmático para o futuro. Estamos vendo um ressurgimento das implantações híbridas que reflete uma compreensão crescente de como as empresas podem otimizar custos enquanto aproveitam estrategicamente os recursos locais e da nuvem.

Os números são convincentes. Quando você tem milhares de agentes de IA executando milhões de consultas diariamente, a diferença entre os custos na nuvem e em infraestrutura local se torna impressionante. Organizações inteligentes já estão modelando esses cenários e percebendo que a implantação híbrida estratégica não é apenas um diferencial, mas sim essencial para a sustentabilidade das operações de IA. À medida que a IA se torna o diferencial, as organizações entenderão que suas estratégias de dados e conhecimento do setor são valiosos demais para serem entregues completamente a provedores de nuvem pública. Elas desejarão controlar e possuir seus dados, saber onde eles estão geograficamente e gerenciar os aspectos econômicos da IA ​​em escala.

Veremos essa tendência mais acentuada internacionalmente e em setores regulamentados, como serviços financeiros e saúde, mas o imperativo de custo impulsionará a adoção em todos os setores. As empresas que oferecerem verdadeira flexibilidade de implantação, com dados, computação, modelos, cargas de trabalho, resultados e experiências consistentes em ambientes híbridos, sairão vencedoras. As organizações exigirão a capacidade de executar recursos de IA de ponta, incluindo modelos de linguagem e processamento vetorial, por trás de seus próprios firewalls, mantendo a mesma velocidade de inovação que os concorrentes nativos da nuvem, sem comprometer o orçamento.

O futuro pertence às plataformas que permitem a velocidade e a escalabilidade da IA ​​onde quer que os dados residam, seja em nuvem pública, on-premises ou nuvem privada, permitindo que as organizações tomem decisões economicamente racionais sobre a alocação de cargas de trabalho à medida que a IA ativa remodela as estruturas de custos. Não se trata de voltar a pensar como antigamente; trata-se de adotar uma abordagem mais sofisticada que trata a infraestrutura como um portfólio estratégico onde diferentes cargas de trabalho são executadas no ambiente mais apropriado com base em desempenho, custo, segurança e requisitos de conformidade.

Em 2026, a IA ativa deixará de ser apenas um termo da moda nas salas de reunião para se tornar uma realidade operacional, remodelando fundamentalmente a forma como as empresas competem, desenvolvem software e gerenciam sua infraestrutura. As empresas que dominarem a implantação em escala de produção, mantiverem o controle de seus dados e contexto e criarem arquiteturas que priorizem a flexibilidade híbrida conquistarão vantagens praticamente insuperáveis.

Steve McMillan é o Presidente e Diretor Executivo da TeradataTrazendo consigo mais de duas décadas de liderança tecnológica e um histórico comprovado de transformação de serviços empresariais em negócios de alto crescimento, com foco na nuvem.