Entre em contato

A próxima inovação em IA está enterrada em seus backups

Líderes de pensamento

A próxima inovação em IA está enterrada em seus backups

mm

Imagine as possibilidades de uma seguradora conseguir isolar todos os sinistros de danos relacionados a incêndios na região noroeste do Pacífico na última década em poucos instantes, ou se um departamento de vendas pudesse coletar o feedback dos usuários com um certo sentimento para aprimorar proativamente os recursos antes de perder leads. Os potenciais resultados positivos do engajamento com seus dados históricos para alimentar a IA são infinitos, mas somente se os backups pararem de funcionar como backups.

Durante anos, empresas de todos os setores, de seguros a entretenimento, trataram seus dados antigos como uma apólice de seguro empoeirada — algo que você guarda e torce para não precisar usar. Essas empresas criaram e estão acumulando montanhas de registros de dados, arquivos e vídeos que mal veem a luz do dia e oferecem pouco ou nenhum valor além de servir como uma política de backup ou para atender a requisitos de conformidade e regulatórios.

Então, qual é o problema se esses dados continuarem empilhados em algum lugar no fundo do armário digital? Muitos deles foram arquivados por um motivo, certo?

Essa mentalidade de "e daí?" ignora a realidade da era da IA, que mudou drasticamente as expectativas dos consumidores em relação a todos os tipos de serviços e experiências. Em um mundo onde se espera que as empresas ajam com base em insights em tempo real, impulsionados pela IA, e ofereçam experiências personalizadas e ricas em contexto, todos aqueles dados "adormecidos" são agora um dos ativos estratégicos mais subvalorizados da empresa.

Os backups estão presos no passado

No mundo atual, que prioriza a nuvem, os backups são muitas vezes tratados como apólices de seguro estáticas, algo que as empresas podem definir, esquecer e torcer para nunca ter que usar.

A realidade é muito mais confusa e muito mais custosa.

A visibilidade é a primeira fraqueza. Em ecossistemas de backup fragmentados, a dispersão de recursos, a TI oculta e as tags mal configuradas dificultam a comprovação do que está realmente protegido ou a descoberta de quando não está. Ferramentas de backup nativas da nuvem aumentam o desafio, pois, embora sejam fáceis de ativar, muitas vezes carecem de recursos essenciais, como capacidade de pesquisa real e restauração de itens únicos. Ferramentas de terceiros tentam preencher essas lacunas, mas apresentam sua própria complexidade, exigindo agentes e máquinas adicionais implantadas no ambiente do cliente, configuração complexa de políticas de backup e modelos de preços ocultos, nos quais as empresas pagam não apenas pelas licenças, mas também por cada unidade de dados armazenada ou transferida.

Quando os dados são necessários – por questões de conformidade, legais ou operacionais – os processos de restauração desses modelos tradicionais são insuficientes. A maioria das ferramentas exige restaurações completas de snapshots, acionando a recuperação completa da instância mesmo quando apenas uma pequena parte dos dados é necessária. Em outras palavras, as equipes são forçadas a recuperar um banco de dados inteiro quando apenas uma tabela ou até mesmo uma única linha é relevante para elas. O resultado é uma enorme sobrecarga em termos de tempo, poder computacional e custos. Os sistemas de backup da maioria das empresas não possuem os recursos de restauração granulares necessários para contornar esse processo redundante e dispendioso.

As exigências de conformidade revelam ainda outro ponto problemático. Poucas equipes conseguem comprovar o sucesso do backup em tempo real durante uma auditoria ou demonstrar que as políticas de retenção de dados confidenciais, criptografia e controles de acesso foram aplicados corretamente. Em um mundo dinâmico e multinuvem, isso pode levar, na melhor das hipóteses, à retenção generalizada e ao inchaço massivo do armazenamento; na pior, a lacunas onde dados confidenciais ficam sem análise e sem segurança.

Organizações que tratam backups da mesma forma que antes tratavam arquivos passivos, como LTOs ou Glacier, enfrentam uma lacuna crescente entre a velocidade da nuvem e a prontidão do backup. Sem descoberta ou classificação automatizadas, os dados podem passar despercebidos, mesmo em ambientes altamente dinâmicos. Os backups permanecem incompletos ou inconsistentes, enquanto os gastos continuam a aumentar para extinguir os incêndios resultantes.

De backups a data lakes: desvendando a próxima fronteira da IA

A simples “modernização” do armazenamento não trará a próxima era da estratégia de dados. Em vez disso, as empresas devem transformar seus backups em arquivos totalmente pesquisáveis ​​e prontos para análise. lagos de dados – não apenas para atender às necessidades de conformidade e recuperação, mas também para alimentar os vastos conjuntos de dados de alta qualidade que os modelos de IA atuais exigem para aprender e operar efetivamente em escala.

Em um modelo de data lake, os backups não são instantâneos estáticos. Eles se tornam repositórios dinâmicos, enriquecidos com metadados contextuais, indexados para pesquisa granular e conectados a ferramentas analíticas. Em vez de apenas cumprir com as obrigações de recuperação de desastres e conformidade, eles contribuem ativamente para a inteligência de negócios, a inovação de produtos e o engajamento do cliente.

Os principais facilitadores dessa mudança incluem:

  • Extração automatizada de dados contextuais: Com marcação orientada por IA e processamento de linguagem natural, registros históricos, documentos, imagens e vídeos podem ser anotados com descritores ricos e pesquisáveis.
  • Capacidades de restauração granular: Em vez de colocar um conjunto de dados inteiro em quarentena, as empresas podem recuperar cirurgicamente arquivos, transações, tabelas ou clipes de mídia individuais em segundos, sem interromper conjuntos de dados maiores.
  • Integração perfeita em pipelines de análise: Depois que os backups estiverem pesquisáveis ​​e consultáveis, eles poderão alimentar diretamente conjuntos de dados de treinamento de IA, painéis em tempo real e fluxos de trabalho de análise de tendências.

O impacto é transformador. Um banco, por exemplo, poderia treinar algoritmos de detecção de fraudes com base em uma década de dados transacionais estáticos, identificando anomalias invisíveis em amostras menores. Um profissional de saúde poderia, da mesma forma, recuperar todos os casos de pacientes que correspondem a um marcador genético específico para apoiar pesquisas, ou uma empresa de entretenimento poderia apresentar dados históricos de sentimento do público para orientar a produção de conteúdo.

O que antes eram "dados mortos" se torna um ativo estratégico em constante crescimento. Em vez de um centro de custos, os backups evoluem para uma vantagem competitiva – impulsionando a inovação em todos os setores.

Mineração de “Dados Mortos” para Potencial de Negócios

Felizmente, o status quo está mudando. Os sistemas de armazenamento modernos já podem incorporar armazenamento baseado em objetos e tópicos, indexação automatizada e extração de metadados contextuais para tornar os arquivos instantaneamente pesquisáveis ​​e prontos para uso comercial.

Por exemplo, nos Parceria tem trabalhado com grandes fabricantes e empresas automotivas, como Ford e Kyocera, para conectar ativos historicamente isolados, processar e padronizar dados e melhorar a visibilidade do chão de fábrica para a nuvem. Instituições financeiras, que se acumulam petabytes de dados transacionais e de interação com clientes estão ansiosos para acessar essa mina de ouro para treinar modelos de IA específicos de finanças, destacando o quão valiosos os dados históricos profundos se tornaram.

Mesmo em mídia e entretenimento, os casos de uso apresentam um potencial impressionante. Veja a Netflix, por exemplo, cujos gastos com conteúdo original e licenciado devem atingir um pico. US$ 18 bilhões este anoEm outras palavras, a Netflix está sentada em um Everest de dados de backup, mídia, metadados, informações de marcação de vídeo e muito mais, que precisam ser refratados por uma série de regulamentações regionais de conformidade, inúmeros padrões de acessibilidade e uma variedade de provedores de nuvem diferentes. Analisar uma quantidade tão impressionante de conteúdo em um único snapshot de recuperação de backup é simplesmente inviável. Agora, imagine como seria muito mais fácil filtrar os dados com recursos de restauração granulares e capacidade de pesquisa instantânea.

É exatamente isso que a mudança para o data lake permite.

A prova está nos resultados: com as ferramentas certas e a mentalidade estratégica correta, o armazenamento de backup se torna um mecanismo criativo de agregação de valor, não apenas uma apólice de seguro.

Melhores backups significam melhores resultados comerciais

As empresas de hoje são definidas por dados e velocidade. Sistemas de backup legados estão atrasando as equipes em ambas as frentes.

Os backups não devem ser tratados como cofres ou como um mecanismo de sobrevivência para os piores cenários. Em vez disso, devem ser motores de crescimento, criatividade e vantagem competitiva, e novas soluções tecnológicas estão prontas para possibilitar essa transição. As empresas que modernizarem sua arquitetura de backup hoje serão as que impulsionarão os avanços de amanhã, em finanças, saúde, mídia e muito mais.

Assaf Natanzon é o vice-presidente e arquiteto-chefe da Eternidade, impulsionando a inovação em armazenamento, gerenciamento de dados e arquiteturas ciber-resilientes. Anteriormente, atuou como vice-presidente técnico e arquiteto-chefe na Huawei Storage, onde criou a OceanProtect, uma plataforma multibilionária de armazenamento secundário, e como CTO da divisão de Proteção de Dados da Dell/EMC, supervisionando um portfólio de produtos de US$ 3.5 bilhões. Pioneiro em tecnologias de replicação, desduplicação, compactação e RAID, Assaf detém mais de 550 patentes nos EUA (com mais de 250 pendentes), o que o torna um dos inventores mais prolíficos em armazenamento empresarial. Possui doutorado em Ciência da Computação pela Universidade Ben-Gurion, com especialização em recuperação de desastres.