Entre em contato

Alex Holovach, cofundador da Kubiks – Série de entrevistas

Entrevistas

Alex Holovach, cofundador da Kubiks – Série de entrevistas

mm

Alex Holovach, cofundador da Kubiks, é um engenheiro de software experiente, especializado em sistemas escaláveis ​​e de alto desempenho. Ele liderou transformações digitais, construiu microsserviços tolerantes a falhas e desenvolveu integrações corporativas na Prove, TAG – The Aspen Group, airSlate e Google. Hoje, ele canaliza essa expertise para reinventar a observabilidade com IA na Kubiks.

Kubiks é uma plataforma de observabilidade nativa de IA que ajuda equipes de engenharia a monitorar, diagnosticar e resolver problemas com mais rapidez. Ela captura automaticamente logs, rastreamentos, consultas e chamadas de LLM sem configuração manual e, em seguida, usa IA para identificar as causas raiz, enviar alertas contextuais e até mesmo sugerir correções. Com mapas de serviço em tempo real, instantâneos históricos e integrações com ferramentas populares e provedores de nuvem, a Kubiks agiliza a resposta a incidentes e melhora a confiabilidade do sistema.

Você construiu e escalou infraestrutura em empresas como airSlate, Prove e Google. Qual dessas funções mais moldou sua perspectiva sobre os desafios de escalar sistemas e como essas lições o inspiraram a cofundar a Kubiks?

Aprendi em primeira mão como é manter a confiabilidade quando mais de 100 engenheiros estão implementando mudanças todos os dias. Nessas configurações, o fator ônibus, o risco de membros-chave da equipe ficarem repentinamente indisponíveis, é alto, e a chave é automatizar tudo o que for possível para manter o serviço funcionando sem problemas. Mas nem sempre é possível prever o que vai dar errado. Essas experiências destacaram as limitações das abordagens tradicionais, e é por isso que ter agentes de IA monitorando constantemente cada parte em tempo real muda tudo. Eles estão sempre ativos, alertando você instantaneamente e lidando com a análise da causa raiz quando algo dá errado. Foi isso que me levou a cofundar a Kubiks.ai, para tornar essa supervisão inteligente e sempre ativa acessível a mais equipes.

A Kubiks foi lançada em maio de 2025 com uma promessa ousada: configuração rápida e correções com tecnologia de IA. Que lacuna no mercado você viu que o convenceu de que agora era o momento certo para abrir esta empresa?

Há uma lacuna enorme no momento, pois a IA pode finalmente adicionar uma camada de autorreparação à internet. Nossa missão é simples: ter IA monitorando seus sistemas de produção, executando análises automáticas de causa raiz em caso de interrupções e preparando correções seguras, para que as equipes possam reagir em segundos. Com a IA assumindo o monitoramento proativo constante, os engenheiros podem se concentrar em reações rápidas em vez de verificações intermináveis. Essa é a grande mudança que estamos possibilitando.

O Kubiks captura de forma única solicitações completas e chamadas de LLM, gera correções automaticamente e entrega solicitações pull para revisão. Quais avanços técnicos possibilitaram esse fluxo sem atritos da detecção à resolução? Foi difícil equilibrar rigor com simplicidade?

Nosso avanço é a correlação de ponta a ponta e a engenharia de contexto: extraímos automaticamente IDs-chave de cada solicitação, como pagamentos, usuários, sessões, bancos de dados, filas, modelos e versões, e os entrelaçamos em uma única linha do tempo. Com toda a cadeia conectada, a IA identifica a primeira chamada com falha, as entradas que a causaram e exatamente o que precisa ser corrigido. Isso se baseia no Scuba do Facebook, sua ferramenta interna de observabilidade. Depois de usar algo assim, não é possível voltar apenas a métricas e agregados.

A Kubiks oferece visualizações em tempo real, mapas de serviços e visualizações centradas em relacionamentos. Como a combinação de logs, rastreamentos, métricas e mapeamentos em um painel unificado muda radicalmente a forma como as equipes detectam e resolvem problemas?

Sistemas modernos são como dirigir um carro em alta velocidade. Se você tivesse que analisar cada leitura bruta dos sensores, certamente sofreria um acidente. Em vez disso, você precisa de um painel que sinalize o que está errado e onde. É por isso que combinamos logs, rastros, métricas e um mapa ao vivo: uma rápida olhada fornece o panorama completo e um clique leva você à solução. Isso transforma a depuração dispersa em uma resolução focada e eficiente.

Viagens no tempo e anotações de snapshots parecem poderosas para depuração histórica. Em termos práticos, quais são alguns casos de uso em que isso revelou problemas que visualizações em tempo real por si só não conseguiram?

Imagine que seu serviço principal caia e o mapa ao vivo fique vermelho em todos os lugares, com erros em todo o sistema, mas você não consegue identificar o que falhou primeiro em meio ao caos. Por exemplo, certa vez tivemos uma tarefa do Airflow com uma política de repetição mal configurada; ela estava agendada para a noite, mas foi acionada ao meio-dia durante o pico de tráfego, sufocando o banco de dados. As visualizações em tempo real mostravam apenas falhas generalizadas, mas a viagem no tempo nos permitiu voltar e observar o incidente começar com a falha da tarefa, revelando a causa raiz que não estava clara ao vivo.

Como sua IA analisa a telemetria para detectar anomalias e elaborar sugestões de correção? Você pode compartilhar exemplos em que o Kubiks detectou problemas sutis ou silenciosos que o monitoramento tradicional não detectaria?

Um engenheiro implantou uma nova lógica por trás de um sinalizador de recurso, e a produção permaneceu estável por duas semanas com o sinalizador desativado. Então, habilitá-lo para um segmento de usuário causou erros apenas para esses usuários. Em painéis padrão, parecia aleatório e difícil rastrear até a implantação. O Kubiks conecta cada solicitação à versão do código, ao estado do sinalizador, ao segmento de usuário e às chamadas posteriores. Quando os erros aumentavam, a IA os correspondia à ativação do sinalizador e ao caminho específico do código. Ela destacava a função com falha e as entradas de acionamento. Ao vincular a observabilidade ao código e aos sinalizadores, a IA identifica as causas rapidamente e sugere correções direcionadas, detectando o que as ferramentas tradicionais ignoram.

Os usuários dizem que o Kubiks "não tem complicação de configuração" e "captura tudo pronto para uso". Que medidas você tomou para garantir a confiança e a usabilidade, da instalação ao fluxo de trabalho diário?

Projetamos o Kubiks para que pareça familiar desde o desenvolvimento local, para que você crie confiança antes mesmo do início da produção. Nossa CLI executa seu aplicativo localmente, instrumenta automaticamente chamadas HTTP, BD, filas e LLM, e transmite telemetria limpa; sem a necessidade de registro ou rastreamento manual. Ele alimenta seu editor de código de IA com contexto rico via MCP, com exatamente as mesmas visualizações que você verá no staging e na produção. Você aprende uma vez, em seu fluxo natural enquanto cria recursos, tornando-o perfeito e confiável quando mais importa.

Muitas startups de IA hoje enfrentam dificuldades com a observabilidade, à medida que seus sistemas escalam rapidamente. Como a Kubiks ajuda equipes menores a operar com os mesmos padrões de confiabilidade de empresas bilionárias?

Startups avançam rapidamente. Não é possível interromper um sprint para adicionar logs e rastreamentos em todos os lugares. É por isso que priorizamos a instrumentação automática. Com uma única instalação, o Kubiks captura o panorama completo imediatamente: rotas HTTP, chamadas de banco de dados, interações LLM. Ele permite que pequenas equipes alcancem confiabilidade de nível empresarial sem custos adicionais.

Com a crescente complexidade dos sistemas baseados em IA, qual papel você vê a Kubiks desempenhando para garantir confiabilidade, observabilidade e capacidade de ação em cargas de trabalho de IA distribuídas?

Os microsserviços tradicionais eram complexos, mas previsíveis. Era possível mapear o gráfico de chamadas e antecipar fluxos. A IA distribuída inverte isso: os agentes interagem dinamicamente, iniciam ferramentas, adaptam planos em tempo real e roteiam com base no contexto. É inovador, mas um pesadelo para a depuração. O Kubiks instrumenta automaticamente toda a configuração (cada agente, ferramenta, fila, webhook e chamada de modelo) e cria um gráfico causal em tempo real de quem fez o quê, quando e com quais dados. Nossa IA monitora isso em tempo real, detectando desvios, loops, handoffs perdidos e decisões ruins à medida que ocorrem, e não posteriormente nos logs.

Olhando para o futuro, como você prevê a evolução da observabilidade em ambientes nativos da nuvem e com tecnologia de IA? Qual roteiro você está buscando — mais automação, inteligência mais profunda ou integração expandida — para a Kubiks.ai nos próximos anos?

Em breve, as empresas executarão milhões de agentes simultaneamente em nuvens, precisando de visibilidade clara sobre o que é chamado de "o quê", quando e com quais dados. A observabilidade evoluirá para fornecer insights em tempo real sobre esses sistemas dinâmicos, observando o interior dos LLMs para entender suas decisões. Para a Kubiks, estamos nos concentrando no rastreamento de ponta a ponta no nível do agente: prompts, parâmetros, modos, ferramentas, entradas e saídas. Isso ajudará os engenheiros a detectar ameaças, casos extremos e anomalias precocemente, tornando ambientes complexos de IA mais confiáveis ​​e acionáveis.

Obrigado pela ótima entrevista, os leitores que desejam saber mais devem visitar Kubiks

Antoine é um líder visionário e sócio fundador da Unite.AI, movido por uma paixão inabalável por moldar e promover o futuro da IA ​​e da robótica. Um empreendedor em série, ele acredita que a IA será tão disruptiva para a sociedade quanto a eletricidade, e é frequentemente pego delirando sobre o potencial das tecnologias disruptivas e da AGI.

Como um futurista, ele se dedica a explorar como essas inovações moldarão nosso mundo. Além disso, ele é o fundador da Valores Mobiliários.io, uma plataforma focada em investir em tecnologias de ponta que estão redefinindo o futuro e remodelando setores inteiros.