Líderes de pensamento

Por dentro da nova corrida da robótica: dados, modelos e manufatura.

Publicado 16 de março de 2026

Michael Abramov, Fundador e CEO da Introspector

A inovação raramente surge isoladamente. Com mais frequência, ela nasce em conversas entre engenheiros, fundadores, pesquisadores e investidores que tentam entender para onde a tecnologia está caminhando.

Ao longo de um ano, participei de dezenas de conferências ao redor do mundo. Viagens a negócios às vezes duram meses, e reuniões com parceiros e clientes acontecem da Ásia à América do Norte. No entanto, uma das minhas viagens recentes à Suíça acabou sendo particularmente interessante – principalmente por causa das pessoas e das conversas que aconteceram lá.

Zurique provou ser um dos lugares onde o futuro da robótica e IA física Está sendo ativamente discutido hoje em dia. E quanto mais aprofundadas essas conversas, mais óbvio se torna que a verdadeira corrida na robótica está se desenrolando em torno dos dados.

Vale do Silício da Europa

Zurique tem sido tradicionalmente associada ao setor financeiro, mas nos últimos anos tem sido cada vez mais chamada de Vale do Silício da Europa. Grande parte dessa reputação está ligada à ETH Zurich, uma das universidades de engenharia mais respeitadas da Europa. Ela atrai pesquisadores, doutorandos, empreendedores e engenheiros do mundo todo. Como resultado, um poderoso ecossistema tecnológico se formou ao redor da universidade, onde pesquisa, startups e projetos industriais evoluem quase simultaneamente.

Um dos motivos da minha viagem foi obter uma compreensão mais profunda do que Introspector pode oferecer ao mercado de robótica, que está em plena expansão desde o início de 2025. É um setor no qual uma ampla gama de startups está tentando entrar, enquanto avanços tecnológicos de grandes empresas de tecnologia o estão remodelando ativamente. No entanto, apesar de todo esse ímpeto, o campo ainda levanta mais perguntas do que respostas.

Zurique também é a sede dos nossos parceiros. Levementeque me apresentou a colegas que trabalham na interseção de robótica, visão computacional e IA. Há um aspecto importante do ecossistema tecnológico local que gostaria de destacar: as pessoas aqui são notavelmente abertas e receptivas. Elas não têm medo de compartilhar suas ideias e hipóteses, de falar sobre os desafios que estão tentando resolver e os experimentos que estão realizando. Como resultado, você começa a entender o contexto real do mercado e para onde o setor está caminhando muito mais rapidamente.

Aliás, quando me perguntam em que o "Vale do Silício" europeu difere do americano, a resposta costuma surpreendê-los. Em Zurique, o equilíbrio entre trabalho e vida pessoal é muito mais forte: esportes pela manhã, trabalho concentrado durante o dia em um ritmo calmo, porém produtivo, e noites passadas nas montanhas com a família ou simplesmente relaxando. Em São Francisco, muitas vezes existe a sensação de que você precisa provar constantemente que está trabalhando mais do que todos os outros. Em Zurique, o ritmo é diferente – mais sustentável. Mesmo assim, o nível de ambição tecnológica aqui não é menor.

Dados melhores antes de robôs melhores

Uma das principais conclusões desta viagem foi uma observação bastante simples: muitas pessoas hoje em dia querem trabalhar com robótica. Mas, apesar do enorme interesse na área, muitas equipes ainda estão em fase exploratória, tentando entender qual papel podem desempenhar na nova onda da robótica e da IA física, e qual contribuição podem oferecer.

Muitas conversas acabam convergindo para o mesmo tema: dados. Hoje, a indústria Faltam dados sobre tarefas de destreza.Ou seja, habilidades motoras finas. Nessa área, as capacidades dos robôs permanecem extremamente limitadas. O que os humanos fazem com as mãos quase automaticamente – pegar um objeto, girá-lo, colocá-lo cuidadosamente em algum lugar ou realizar uma pequena manipulação – continua sendo uma das tarefas mais desafiadoras para os robôs.

A chave para o progresso reside principalmente em conjuntos de dados em larga escala e coletados adequadamente. Hoje, fala-se muito em conjuntos de dados egocêntricos, gravados a partir de uma perspectiva em primeira pessoa, em que o sistema captura ações humanas como se as estivesse realizando. No entanto, na prática, o próprio conceito de "conjunto de dados egocêntrico" pode ter significados muito diferentes e levanta uma série de questões técnicas. Onde a câmera deve ser posicionada? Na testa, no peito ou talvez na altura dos olhos? Quais sensores devem acompanhar a gravação de vídeo? Se estivermos capturando movimentos das mãos, os operadores devem usar luvas especiais? E, em caso afirmativo, essas luvas devem incluir sensores táteis, giroscópios ou outros sistemas de rastreamento de movimento?

Surge então uma questão ainda mais complexa: como capturar adequadamente a profundidade do movimento. Afinal, é importante compreender não apenas a posição da mão em um plano bidimensional, mas também como ela se move no espaço tridimensional – para frente, para trás, para cima ou para baixo.

Até o momento, a indústria não chegou a uma resposta unificada. É por isso que muitas equipes hoje estão experimentando diferentes configurações de sensores, métodos de gravação e formatos de conjuntos de dados.

Sistemas multimodais

Assim que a conversa se volta para a coleta de dados para robótica, outro tópico surge rapidamente: sensores adicionais e multimodalidade, que permitem a captura de movimentos corporais, ações das mãos e interações com objetos com maior precisão. Eles também ajudam a reduzir erros durante a coleta de dados.

Quando uma pessoa grava suas ações em vídeo, sempre existe o risco de que parte do material seja inutilizável. A câmera pode se mover ligeiramente, o ângulo de filmagem pode estar incorreto, o operador pode se virar acidentalmente para o lado errado ou realizar um movimento muito rápido. Como resultado, uma parte significativa do material gravado é descartada. Um exemplo simples: para obter uma hora de vídeo realmente utilizável, um operador geralmente precisa gravar cerca de duas horas de filmagem bruta.

Sensores adicionais ajudam a compensar alguns desses problemas. Mesmo que a câmera se desloque ligeiramente, os dados dos sensores ainda permitem reconstruir o movimento da mão ou a posição do corpo no espaço. Como resultado, em vez de duas horas de gravação, pode-se levar aproximadamente uma hora e vinte minutos para obter a mesma quantidade de dados utilizáveis. Isso aumenta significativamente a eficiência da coleta de dados e reduz o custo de sua criação.

Portanto, não é coincidência que muitas equipes também estejam percebendo um crescente interesse na anotação de dados multimodais. Essa se tornou uma das tendências mais visíveis diretamente ligadas ao desenvolvimento da robótica e da IA incorporada.

O próximo ponto é a rotulagem desses conjuntos de dados. Já nos deparamos com questões semelhantes em Marca-chave Ao trabalhar com conjuntos de dados de clientes para aplicações em robótica, como deve ser a anotação na prática? Deve ser um modelo esquemático? Bidimensional ou tridimensional? Devem ser incorporados elementos de aprendizado por reforço ao processo? Há dezenas de perguntas desse tipo. Os próprios engenheiros admitem que ninguém ainda pode afirmar com certeza qual configuração de dados específica levará a um verdadeiro avanço tecnológico.

Essas preocupações são compreensíveis. Construir conjuntos de dados complexos é um processo caro. Cada erro na estrutura dos dados pode custar milhares ou até milhões de dólares. É possível coletar o conjunto de dados "errado" ou registrá-lo em condições difíceis de reproduzir no mundo real, comprometendo todo o projeto. É exatamente por isso que, hoje em dia, se dedica cada vez mais atenção tanto aos próprios modelos quanto à qualidade e à arquitetura dos dados com os quais esses modelos são treinados.

Que tipo de robôs o mercado precisa?

Os robôs industriais clássicos, que operam em linhas de montagem automotiva há décadas, na verdade requerem muito pouco em termos de visão computacional ou modelos complexos de IA. Sua tarefa é extremamente específica: executar movimentos estritamente repetitivos – esquerda, direita, para cima, para baixo – com alta precisão e consistência. Nesse aspecto, eles já superaram os humanos há muito tempo.

Uma categoria completamente diferente são os robôs humanoides. Esses sistemas requerem "cérebros": a capacidade de navegar no espaço, perceber o ambiente ao redor, compreender o contexto de uma situação e controlar manipuladores não por meio de trajetórias pré-programadas, mas adaptando-se ao mundo real.

Mesmo com o alto nível de automação nas fábricas modernas, muitas tarefas ainda são realizadas por humanos. Mover um objeto, pegar uma caixa, separar peças, fixar um componente ou organizar materiais – essas são pequenas ações que exigem flexibilidade e coordenação. Essa área continua sendo uma das mais difíceis de automatizar, e é justamente aí que os sistemas humanoides podem encontrar seu papel.

Muitas das equipes com as quais conversei utilizam um modelo de negócios semelhante. Elas abordam uma fábrica e propõem a solução de um problema específico de produção. Por exemplo, um funcionário pode passar o dia inteiro movimentando caixas entre diferentes áreas do armazém. Os engenheiros sugerem um experimento relativamente simples: equipar o funcionário com uma câmera e um conjunto de sensores, gravar milhares de horas de suas ações e usar esses dados para treinar um modelo que controlará um robô humanoide. Dessa forma, o robô aprende a executar exatamente as tarefas realizadas pelo funcionário humano.

Em essência, a empresa adquire uma plataforma humanoide, enquanto a equipe de desenvolvimento cria um modelo personalizado que replica o comportamento de um operador específico. Não se trata de uma inteligência universal capaz de resolver qualquer tarefa. Em vez disso, é um conjunto de habilidades treinadas para um cenário específico ou um grupo de tarefas de produção. Para muitos engenheiros hoje, essa abordagem parece muito mais realista. Em vez de tentar criar um robô universal imediatamente, as equipes se concentram em cenários de automação específicos, porém economicamente viáveis.

A dimensão empresarial

Se o futuro reside em modelos personalizados, é importante compreender que, de uma perspectiva econômica, esse é um caminho de desenvolvimento bastante longo.

Cada indústria é essencialmente um mundo à parte. Cada ambiente de produção tem seus próprios processos, fluxos de trabalho e exceções. Um robô treinado para operar em uma fábrica de automóveis não pode simplesmente ser transferido para a produção de alimentos ou para a logística de um armazém. Em cada caso, o sistema precisa ser reprogramado do zero.

Isso nos leva à próxima pergunta lógica: quem serão os primeiros clientes dessa tecnologia?

Nesta fase, os principais utilizadores serão provavelmente grandes empresas – aquelas com orçamentos disponíveis e para as quais a automação pode gerar um impacto económico significativo. Atualmente, um robô humanoide custa aproximadamente entre 60,000 e 90,000 dólares, só o hardware. Esta é apenas a configuração básica. Além disso, existem custos de manutenção, baterias, estações de carregamento, infraestrutura e software.

Consequentemente, as empresas mais capacitadas para experimentar tais sistemas são grandes organizações, fabricantes de automóveis, empresas alimentícias e grandes empresas industriais.

É claro que setores menores também podem apresentar alguns pioneiros. Algumas empresas podem adquirir um ou dois robôs para tarefas específicas. No entanto, na maioria dos casos, essas empresas simplesmente não estão preparadas para investir centenas de milhares de euros na coleta e anotação dos conjuntos de dados personalizados necessários para treinar sistemas para cenários operacionais altamente específicos. Para elas, a mão de obra humana ainda representa a opção mais barata.

A estratégia de longo prazo para a inovação em robótica

Chegamos, por fim, a uma questão econômica fundamental: o que é mais eficiente – um ser humano ou um robô? Se analisarmos a economia atual, a resposta é óbvia: a mão de obra humana é mais barata, adapta-se mais rapidamente a novas condições e não exige infraestrutura complexa.

Então, por que a indústria continua investindo em robótica hoje em dia? A resposta é, em grande parte, estratégica.

Muitas empresas entendem que está em curso uma espécie de corrida pela liderança tecnológica. Elas já estão desenvolvendo soluções, apesar dos altos custos, para estarem à frente quando a economia da robótica mudar.

Com os avanços da eletrônica, a redução dos custos dos componentes e a melhoria da eficiência computacional, a robótica inevitavelmente se tornará mais acessível. E quando isso acontecer, a vantagem pertencerá às empresas que já construíram modelos, acumularam dados e estabeleceram a infraestrutura tecnológica necessária.

Imagine, por exemplo, que surjam novas regulamentações permitindo o uso em larga escala de robôs humanoides na manufatura. Ou que os governos comecem a subsidiar a robotização das indústrias. Nesse cenário, o mercado poderia crescer drasticamente em poucos anos. E aqueles que se prepararam com antecedência, aqueles com modelos existentes, pesquisas, conjuntos de dados e uma infraestrutura tecnológica pronta, serão os que mais se beneficiarão.

É por isso que o desenvolvimento continua mesmo agora, apesar de a situação econômica do negócio ainda não parecer ideal. Para muitas empresas, trata-se de um investimento no futuro – no momento em que as tecnologias se tornam mais acessíveis e a demanda aumenta acentuadamente.

E nessa corrida, como em muitas revoluções tecnológicas, um fator costuma ser decisivo: quem começou primeiro. Nesse sentido, a robótica atual se assemelha muito aos estágios iniciais da inteligência artificial. Naquela época, também havia mais perguntas do que respostas. No entanto, foram as equipes que começaram a trabalhar com dados e infraestrutura antes das outras que, em última análise, moldaram a direção de todo o setor.

Tópicos relacionados:Introspector Robótica

Michael Abramov, fundador e CEO da Introspector.

Michael Abramov é o fundador e CEO da IntrospectorTrazendo mais de 15 anos de experiência em engenharia de software e sistemas de IA de visão computacional para a criação de ferramentas de rotulagem de nível empresarial.

Michael iniciou sua carreira como engenheiro de software e gerente de P&D, construindo sistemas de dados escaláveis e gerenciando equipes de engenharia multifuncionais. Até 2025, atuou como CEO da [nome da empresa]. Marca-chave, uma empresa de serviços de rotulagem de dados, onde foi pioneiro em fluxos de trabalho com intervenção humana, sistemas avançados de controle de qualidade e ferramentas personalizadas para atender às necessidades de dados em larga escala de visão computacional e autonomia.

Ele possui um bacharelado em Ciência da Computação e experiência em engenharia e artes criativas, o que lhe confere uma perspectiva multidisciplinar para a resolução de problemas complexos. Michael atua na interseção entre inovação tecnológica, liderança estratégica de produtos e impacto no mundo real, impulsionando a próxima fronteira de sistemas autônomos e automação inteligente.

Unir-se.AI