Líderes de pensamento
Pensar Fora da Caixa para Impulsionar a Inovação em IA
Para muitos de nós que inovamos no espaço de IA, estamos trabalhando em um território inexplorado. Dada a rapidez com que as empresas de IA estão desenvolvendo novas tecnologias, pode-se dar como certa a trabalhada incansável nos bastidores. Mas em um campo como XR, onde a missão é borrifar as linhas entre os mundos real e digital — não há muitos dados históricos ou pesquisas para se apoiar; então precisamos pensar fora da caixa.
Enquanto é mais conveniente confiar na sabedoria convencional de aprendizado de máquina e práticas testadas e comprovadas, isso muitas vezes não é possível (ou a solução completa) em campos emergentes. Para resolver problemas que nunca foram resolvidos antes, eles precisam ser abordados de novas maneiras.
É um desafio que nos obriga a lembrar por que entramos no campo de engenharia, ciência de dados ou desenvolvimento de produtos para começar: uma paixão pela descoberta. Eu experimento isso todos os dias no meu papel na Ultraleap, onde desenvolvemos software que pode rastrear e responder aos movimentos da mão humana em um ambiente de realidade mista. Muito do que pensávamos saber sobre treinar modelos de aprendizado de máquina é virado de cabeça para baixo em nosso trabalho, pois a mão humana — juntamente com os objetos e ambientes que ela encontra — é extremamente imprevisível.
Aqui estão algumas abordagens que minha equipe e eu adotamos para reimaginar a experimentação e a ciência de dados para trazer interação intuitiva para o mundo digital, que é precisa e se sente tão natural quanto no mundo real.
Inovando dentro das linhas
Quando inovamos em um espaço nascente, muitas vezes nos deparamos com restrições que parecem estar em desacordo umas com as outras. Minha equipe é encarregada de capturar as nuances dos movimentos da mão e dos dedos, e como as mãos e os dedos interagem com o mundo ao seu redor. Isso é embalado em modelos de rastreamento de mãos que ainda se encaixam no hardware XR com computação restrita. Isso significa que nossos modelos — embora sofisticados e complexos — devem ocupar significativamente menos armazenamento e consumir significativamente menos energia (na ordem de 1/100.000) do que os grandes LLMs que dominam os noticiários. Isso nos apresenta um desafio emocionante, exigindo experimentação e avaliação implacáveis de nossos modelos em sua aplicação no mundo real.
Mas os inúmeros testes e experimentos valem a pena: criar um modelo poderoso que ainda entrega baixo custo de inferência, consumo de energia e latência é uma maravilha que pode ser aplicada na computação de borda, mesmo fora do espaço XR.
As restrições que encontramos enquanto experimentamos afetarão outras indústrias também. Algumas empresas terão desafios únicos devido a sutilezas em seus domínios de aplicação, enquanto outras podem ter dados limitados para trabalhar devido a estarem em um nicho de mercado que os grandes jogadores de tecnologia não tocaram.
Enquanto soluções de tamanho único podem ser suficientes para algumas tarefas, muitos domínios de aplicação precisam resolver problemas reais e desafiadores específicos de sua tarefa. Por exemplo, linhas de montagem automotiva implementam modelos de ML para inspeção de defeitos. Esses modelos precisam lidar com imagens de alta resolução necessárias para identificar pequenos defeitos em uma grande área de superfície de um carro. Nesse caso, a aplicação exige alto desempenho, mas o problema a ser resolvido é como alcançar uma taxa de quadros baixa, mas alta resolução, modelo.
Avaliando arquiteturas de modelo para impulsionar a inovação
Um conjunto de dados bom é a força motriz por trás de qualquer avanço bem-sucedido em IA. Mas o que torna um conjunto de dados “bom” para um objetivo específico, afinal? E quando estamos resolvendo problemas que nunca foram resolvidos antes, como podemos confiar que os dados existentes serão relevantes? Não podemos assumir que as métricas que são boas para algumas tarefas de ML se traduzirão para o desempenho de uma tarefa de negócios específica. É aqui que somos chamados a ir contra verdades comumente aceitas de ML e, em vez disso, explorar ativamente como rotulamos, limpamos e aplicamos dados simulados e do mundo real.
Por natureza, nosso domínio é desafiador para avaliar e exige garantia de qualidade manual – feita à mão. Não estamos apenas olhando para as métricas de qualidade de nossos dados. Iteramos sobre nossos conjuntos de dados e fontes de dados e os avaliamos com base nas qualidades dos modelos que produzem no mundo real. Quando reavaliamos como graduamos e classificamos nossos dados, muitas vezes encontramos conjuntos de dados ou tendências que poderíamos ter passado por alto. Agora, com esses conjuntos de dados e inúmeros experimentos que nos mostraram quais dados não confiar, descobrimos uma nova avenida que estávamos perdendo antes.
A plataforma de rastreamento de mãos mais recente da Ultraleap, Hyperion, é um excelente exemplo disso. Avanços em nossos conjuntos de dados nos ajudaram a desenvolver um rastreamento de mãos mais sofisticado que pode rastrear microgestos, bem como movimentos de mãos, mesmo quando o usuário está segurando um objeto.
Um pequeno passo para trás, um grande salto à frente
Enquanto o ritmo da inovação aparentemente nunca desacelera, podemos. Estamos no negócio de experimentar, aprender, desenvolver e, quando nos damos o tempo de fazer apenas isso, muitas vezes criamos algo de muito mais valor do que quando estamos seguindo o livro e apressando para colocar a próxima inovação tecnológica. Não há substituto para os avanços que ocorrem quando exploramos nossas anotações de dados, questionamos nossas fontes de dados e redefinimos métricas de qualidade em si. E a única maneira de podermos fazer isso é experimentando no domínio de aplicação real com desempenho de modelo medido contra a tarefa. Em vez de ver requisitos e restrições incomuns como limitantes, podemos pegar esses desafios e transformá-los em oportunidades de inovação e, em última análise, vantagem competitiva.












