Entrevistas
Gil Elbaz, Co-fundador & CTO da Datagen – Série de Entrevistas

Gil Elbaz é o CTO e co-fundador da Datagen, com sede em Tel Aviv. Ele recebeu seu B.Sc e M.Sc pelo Technion. A pesquisa de tese de Gil foi focada em Visão Computacional 3D e foi publicada no CVPR, a principal conferência de pesquisa em visão computacional do mundo. A Datagen é uma pioneira no novo campo de Dados Simulados, um subconjunto de dados sintéticos, que se concentra em recriar foto-realisticamente o mundo ao nosso redor. A empresa foi lançada em sigilo com mais de $18M em financiamento em março de 2021 e agora trabalha com uma série de empresas Fortune 100 em realidade aumentada/realidade virtual, robótica e automotiva, incluindo a maioria dos principais gigantes da tecnologia dos EUA.
O que inicialmente o atraiu para a robótica e o aprendizado de máquina?
Livros de ficção científica, como a série Fundação de Isaac Asimov e iRobot, sempre me fizeram pensar em um futuro em que os robôs seriam uma parte integral de nossas vidas diárias. Existem muitas tarefas chatas e repetitivas que as pessoas fazem; eu sabia que não queria fazer essas tarefas e não podia imaginar que ninguém mais quisesse. Considerando que a robótica é uma inevitabilidade tecnológica, pensei que ir nessa direção seria uma decisão de carreira inteligente e “à prova de futuro”.
Então, inicialmente, eu me aproximei do campo focando nos aspectos físicos do assunto e obtive meu diploma em Engenharia Mecânica pelo Technion, em Haifa, Israel. No final do meu curso, comecei a mergulhar profundamente no mundo de ferramentas CAD e capacidades. Essas são as ferramentas que permitem que engenheiros mecânicos projetem estruturas e dispositivos mecânicos (qualquer coisa, desde uma ponte até um carro). Eu vi uma enorme oportunidade de fazer um grande impacto sem lidar com as iterações lentas do mundo físico. Na prática, esses programas tinham muito poucas, ou nenhuma, capacidades de aprendizado de máquina/visão computacional integradas, que ajudassem os engenheiros a criar sistemas mecânicos mais simples, baratos e estáveis (isso foi em 2015). Eu me dirigi na direção da Visão Computacional em dados 3D com aprendizado profundo (muito novo na época) com o objetivo de criar programas CAD mais inteligentes. Trabalhar nos primeiros dias do aprendizado de máquina moderno se sentia como estar fazendo parte de algo que poderia ser realmente grande – semelhante à internet.
Na prática, minha pesquisa foi a primeira a trazer a revolução do Aprendizado Profundo para nossa faculdade no Technion. Isso mais tarde se transformou em um artigo aceito na principal conferência de visão computacional do mundo, CVPR, e eu voei para o Havaí para o CVPR 2017. Apresentar meu artigo e conhecer as pessoas realmente abriu meus olhos para a escala da comunidade de visão computacional (que hoje é pelo menos 10 vezes maior), milhares de participantes trabalhando apaixonadamente em pesquisas no campo. Esse evento praticamente selou minha direção, mostrando-me o poder da visão computacional e o potencial à espera de ser desbloqueado.
Poderia compartilhar a história de criação por trás da Datagen?
A Datagen foi fundada em 2018 com a missão de transformar como as equipes obtêm seus dados para o treinamento de redes de visão computacional. No ano anterior, vimos uma demonstração do Oculus Rift, que consistia em um headset de realidade virtual e um dispositivo de controle remoto portátil. Após a demonstração, nos perguntamos: “com câmeras sofisticadas incorporadas no headset, por que um dispositivo portátil era necessário para conectar o espaço virtual ao espaço físico (ou seja, rastrear o movimento da mão)?” As redes neurais já eram sofisticadas o suficiente para lidar com isso, então qual era o problema? E foi aí que a ideia surgiu – Dados! Imediatamente vimos a enorme oportunidade de resolver desafios de presença espacial 3D usando visão computacional avançada e metadados 3D. Em vez de se concentrar apenas em VR/AR, adotamos uma abordagem mais holística, concentrando-nos no problema aparentemente intransponível de gerar dados de treinamento suficientes e precisos para permitir aplicações de IA 3D no mundo real.
Com foco em humanos e interação humano-ambiente, a Datagen é uma pioneira no novo campo de Dados Simulados, um subconjunto de dados sintéticos, que se concentra em recriar foto-realisticamente o mundo ao nosso redor. Hoje, trabalhamos com as empresas mais inovadoras do mundo para impulsionar e acelerar o desenvolvimento de visão computacional e somos apoiados por alguns dos investidores mais respeitados no espaço.
Para os leitores que não estão familiarizados, poderia explicar o que é especificamente dados sintéticos?
Dados sintéticos são quaisquer dados de treinamento que – em vez de serem coletados por meio de medição direta ou observação do mundo real – são gerados por meio de algoritmos ou simulações. No contexto de visão computacional, dados sintéticos são imagens computacionais geradas com metadados associados necessários para treinar inteligências artificiais. Com questões de privacidade e limitações físicas e econômicas reais para os dados de imagem do mundo real, é difícil superestimar a importância dos dados sintéticos para o aprendizado de máquina e IA. Em um relatório recente, Gartner previu que, até 2024, a maioria dos dados usados no campo de IA será gerada artificialmente por esses motivos.
Quais são alguns benefícios dos dados sintéticos em comparação com a aquisição de dados manual?
A resposta curta é: pense em cada aspecto da aquisição de dados manual que é indesejável e remova-os do processo – esses são os benefícios dos dados sintéticos.
Gerar conjuntos de dados diversificados em escala para o treinamento de visão computacional é um processo caro e demorado, e a variância é muito limitada pelo simples fato de que situar humanos em locais específicos e fotografá-los é um processo complicado – muito mais complicado e caro do que fazer isso em um ambiente simulado. Outro benefício importante é a eliminação eficaz da necessidade de anotação manual, que é tediosa, demorada e propensa a erros humanos.
A Datagen se refere a dados simulados como um subconjunto de dados sintéticos. Poderia elaborar sobre o que são dados simulados?
Dados simulados são dados sintéticos gerados por meio de simulações. Usamos GANs (assim como outros métodos de aprendizado de máquina de ponta) para gerar objetos 3D e colocá-los dentro de simulações 3D altamente realistas do mundo real. O que isso parece é um processo de “fotografia virtual” em primeira pessoa, mas operando dentro de um sistema foto-realista e baseado em física. Essas simulações produzem dados visuais (como se fossem coletados no mundo real), juntamente com uma gama completa de anotações (física, iluminação, etc.). Portanto, Dados Simulados são dados sintéticos que são foto-realistas, gerados contextualmente, imagens 3D, coletados em um ambiente simulado.
Como a Datagen gera dados simulados personalizados?
A tecnologia da Datagen gera dados simulados que são escaláveis e personalizados para atender às necessidades únicas de cada cliente e aplicação. Fazemos isso levando em consideração todos os aspectos de cada projeto – desde o sistema de visão computacional sendo empregado até a composição demográfica da região em que ele será operado. Seja trabalhando diretamente com nossos clientes ou simplesmente habilitando seus próprios engenheiros, o processo da Datagen começa com o estabelecimento de parâmetros-chave para cada caso de uso específico, como especificações de lente, iluminação, ambiente, distribuição demográfica, etc. A Datagen usa GANs e outras ferramentas e técnicas de ponta para gerar uma imensa variedade de ativos, incluindo tudo, desde cabeças humanas com expressões faciais dinâmicas para treinar IA em análise emocional, até interiores de veículos para monitoramento de passageiros dentro do veículo, e ambientes domésticos para aplicações de conferência de vídeo, apenas para citar alguns. Para cada tipo de ativo, a Datagen introduz variância em inúmeros eixos discretos (desde tom de pele e altura da sobrancelha até o tamanho, cor e forma de móveis de casa), usando parâmetros que são finamente ajustados para refletir a aplicação específica em questão.
Graças a essas capacidades, os conjuntos de dados da Datagen não são apenas grandes e altamente variados, mas também otimizados para os propósitos de treinamento de um sistema único para realizar uma tarefa única (ou conjunto de tarefas) no ambiente ou configuração única em que ele será empregado – tudo sem comprometer a capacidade de escalar. Também levamos em consideração os requisitos específicos de anotação/metadata de cada aplicação.
Quais são alguns exemplos de soluções em robótica onde dados sintéticos e/ou simulados são usados?
Uma das maiores vantagens de usar dados simulados em robótica é a capacidade de gerar imagens de hardware que ainda está em desenvolvimento. Dessa forma, o cérebro do robô (IA) e o corpo (hardware) podem ser desenvolvidos lado a lado. Agora, o treinamento pode evoluir à medida que as especificações evoluem, em vez de esperar até que o produto final esteja totalmente prototipado antes de poder tirar fotos dele e começar a desenvolver a IA.
Além disso, porque os dados simulados são gerados no contexto, você pode levar em consideração a interação entre o robô e seu ambiente de forma muito mais fácil. Então, se você imaginar um robô que pega e remove produtos defeituosos de uma linha de montagem, os dados simulados permitiriam que você não apenas gerasse dados para cada defeito físico imaginável no produto, mas também do ponto de vista do robô para capturar o alcance completo de movimento do braço robótico, sua interação com o objeto que está pegando. O que é mais, os metadados 3D significam que não há necessidade de anotar imagem após imagem de forma tediosa para garantir que o robô possa identificar corretamente o produto, os defeitos, seu braço ou qualquer outra coisa em seu campo de visão.
Quais são alguns casos de uso para usar dados simulados em carros inteligentes?
Os dados simulados no desenvolvimento de carros inteligentes tornam muito mais fácil desenvolver conjuntos de dados para modelos de carros específicos à medida que são projetados, iterando em conjunto com o carro em si à medida que avança pelas várias fases de design e produção. Com dados de imagem simulados, os engenheiros também podem usar a visão dentro do veículo de forma mais eficaz para identificar motoristas sonolentos ou distraídos, se um motorista tirou a mão do volante, ou qualquer um dos casos de bordo para contabilizar a segurança do motorista. Isso também permite que os engenheiros contabilizem uma maior diversidade nos motoristas e passageiros e introduzam variância na forma de ângulo de imagem e iluminação – tudo sem infringir a privacidade de pessoas reais.
Recentemente, a Datagen anunciou um grande número de novas contratações emocionais, o que isso significa para o futuro da empresa?
As recentes adições ao nosso conselho consultivo e liderança executiva incluem alguns dos profissionais mais brilhantes e realizados no campo de IA e Visão Computacional. Seu conhecimento, insight e experiência ajudarão a orientar e acelerar o crescimento da Datagen à medida que navegamos por uma indústria que ainda é jovem e cheia de oportunidades. Em um campo com tantos desconhecidos, nada é mais valioso do que o conhecimento.
Há algo mais que você gostaria de compartilhar sobre a Datagen?
Com sede em Tel Aviv, a Datagen faz parte de uma mudança econômica e cultural maior que ocorreu em Israel, e estamos orgulhosos de fazer parte disso. Em um curto período de tempo, Israel (Tel Aviv, em particular) cresceu para se tornar um importante hub de tecnologia global, com um ecossistema de startups em ascensão e uma comunidade de investidores energizados. Embora Israel seja frequentemente considerado um hub de tecnologia centrado em segurança cibernética, a tecnologia centrada em IA e dados cresceu exponencialmente nos últimos anos aqui. Hoje, existem mais de 680 empresas de inteligência artificial em Israel, que coletivamente levantaram $4,5 bilhões. Essa explosão de crescimento nos últimos anos é devida em grande parte à alta concentração de engenheiros e às universidades de renome mundial de Israel. Essas instituições acadêmicas fornecem acesso a talentos e desenvolvimento de tecnologia de ponta no espaço. Nos últimos dois meses, a Datagen contratou mais de 20 funcionários e planeja trazer mais membros para a equipe em vendas e marketing, software e DevOps, e departamentos de produtos.
Obrigado pela grande entrevista, leitores que desejam aprender mais devem visitar a Datagen.












