Entrevistas
Edward Cui, Fundador & CEO da Graviti – Série de Entrevistas

Edward Cui é o Fundador & CEO da Graviti, uma empresa que está construindo a próxima geração de plataforma de dados que mudará fundamentalmente a forma como os desenvolvedores interagem com dados não estruturados. Com a Graviti, os desenvolvedores de IA podem adquirir, armazenar e processar dados mais rapidamente e facilmente – a base necessária para aproveitar a inteligência artificial para empoderar todas as indústrias.
Você começou seus estudos de graduação como engenheiro mecânico, o que causou a mudança para ciência da computação e inteligência artificial?
Eu estudei engenharia mecânica como graduado em 2012. Eu fiz uma aula sobre aprendizado de máquina na Universidade da Pensilvânia, que foi incrível, e eu sabia que era o futuro e o que eu queria fazer em minha carreira. Depois dessa aula, eu me transfiri para ciência da computação.
Após a formatura, eu fiz pesquisas sobre aprendizado por reforço na Universidade da Pensilvânia. Em 2015, meu ex-chefe, Jeff Snyder, se juntou à Uber e me convidou para me juntar à Uber ATG. Essa é a começou da minha carreira na indústria de carros autônomos.
Pode compartilhar a história de criação da Graviti?
Trabalhar na Uber foi muito complicado no início porque as pessoas não usavam grandes modelos de aprendizado de máquina e nós não tínhamos poder de computação e uma plataforma de gerenciamento de dados para treinar modelos. Os dados que coletamos para carros autônomos eram todos não estruturados. Por exemplo, eram imagens, vídeos, pontos LIDAR. Todos esses tipos de dados de sensores do mundo real e coletamos toneladas de dados não estruturados todos os dias. Nós fizemos uma estatística que mostrou que a quantidade de dados que coletamos em uma divisão de carros autônomos em uma semana é igual à quantidade de dados que coletamos para todo o negócio de restaurantes globalmente em um ano. Toneladas de dados não estruturados se acumulavam todos os dias e isso criou grandes problemas sobre como armazenar esses dados, como gerenciá-los e como usá-los para gerar valor para diferentes organizações.
Após três anos trabalhando na Uber, eu vi a oportunidade de melhorar como os grandes volumes de dados não estruturados poderiam ser gerenciados. Então, eu fundei a Graviti em 2019 para acelerar as inovações em IA, construindo a plataforma de gerenciamento de dados não estruturados.
Pode discutir como a Graviti é uma plataforma para gerenciar e estruturar dados em escala?
A Graviti visa lançar a primeira plataforma de dados que permite que as organizações trabalhem com grandes volumes de dados não estruturados para alimentar aplicações inovadoras de IA. Essa plataforma elimina o incômodo e ajuda os desenvolvedores a gerenciar grandes quantidades de dados não estruturados com a equipe.
Enquanto a grande maioria das informações disponíveis no desenvolvimento de IA é de baixa qualidade e não estruturada, as equipes de desenvolvimento geralmente gastam mais de 50% do seu tempo – não em construir modelos – mas em identificar, aumentar ou limpar dados não estruturados, e isso é apenas o começo do seu trabalho. A Graviti oferece uma forma mais especializada de gerenciamento de dados para liberar os desenvolvedores e dar-lhes mais tempo para analisar dados não estruturados e treinar modelos de inteligência artificial.
Nós ajudamos os desenvolvedores em três dimensões: descoberta de dados, iteração de dados e automação de fluxo de trabalho.
Descoberta de Dados:
A Graviti oferece um recurso de hospedagem de dados que torna mais fácil organizar dados brutos, anotações e metadados, unificando o conjunto de dados e os formatos de anotação. Quando os desenvolvedores de IA acessam diferentes conjuntos de dados por meio da Graviti, eles não precisam converter os formatos de dados, o que simplifica o gerenciamento, a consulta, o acesso e outras operações envolvidas com anotação. A Graviti ajuda a reduzir a oportunidade de dados brutos não correspondentes ou perda de anotações. Além disso, a plataforma Graviti pode ajudar os desenvolvedores a avaliar a qualidade dos conjuntos de dados com um recurso de visualização de dados, o que economiza pelo menos oito horas por semana para os desenvolvedores.
Iteração de Dados:
Quando os desenvolvedores treinam sua inteligência artificial, eles precisam testar com conjuntos de dados em diferentes versões para ver os resultados e marcar as anotações. O desafio é rastrear as várias edições e versões com os membros da equipe trabalhando no mesmo projeto. A Graviti oferece a solução, permitindo a alocação de diferentes níveis de direitos de acesso aos funcionários para que eles possam carregar suas anotações, rastrear o progresso do projeto e trabalhar simultaneamente.
Automação de Fluxo de Trabalho:
Com um recurso chamado “Ação”, os engenheiros podem automatizar fluxos de trabalho e reduzir tarefas repetitivas, demoradas e manuais. Isso libera os desenvolvedores de escrever grandes scripts manuais para alcançar esses fluxos de trabalho e abre tempo para que eles façam o trabalho que precisam fazer.
Por que os dados não estruturados são o futuro da IA?
Mais de 80% dos dados das empresas são não estruturados agora, incluindo imagens, gravações, vídeos, posts de mídia social, etc. A IA é a chave para entregar valor a partir de dados não estruturados. As empresas começam a aproveitar dados não estruturados para apoiar pesquisas aprofundadas e análises adicionais.
A Graviti lançou recentemente o OpenBytes, um projeto de dados aberto sem fins lucrativos hospedado pela Linux Foundation. Pode discutir o que é o OpenBytes especificamente?
A missão do OpenBytes é facilitar a partilha mais ampla de dados na comunidade de IA por meio da criação de padrões de dados, formatos e processos que permitam contribuições de dados. O escopo do OpenBytes inclui a curadoria de conjuntos de dados abertos, especificações de dados abertas e desenvolvimento colaborativo sob licenças abertas que apoiam a missão, incluindo documentação, teste, integração e a criação de outros artefatos que ajudem o desenvolvimento, implantação, operação ou adoção do projeto de código aberto.
O OpenBytes pode reduzir os riscos de responsabilidade para os contribuintes de dados. Os detentores de conjuntos de dados são relutantes em compartilhar seus conjuntos de dados publicamente devido à falta de conhecimento sobre licenças de dados. Uma vez que os contribuintes de conjuntos de dados se juntam ao OpenBytes, seus dados serão protegidos e mais dados abertos estarão disponíveis.
Nós também estamos gerando um formato de conjunto de dados padrão ao publicar, compartilhar e trocar dados. Um formato unificado ajudará os contribuintes de dados a entender os conjuntos de dados e a encontrar dados relevantes de que precisam, levando a contribuições de conjuntos de dados de maior qualidade.
Quais são alguns dos benefícios dos conjuntos de dados de código aberto?
Eles beneficiam os pesquisadores porque os cientistas têm mais recursos gratuitos para usar para treinar modelos e completar pesquisas.
Eles beneficiam as empresas, que usam os conjuntos de dados para começar a construir habilidades de IA e impulsionar a transição de empresas tradicionais para empresas de IA.
Como a Graviti autentica a qualidade dos conjuntos de dados?
Mesmo conjuntos de dados populares, como COCO e KITTI, não são perfeitos para os desenvolvedores. Bugs sempre ocorrem quando os desenvolvedores treinam modelos e ninguém encontrou uma maneira excelente de melhorar a qualidade dos conjuntos de dados. A Graviti acredita que um modelo de avaliação de conjuntos de dados será estabelecido ou outra revolução técnica ajudará a comunidade a resolver o problema, e isso também é parte da missão da Graviti para alcançar no futuro.
Qual é sua visão para o futuro de como os desenvolvedores acessam dados?
Para uma pequena quantidade de dados, os desenvolvedores devem ser capazes de acessar esses dados facilmente. Para quantidades maiores de dados, como conjuntos de dados mais diversificados para treinar modelos, a tecnologia de aprendizado federado ajudará a trabalhar de forma colaborativa, desacoplando a capacidade de fazer aprendizado de máquina do armazenamento de dados em um servidor central.
Há algo mais que você gostaria de compartilhar sobre a Graviti?
A Graviti também está evoluindo. Nós ouvimos os feedbacks dos nossos clientes, incluindo startups, empresas, desenvolvedores individuais e pesquisadores. Nós também acolhemos qualquer oportunidade de colaboração ou parceria de todos.
Nós vemos grandes oportunidades no desenvolvimento de IA a partir de dados abertos em um futuro muito próximo. Nós construímos uma comunidade para compartilhar e contribuir com dados abertos. Isso beneficiará não apenas os pesquisadores para impulsionar os limites da ciência, mas também as empresas para refinar seus modelos e evoluir a tecnologia em um ambiente mutuamente benéfico.
Obrigado pela grande entrevista, leitores que desejam aprender mais devem visitar Graviti.












