stub Edward Cui, grundlægger og administrerende direktør for Graviti - Interview Series - Unite.AI
Følg os

Interviews

Edward Cui, grundlægger og administrerende direktør for Graviti – Interview Series

mm
Opdateret on

Edward Cui er grundlægger og administrerende direktør af Graviti, en virksomhed, der bygger næste generations dataplatform, som fundamentalt vil ændre, hvordan udviklere interagerer med ustrukturerede data. Med Graviti kan AI-udviklere erhverve, gemme og behandle data hurtigere og nemmere – det nødvendige grundlag for at udnytte kunstig intelligens til at styrke alle industrier.

Du startede dit bachelorstudium som maskiningeniør, hvad forårsagede skiftet til datalogi og kunstig intelligens?

Jeg studerede faktisk maskinteknik som undergraduat i 2012. Jeg tog en klasse om maskinlæring på University of Pennsylvania, hvilket var utroligt, og jeg vidste, at det var fremtiden, og hvad jeg ville gøre for min karriere. Efter den time gik jeg over til datalogi.

Efter endt uddannelse forskede jeg i forstærkningslæring ved University of Pennsylvania. I 2015 sluttede min tidligere chef, Jeff Snyder, sig til Uber og inviterede mig til Uber ATG. Det er begyndelsen på min karriere i den selvkørende bilindustri.

Kunne du dele tilblivelseshistorien bag Graviti?

At arbejde hos Uber var meget kompliceret i begyndelsen, fordi folk ikke brugte store maskinlæringsmodeller, og vi manglede computerkraft og en datastyringsplatform til at træne modeller. De data, vi indsamlede for selvkørende biler, var alle ustrukturerede. For eksempel var de billeder, videoer, LIDAR-punkter. Al den type data fra sensorer i den virkelige verden, og vi indsamlede tonsvis af ustrukturerede data hver dag. Vi lavede en statistik, hvor den fortalte os, at mængden af ​​data, vi indsamlede i en selvkørende bilafdeling i en uge, er lig med de data, vi indsamler for hele restaurationsbranchen globalt for hele året. Tonsvis af ustrukturerede data akkumuleret for hver eneste dag, og det skabte store problemer med, hvordan man opbevarer disse data, hvordan man administrerer disse data, og hvordan man bruger disse data til rent faktisk at generere værdier for forskellige organisationer.

Efter tre års arbejde hos Uber så jeg muligheden for at forbedre, hvordan ustrukturerede data i stor skala kunne håndteres. Så jeg grundlagde Graviti i 2019 for at accelerere innovationer inden for AI ved at bygge den ustrukturerede dataadministrationsplatform.

Kan du diskutere, hvordan Graviti er en platform til at administrere og strukturere data i skala?

Graviti sigter mod at lancere den første dataplatform, der gør det muligt for organisationer at arbejde med store mængder ustrukturerede data for at drive innovative AI-applikationer. Denne platform eliminerer besværet og hjælper udviklere med at administrere store mængder ustrukturerede data med teamet.

Mens langt størstedelen af ​​tilgængelig information i AI-udvikling er af lav kvalitet og ustruktureret, bruger udviklingsteams normalt over 50 % af deres tid – ikke på at bygge modeller – men på at identificere, udvide eller rense ustrukturerede data, og det er kun begyndelsen på deres arbejde. Graviti tilbyder en mere ekspert datastyringsmetode til at frigøre udviklere og giver dem mere tid til at analysere ustrukturerede data og træne kunstig intelligens-modeller.

Vi hjælper udviklere i tre dimensioner: dataopdagelse, dataiteration og workflowautomatisering.

Dataopdagelse:

Graviti tilbyder en data-hosting-funktion, der gør det meget nemmere at organisere rådata, annoteringer og metadata ved at forene datasættet og annotationsformaterne. Når AI-udviklere får adgang til forskellige datasæt gennem Graviti, behøver de ikke at konvertere dataformaterne, hvilket forenkler administrationen, forespørgslen, adgangen og andre operationer involveret i annotering. Graviti hjælper med at reducere muligheden for uoverensstemmende rådata eller tab af annoteringer. Desuden kan Graviti-platformen hjælpe udviklere med at evaluere kvaliteten af ​​datasæt med en datavisualiseringsfunktion, som sparer mindst otte timer om ugen for udviklere.

Data iteration:

Når udviklere træner deres kunstige intelligens, skal de teste med datasæt i forskellige versioner for at se resultater og markere annoteringerne. Udfordringen er at spore forskellige redigeringer og versioner med teammedlemmerne, der arbejder på det samme projekt. Graviti tilbyder løsningen ved at muliggøre tildeling af forskellige niveauer af adgangsrettigheder til medarbejdere, så de kan uploade deres annoteringer for at spore projektets fremskridt og arbejde samtidigt.

Workflow automatisering:

Med en funktion kaldet "Action" kan ingeniører automatisere arbejdsgange og reducere gentagne, tidskrævende og manuelle gøremål. Det frigør udviklere fra at skrive store manuelle scripts for at opnå disse arbejdsgange, og giver dem tid til at komme til det arbejde, de skal udføre.

Hvorfor er ustrukturerede data fremtiden for AI?

Over 80 % af virksomhedens data er ustruktureret nu, inklusive billeder, optagelser, videoer, sociale medier osv. AI er nøglen til at levere værdier fra ustrukturerede data. Virksomheder begynder at udnytte ustrukturerede data til at understøtte dybdegående forskning og yderligere analyser.

Graviti lancerede for nylig OpenBytes, et non-profit åbne dataprojekt, der er hostet under Linux Foundation. Kan du diskutere, hvad OpenBytes specifikt er?

Missionen for OpenBytes er at lette den bredere deling af data i AI-samfundet gennem skabelsen af ​​datastandarder, formater og processer, der muliggør bidrag af data. Omfanget af OpenBytes omfatter kuration af åbne datasæt, åbne dataspecifikationer og samarbejdsudvikling under åbne licenser, der understøtter missionen, herunder dokumentation, test, integration og oprettelse af andre artefakter, der hjælper med udvikling, implementering, drift eller overtagelse af den åbne- kildeprojekt.

OpenBytes kan reducere databidragyders ansvarsrisici. Datasætindehavere er tilbageholdende med at dele deres datasæt offentligt på grund af manglende viden om datalicenser. Når datasætbidragydere tilslutter sig OpenBytes, vil deres data blive beskyttet, og flere åbne data bliver tilgængelige.

Vi genererer også et standarddatasætformat, når vi udgiver, deler og udveksler data. Et samlet format vil hjælpe databidragydere med at forstå datasæt og finde relevante data, de har brug for, hvilket fører til flere åbne datasætbidrag af højere kvalitet.

Hvad er nogle af fordelene ved open source-datasæt?

De gavner forskerne, fordi forskere har flere gratis ressourcer til at bruge til at træne modeller og gennemføre forskning.

De gavner virksomheder, som bruger datasættene til at begynde at opbygge AI-evner og styrke overgangen fra traditionelle virksomheder til AI-virksomheder.

Hvordan autentificerer Graviti kvaliteten af ​​datasættene?

Selv populære datasæt som COCO og KITTI er ikke perfekte til udviklere. Der opstår altid fejl, når udviklere træner modeller, og ingen har fundet ud af en fremragende måde at forbedre datasættets kvaliteter på. Graviti mener, at der vil blive etableret en datasætevalueringsmodel, eller at en anden teknisk revolution vil hjælpe samfundet med at løse problemet, og det er også en del af Gravitis mission at opnå i fremtiden.

Hvad er din fremtidsvision for, hvordan udviklere får adgang til data i fremtiden?

For en lille mængde data bør udviklere nemt kunne få adgang til disse data. For større mængder data, såsom mere forskelligartede datasæt til træningsmodeller, vil fødereret læringsteknologi hjælpe med at arbejde på samarbejdsmåder ved at afkoble evnen til at udføre maskinlæring fra lagring af data på en central server.

Er der andet, du gerne vil dele om Graviti?

Graviti udvikler sig også. Vi lytter til feedback fra vores kunder, herunder startups, virksomheder, individuelle udviklere og forskere. Vi glæder os også over ethvert samarbejde eller partnerskabsmuligheder fra alle.

Vi ser store muligheder i AI-udvikling fra åbne data i den nærmeste fremtid. Vi bygger et fællesskab til at dele og bidrage med åbne data. Dette vil gavne ikke kun forskere til at flytte videnskabens grænser yderligere, men også virksomheder til at forfine deres modeller og udvikle teknologi i et gensidigt gavnligt miljø.

Tak for det gode interview, læsere, der ønsker at lære mere, bør besøge Graviti.

En stiftende partner af unite.AI og et medlem af Forbes Technology Council, Antoine er en fremtidsforsker der brænder for fremtiden for kunstig intelligens og robotteknologi.

Han er også grundlægger af Værdipapirer.io, en hjemmeside, der fokuserer på at investere i disruptiv teknologi.