Intervjuer
Edward Cui, Grunnlegger & CEO av Graviti – Intervju-serie

Edward Cui er grunnlegger og CEO av Graviti, et selskap som bygger neste generasjons dataplattform som vil endre hvordan utviklere samhandler med ustrukturert data. Med Graviti kan AI-utviklere tilegne, lagre og prosessere data raskere og enklere – grunnlaget som trengs for å utnytte kunstig intelligens til å styrke alle bransjer.
Du startet din bachelorstudie som maskiningeniør, hva var årsaken til skiftet til datavitenskap og kunstig intelligens?
Jeg studerte faktisk maskiningeniør som bachelor i 2012. Jeg tok en klasse i maskinlæring ved University of Pennsylvania, som var tankevekkende, og jeg visste at det var fremtiden og hva jeg ville gjøre for min karriere. Etter den klassen, byttet jeg til datavitenskap.
Etter eksamen, gjorde jeg forskning på forsterkingslæring ved University of Pennsylvania. I 2015, ble min tidligere sjef, Jeff Snyder, med i Uber og inviterte meg til å bli med i Uber ATG. Det var begynnelsen på min karriere i selvkjørende bilindustrien.
Kan du dele opphavsfortellingen bak Graviti?
Å jobbe i Uber var meget komplisert i begynnelsen fordi folk ikke brukte store maskinlæringsmodeller og vi manglet beregningskraft og en datahåndteringsplattform for å trene modeller. Dataene vi samlet inn for selvkjørende biler var alle ustrukturert. For eksempel, var de bilder, videoer, LIDAR-punkter. All den type data fra sanntidsensorer og vi samlet inn tonnevis av ustrukturert data hver dag. Vi gjorde en statistikk som viste at mengden data vi samlet inn i en selvkjørende bilavdeling på en uke var lik mengden data vi samlet inn for hele restaurantbransjen globalt for hele året. Tonnevis av ustrukturert data akkumulerte hver enkelt dag og det skapte store problemer med hvordan vi skulle lagre dataene, håndtere dataene og bruke dataene til å generere verdier for ulike organisasjoner.
Etter tre år i Uber, så jeg muligheten til å forbedre hvordan stor skala ustrukturert data kunne håndteres. Så, jeg grunnla Graviti i 2019 for å akselerere innovasjoner i AI ved å bygge en ustrukturert datahåndteringsplattform.
Kan du diskutere hvordan Graviti er en plattform for å håndtere og strukturere data i stor skala?
Graviti har som mål å lansere den første dataplattformen som gjør det mulig for organisasjoner å arbeide med store mengder ustrukturert data for å drive innovative AI-applikasjoner. Denne plattformen eliminerer besværet og hjelper utviklere å håndtere store mengder ustrukturert data med teamet.
Mens det meste av tilgjengelig informasjon i AI-utvikling er lavkvalitets og ustrukturert, bruker utviklingsteamene vanligvis over 50% av tiden sin – ikke på å bygge modeller – men på å identifisere, forbedre eller rense ustrukturert data, og det er bare begynnelsen på deres arbeid. Graviti tilbyr en mer ekspert datahåndtering måte til å frigjøre utviklere og gi dem mer tid til å analysere ustrukturert data og trene kunstig intelligensmodeller.
Vi hjelper utviklere i tre dimensjoner: dataoppdagelse, dataiterasjon og arbeidsflytautomatisering.
Dataoppdagelse:
Graviti tilbyr en data-vertsfunksjon som gjør det enklere å organisere rådata, annotasjoner og metadata ved å samordne datasett og annotasjonsformater. Når AI-utviklere får tilgang til ulike datasett gjennom Graviti, trenger de ikke å konvertere dataformatene, noe som forenkler håndtering, spørring, tilgang og andre operasjoner knyttet til annotasjoner. Graviti hjelper til å redusere muligheten for feilaktig rådata eller tap av annotasjoner. Videre kan Graviti-plattformen hjelpe utviklere til å evaluere kvaliteten på datasett med en datavisualiseringsfunksjon, som sparer minst åtte timer per uke for utviklere.
Dataiterasjon:
Når utviklere trener kunstig intelligens, må de teste med datasett i ulike versjoner for å se resultater og markere ned annotasjoner. Utfordringen er å spore ulike redigeringer og versjoner med teammedlemmene som arbeider på samme prosjekt. Graviti tilbyr løsningen ved å aktivere tildeling av ulike tilgangsrettigheter til ansatte for å tillate dem å laste opp annotasjoner og spore prosjektets fremgang og arbeide samtidig.
Arbeidsflytautomatisering:
Med en funksjon kalt “Action”, kan ingeniører automatisere arbeidsflyter og redusere repetitive, tidskrevende og manuelle sysler. Det frigjør utviklere fra å skrive store manuelle skript for å oppnå disse arbeidsflytene og åpner opp tid for dem til å gjøre det arbeidet de trenger å gjøre.
Hvorfor er ustrukturert data fremtiden for AI?
Over 80% av bedriftsdata er ustrukturert nå, inkludert bilder, opptak, videoer, sosiale medieinnlegg osv. AI er nøkkelen til å levere verdier fra ustrukturert data. Bedrifter begynner å utnytte ustrukturert data til å støtte dyptgående forskning og videre analyse.
Graviti lanserte nylig OpenBytes, et ikke-gevinstbasert åpent dataprosjekt som vertes under Linux Foundation. Kan du diskutere hva OpenBytes er spesifikt?
OpenBytes’ misjon er å lette videre deling av data i AI-samfunnet gjennom å opprette datastandarder, formater og prosesser som muliggjør bidrag av data. OpenBytes’ omfang inkluderer kuratering av åpne datasett, åpne dataspesifikasjoner og samarbeidende utvikling under åpne lisenser som støtter misjonen, inkludert dokumentasjon, testing, integrasjon og opprettelse av andre artefakter som hjelper utvikling, distribusjon, drift eller tilpasning av det åpne kildekodesprosjektet.
OpenBytes kan redusere data bidragsyteres ansvarsrisk. Datasett-eiere er motvillige til å dele datasettene offentlig på grunn av manglende kunnskap om data lisenser. Når datasett-bidragsytere blir med i OpenBytes, vil deres data være beskyttet, og mer åpen data blir tilgjengelig.
Vi genererer også en standard datasettformat når vi publiserer, deler og bytter data. En samordnet format vil hjelpe data bidragsytere til å forstå datasett og finne relevante data de trenger, noe som fører til høyere kvalitets åpne datasett-bidrag.
Hva er noen av fordelene med åpne datasett?
De fordelene forskerne fordi vitenskapsmenn har flere gratis ressurser å bruke til å trene modeller og fullføre forskning.
De fordelene bedrifter, som bruker datasettene til å bygge AI-evner og styrke overgangen fra tradisjonelle bedrifter til AI-baserte bedrifter.
Hvordan autentiserer Graviti kvaliteten på datasettene?
Selv populære datasett som COCO og KITTI er ikke perfekte for utviklere. Feil oppstår alltid når utviklere trener modeller og ingen har funnet en god måte å forbedre datasett-kvaliteter på. Graviti tror at en datasett-evalueringmodell vil bli etablert eller en annen teknisk revolusjon vil hjelpe samfunnet å løse problemet, og det er også en del av Gravitis misjon å oppnå i fremtiden.
Hva er din visjon for fremtiden for hvordan utviklere får tilgang til data?
For en liten mengde data, bør utviklere kunne få tilgang til dataene enkelt. For større mengder data, som mer diverse datasett for å trene modeller, vil fødererte lærings-teknologi hjelpe til å arbeide på samarbeidende måter ved å kopple evnen til å gjøre maskinlæring fra å lagre data i en sentral server.
Er det noe annet du vil dele om Graviti?
Graviti utvikler seg også. Vi lytter til tilbakemeldinger fra våre kunder, inkludert start-ups, bedrifter, enkelte utviklere og forskere. Vi velkomner også alle samarbeids- eller partnerskapsmuligheter fra alle.
Vi ser store muligheter i AI-utvikling fra åpen data i en svært nær fremtid. Vi bygger en samfunn for deling og bidrag av åpen data. Dette vil fordelene forskerne til å drive grensene for vitenskapen videre, samt bedrifter til å forbedre modellene og utvikle teknologi i et gjensidig fordelaktig miljø.
Takk for det flotte intervjuet, lesere som ønsker å lære mer bør besøke Graviti.












