Connect with us

Interviews

Edward Cui, Oprichter & CEO van Graviti – Interview Serie

mm

Edward Cui is de Oprichter & CEO van Graviti, een bedrijf dat de volgende generatie data-platform bouwt dat fundamenteel zal veranderen hoe ontwikkelaars interactie hebben met ongestructureerde data. Met Graviti kunnen AI-ontwikkelaars data sneller en gemakkelijker verkrijgen, opslaan en verwerken – de basis die nodig is om kunstmatige intelligentie te gebruiken om alle industrieën te empoweren.

U bent uw undergraduate-studie als werktuigkundig ingenieur begonnen, wat was de oorzaak van de overstap naar computerwetenschappen en kunstmatige intelligentie?

Ik heb in 2012 als undergraduate werktuigkundig ingenieur gestudeerd. Ik volgde een cursus over machine learning aan de Universiteit van Pennsylvania, wat verbluffend was, en ik wist dat het de toekomst was en wat ik voor mijn carrière wilde doen. Na die cursus, ben ik overgestapt naar computerwetenschappen.

Na mijn afstuderen, deed ik onderzoek naar reinforcement learning aan de Universiteit van Pennsylvania. In 2015, sloot mijn voormalige baas, Jeff Snyder, zich aan bij Uber en nodigde hij me uit om me bij Uber ATG aan te sluiten. Dat was het begin van mijn carrière in de zelfrijdende auto-industrie.

Kunt u het verhaal achter Graviti delen?

Werken bij Uber was heel ingewikkeld in het begin, omdat mensen geen grote machine learning-modellen gebruikten en we geen compute-power en geen data-management-platform hadden om modellen te trainen. De data die we verzamelden voor zelfrijdende auto’s waren allemaal ongestructureerd. Bijvoorbeeld, het waren afbeeldingen, video’s, LIDAR-punten. Allemaal dat soort data van real-world-sensoren en we verzamelden elke dag enorme hoeveelheden ongestructureerde data. We deden een statistiek waaruit bleek dat de hoeveelheid data die we in een week verzamelden in de zelfrijdende auto-afdeling gelijk was aan de data die we in een heel jaar verzamelden voor de hele restaurantbusiness wereldwijd. Elke dag verzamelden we enorme hoeveelheden ongestructureerde data, en dat zorgde voor grote problemen over hoe we die data moesten opslaan, beheren en gebruiken om waarde te creëren voor verschillende organisaties.

Na drie jaar bij Uber te hebben gewerkt, zag ik de kans om te verbeteren hoe grote hoeveelheden ongestructureerde data beheerd konden worden. Dus, ik richtte Graviti op in 2019 om innovaties in AI te versnellen door een ongestructureerd data-management-platform te bouwen.

Kunt u uitleggen hoe Graviti een platform is om data te beheren en te structureren op grote schaal?

Graviti heeft als doel het eerste data-platform te lanceren dat organisaties in staat stelt om met grote hoeveelheden ongestructureerde data te werken om innovatieve AI-toepassingen te laten werken. Dit platform elimineert de problemen en helpt ontwikkelaars om grote hoeveelheden ongestructureerde data te beheren met het team.

Terwijl het merendeel van de beschikbare informatie in AI-ontwikkeling van lage kwaliteit en ongestructureerd is, besteden ontwikkelteams meestal meer dan 50% van hun tijd – niet aan het bouwen van modellen – maar aan het identificeren, aanvullen of reinigen van ongestructureerde data, en dat is maar het begin van hun werk. Graviti biedt een meer deskundige manier van data-beheer om ontwikkelaars te bevrijden en hen meer tijd te geven om ongestructureerde data te analyseren en AI-modellen te trainen.

We helpen ontwikkelaars in drie dimensies: data-ontdekking, data-iteratie en workflow-automatisering.

Data-ontdekking:

Graviti biedt een data-hosting-functie die het organiseren van ruwe data, annotaties en metadata veel gemakkelijker maakt door de dataset en annotatie-formats te unificeren. Wanneer AI-ontwikkelaars toegang hebben tot verschillende datasets via Graviti, hoeven ze de data-formats niet om te zetten, wat het beheer, opvragen, toegang en andere bewerkingen met annotaties vereenvoudigt. Graviti helpt om de kans op onjuiste ruwe data of verlies van annotaties te verminderen. Bovendien kan het Graviti-platform ontwikkelaars helpen om de kwaliteit van datasets te evalueren met een data-visualisatiefunctie, wat ontwikkelaars minstens acht uur per week bespaart.

Data-iteratie:

Wanneer ontwikkelaars hun AI trainen, moeten ze datasets in verschillende versies testen om resultaten te zien en annotaties te markeren. De uitdaging is om verschillende bewerkingen en versies bij te houden met teamleden die aan hetzelfde project werken. Graviti biedt de oplossing door ontwikkelaars in staat te stellen om verschillende niveaus van toegangsrechten aan medewerkers toe te kennen, zodat ze hun annotaties kunnen uploaden om de voortgang van het project bij te houden en tegelijkertijd te werken.

Workflow-automatisering:

Met een functie genaamd “Action”, kunnen ingenieurs workflows automatiseren en repetitieve, tijdrovende en handmatige taken verminderen. Het bevrijdt ontwikkelaars van het schrijven van grote handmatige scripts om deze workflows te bereiken en opent tijd voor hen om het werk te doen dat ze moeten doen.

Waarom is ongestructureerde data de toekomst van AI?

Meer dan 80% van de ondernemingsdata is ongestructureerd, waaronder afbeeldingen, opnames, video’s, sociale media-berichten, enz. AI is de sleutel om waarde te leveren uit ongestructureerde data. Ondernemingen beginnen ongestructureerde data te gebruiken om diepgaand onderzoek en verdere analyse te ondersteunen.

Graviti heeft onlangs OpenBytes gelanceerd, een non-profit open data-project dat wordt gehost onder de Linux Foundation. Kunt u uitleggen wat OpenBytes specifiek is?

De missie van OpenBytes is om de bredere deling van data in de AI-gemeenschap te faciliteren door de creatie van data-standaarden, -formats en -processen die bijdragen aan de missie, inclusief documentatie, testen, integratie en de creatie van andere artefacten die de ontwikkeling, implementatie, werking of adoptie van het open-source-project ondersteunen.

OpenBytes kan de aansprakelijkheidsrisico’s van data-bijdragers verminderen. Dataset-houders zijn terughoudend om hun datasets openbaar te delen vanwege een gebrek aan kennis over data-licenties. Zodra dataset-bijdragers zich bij OpenBytes aansluiten, wordt hun data beschermd en wordt meer open data toegankelijk.

We genereren ook een standaard dataset-formaat bij het publiceren, delen en uitwisselen van data. Een uniform formaat helpt data-bijdragers om datasets te begrijpen en relevante data te vinden die ze nodig hebben, wat leidt tot meer kwalitatief hoogwaardige open datasets-bijdragen.

Wat zijn enkele van de voordelen van open-source datasets?

Ze zijn gunstig voor onderzoekers, omdat wetenschappers meer gratis bronnen hebben om modellen te trainen en onderzoek te doen.

Ze zijn gunstig voor ondernemingen, die datasets gebruiken om AI-mogelijkheden te starten en de overgang van traditionele ondernemingen naar AI-ondernemingen te versnellen.

Hoe verifieert Graviti de kwaliteit van de datasets?

Zelfs populaire datasets zoals COCO en KITTI zijn niet perfect voor ontwikkelaars. Bugs komen altijd voor wanneer ontwikkelaars modellen trainen en niemand heeft een uitstekende manier gevonden om de kwaliteit van datasets te verbeteren. Graviti gelooft dat een dataset-evaluatiemodel zal worden opgericht of een andere technische revolutie de gemeenschap zal helpen om het probleem op te lossen, en het is ook onderdeel van Graviti’s missie om dit in de toekomst te bereiken.

Wat is uw visie op de toekomst van hoe ontwikkelaars toegang hebben tot data?

Voor een kleine hoeveelheid data, zouden ontwikkelaars gemakkelijk toegang moeten hebben tot die data. Voor grotere hoeveelheden data, zoals meer diverse datasets voor het trainen van modellen, zou federated learning-technologie helpen om op een samenwerkende manier te werken door de mogelijkheid om machine learning uit te voeren los te koppelen van het opslaan van data in een centrale server.

Is er nog iets anders dat u wilt delen over Graviti?

Graviti evolueert ook. We luisteren naar de feedback van onze klanten, waaronder startups, ondernemingen, individuele ontwikkelaars en onderzoekers. We verwelkomen ook elke samenwerkings- of partnerschapsmogelijkheid van iedereen.

We zien grote kansen in AI-ontwikkeling van open data in de zeer nabije toekomst. We bouwen een gemeenschap voor het delen en bijdragen van open data. Dit zal niet alleen onderzoekers helpen om de grenzen van de wetenschap verder te pushen, maar ook ondernemingen om hun modellen te verfijnen en technologie te ontwikkelen in een wederzijds voordelige omgeving.

Bedankt voor het geweldige interview, lezers die meer willen leren, moeten Graviti bezoeken.

Antoine is een visionaire leider en oprichtend partner van Unite.AI, gedreven door een onwankelbare passie voor het vormgeven en promoten van de toekomst van AI en robotica. Een seriële ondernemer, hij gelooft dat AI net zo disruptief voor de samenleving zal zijn als elektriciteit, en wordt vaak betrapt op het enthousiast praten over het potentieel van disruptieve technologieën en AGI. Als een futurist, is hij toegewijd aan het onderzoeken van hoe deze innovaties onze wereld zullen vormgeven. Bovendien is hij de oprichter van Securities.io, een platform dat zich richt op investeren in cutting-edge technologieën die de toekomst opnieuw definiëren en hele sectoren herschappen.