Interviews
Edward Cui, Gründer & CEO von Graviti – Interview-Serie

Edward Cui ist der Gründer & CEO von Graviti, einem Unternehmen, das die nächste Generation von Datenplattformen aufbaut, die grundlegend ändern, wie Entwickler mit unstrukturierten Daten interagieren. Mit Graviti können KI-Entwickler Daten schneller und einfacher erwerben, speichern und verarbeiten – die Grundlage, die benötigt wird, um künstliche Intelligenz zu nutzen, um alle Branchen zu stärken.
Sie haben Ihr Bachelor-Studium als Maschinenbauingenieur begonnen, was hat den Wechsel zu Informatik und künstlicher Intelligenz verursacht?
Ich habe 2012 tatsächlich Maschinenbau an der University of Pennsylvania studiert. Ich nahm einen Kurs über maschinelles Lernen, der verblüffend war, und ich wusste, dass es die Zukunft war und was ich für meine Karriere tun wollte. Nach diesem Kurs wechselte ich zu Informatik.
Nach meinem Abschluss forschte ich an der University of Pennsylvania über verstärkendes Lernen. 2015 trat mein ehemaliger Chef, Jeff Snyder, bei Uber ein und lud mich ein, bei Uber ATG zu arbeiten. Das war der Beginn meiner Karriere in der Branche der selbstfahrenden Autos.
Können Sie die Entstehungsgeschichte hinter Graviti teilen?
Die Arbeit bei Uber war sehr kompliziert am Anfang, weil die Leute keine großen maschinellen Lernmodelle verwendeten und wir über keine Rechenleistung und keine Datenmanagement-Plattform verfügten, um Modelle zu trainieren. Die Daten, die wir für selbstfahrende Autos sammelten, waren alle unstrukturiert. Zum Beispiel waren es Bilder, Videos, LIDAR-Punkte. All diese Arten von Daten von Real-Welt-Sensoren und wir sammelten täglich riesige Mengen an unstrukturierten Daten. Wir haben eine Statistik erstellt, die uns sagte, dass die Menge an Daten, die wir in einer Woche in der Abteilung für selbstfahrende Autos sammelten, der Menge an Daten entsprach, die wir im gesamten Restaurantgeschäft weltweit in einem Jahr sammelten. Riesige Mengen an unstrukturierten Daten häuften sich jeden Tag an und das schuf große Probleme bei der Speicherung, Verwaltung und Nutzung dieser Daten, um Werte für verschiedene Organisationen zu generieren.
Nach drei Jahren bei Uber sah ich die Gelegenheit, die Verwaltung großer Mengen an unstrukturierten Daten zu verbessern. Also gründete ich 2019 Graviti, um Innovationen in der KI durch den Aufbau einer Plattform für die Verwaltung unstrukturierter Daten zu beschleunigen.
Können Sie erläutern, wie Graviti eine Plattform ist, um Daten im großen Maßstab zu verwalten und zu strukturieren?
Graviti zielt darauf ab, die erste Datenplattform zu starten, die es Organisationen ermöglicht, mit großen Mengen an unstrukturierten Daten zu arbeiten, um innovative KI-Anwendungen zu ermöglichen. Diese Plattform eliminiert die Umstände und hilft Entwicklern, große Mengen an unstrukturierten Daten mit dem Team zu verwalten.
Während die meisten verfügbaren Informationen in der KI-Entwicklung von schlechter Qualität und unstrukturiert sind, verbringen Entwickler-Teams normalerweise über 50 % ihrer Zeit – nicht damit, Modelle zu erstellen – sondern damit, unstrukturierte Daten zu identifizieren, zu ergänzen oder zu bereinigen, und das ist erst der Anfang ihrer Arbeit. Graviti bietet eine expertere Datenverwaltung, um Entwickler zu befreien und ihnen mehr Zeit zu geben, um unstrukturierte Daten zu analysieren und KI-Modelle zu trainieren.
Wir helfen Entwicklern in drei Dimensionen: Datenentdeckung, Dateniteration und Workflow-Automatisierung.
Datenentdeckung:
Graviti bietet eine Daten-Hosting-Funktion, die es einfacher macht, rohe Daten, Annotationen und Metadaten zu organisieren, indem sie das Dataset und die Annotationen-Formate vereinheitlicht. Wenn KI-Entwickler auf verschiedene Datensätze über Graviti zugreifen, müssen sie die Datenformate nicht umwandeln, was die Verwaltung, Abfrage, den Zugriff und andere mit der Annotation verbundenen Operationen vereinfacht. Graviti hilft, die Möglichkeit von nicht übereinstimmenden rohen Daten oder verlorenen Annotationen zu reduzieren. Darüber hinaus kann die Graviti-Plattform Entwicklern helfen, die Qualität von Datensätzen mit einer Datenvisualisierungs-Funktion zu bewerten, was Entwicklern mindestens acht Stunden pro Woche spart.
Dateniteration:
Wenn Entwickler ihre künstliche Intelligenz trainieren, müssen sie Datensätze in verschiedenen Versionen testen, um Ergebnisse zu sehen und Annotationen zu markieren. Die Herausforderung besteht darin, verschiedene Bearbeitungen und Versionen mit den Teammitgliedern zu verfolgen, die am gleichen Projekt arbeiten. Graviti bietet die Lösung, indem es die Zuweisung verschiedener Zugriffsrechte an Mitarbeiter ermöglicht, um ihre Annotationen hochzuladen und den Fortschritt des Projekts zu verfolgen und gleichzeitig zu arbeiten.
Workflow-Automatisierung:
Mit einer Funktion namens “Action” können Ingenieure Workflows automatisieren und wiederkehrende, zeitaufwändige und manuelle Aufgaben reduzieren. Es befreit Entwickler davon, große manuelle Skripte zu schreiben, um diese Workflows zu erreichen, und öffnet Zeit für sie, um die Arbeit zu erledigen, die sie tun müssen.
Warum ist unstrukturierte Daten die Zukunft der KI?
Über 80 % der Unternehmensdaten sind jetzt unstrukturiert, einschließlich Bilder, Aufnahmen, Videos, Social-Media-Beiträge usw. KI ist der Schlüssel, um Werte aus unstrukturierten Daten zu liefern. Unternehmen beginnen, unstrukturierte Daten zu nutzen, um tiefergehende Forschung und weitere Analysen zu unterstützen.
Graviti hat kürzlich OpenBytes gestartet, ein non-profit-Offene-Daten-Projekt, das unter der Linux Foundation gehostet wird. Können Sie OpenBytes speziell erläutern?
Die Mission von OpenBytes ist es, den breiteren Austausch von Daten in der KI-Gemeinschaft durch die Schaffung von Datenstandards, -formaten und -prozessen zu ermöglichen, die die Beiträge von Daten ermöglichen. Der Umfang von OpenBytes umfasst die Kuratierung offener Datensätze, offener Daten-Spezifikationen und die gemeinsame Entwicklung unter offenen Lizenzen, die die Mission unterstützen, einschließlich Dokumentation, Testen, Integration und die Erstellung anderer Artefakte, die die Entwicklung, Bereitstellung, den Betrieb oder die Übernahme des Open-Source-Projekts unterstützen.
OpenBytes kann die Haftungsrisiken der Datenbeiträger reduzieren. Datensatz-Inhaber zögern, ihre Datensätze öffentlich zu teilen, aufgrund mangelnder Kenntnisse über Datenlizenzen. Sobald Datensatz-Beiträger OpenBytes beitreten, werden ihre Daten geschützt und mehr offene Daten werden zugänglich.
Wir generieren auch ein Standard-Datenformat, wenn wir Daten veröffentlichen, teilen und austauschen. Ein einheitliches Format hilft Datenbeiträgern, Datensätze zu verstehen und relevante Daten zu finden, was zu höherwertigen offenen Datensatz-Beiträgen führt.
Was sind einige der Vorteile offener Datensätze?
Sie nutzen Forscher, da Wissenschaftler mehr kostenlose Ressourcen haben, um Modelle zu trainieren und Forschung durchzuführen.
Sie nutzen Unternehmen, die die Datensätze nutzen, um KI-Fähigkeiten aufzubauen und den Übergang von traditionellen Unternehmen zu KI-Unternehmen zu beschleunigen.
Wie authentifiziert Graviti die Qualität der Datensätze?
Sogar beliebte Datensätze wie COCO und KITTI sind nicht perfekt für Entwickler. Fehler treten immer auf, wenn Entwickler Modelle trainieren und niemand hat eine gute Möglichkeit gefunden, die Qualität von Datensätzen zu verbessern. Graviti glaubt, dass ein Datensatz-Bewertungsmodell etabliert wird oder eine andere technische Revolution die Gemeinschaft helfen wird, das Problem zu lösen, und es ist auch Teil der Mission von Graviti, dies in der Zukunft zu erreichen.
Was ist Ihre Vision für die Zukunft, wie Entwickler auf Daten zugreifen?
Für eine kleine Menge an Daten sollten Entwickler in der Lage sein, auf diese Daten leicht zuzugreifen. Für größere Mengen an Daten, wie vielfältigere Datensätze für das Trainieren von Modellen, würde die Technologie des verteilten Lernens helfen, auf kooperative Weise zu arbeiten, indem sie die Fähigkeit, maschinelles Lernen durchzuführen, von der Speicherung von Daten auf einem zentralen Server trennt.
Gibt es noch etwas, das Sie über Graviti teilen möchten?
Graviti entwickelt sich weiter. Wir hören auf die Rückmeldungen von unseren Kunden, einschließlich Start-ups, Unternehmen, einzelnen Entwicklern und Forschern. Wir begrüßen auch jede Art von Kooperations- oder Partnerschaftsmöglichkeit von jedem.
Wir sehen große Chancen in der KI-Entwicklung durch offene Daten in der sehr nahen Zukunft. Wir bauen eine Gemeinschaft für den Austausch und die Beiträge offener Daten auf. Dies wird nicht nur Forschern helfen, die Grenzen der Wissenschaft weiter zu pushen, sondern auch Unternehmen, ihre Modelle zu verfeinern und die Technologie in einer gegenseitig vorteilhaften Umgebung zu entwickeln.
Vielen Dank für das großartige Interview. Leser, die mehr erfahren möchten, sollten Graviti besuchen.












