בדל Edward Cui, מייסד ומנכ"ל Graviti - סדרת ראיונות - Unite.AI
צור קשר

ראיונות

אדוארד קוי, מייסד ומנכ"ל Graviti - סדרת ראיונות

mm
מְעוּדכָּן on

אדוארד קוי הוא המייסד והמנכ"ל של גרביטי, חברה הבונה את פלטפורמת הנתונים מהדור הבא שתשנה מהותית את אופן האינטראקציה של מפתחים עם נתונים לא מובנים. עם Graviti, מפתחי בינה מלאכותית יכולים לרכוש, לאחסן ולעבד נתונים במהירות ובקלות רבה יותר - הבסיס הדרוש למינוף בינה מלאכותית כדי להעצים את כל התעשיות.

התחלת את לימודיך לתואר ראשון כמהנדס מכונות, מה גרם למעבר למדעי המחשב ובינה מלאכותית?

למעשה למדתי הנדסת מכונות כתואר ראשון בשנת 2012. למדתי שיעור על למידת מכונה באוניברסיטת פנסילבניה, שהיה מדהים, וידעתי שזה העתיד ומה אני רוצה לעשות עבור הקריירה שלי. אחרי השיעור הזה עברתי למדעי המחשב.

לאחר סיום הלימודים, ערכתי מחקר על למידת תגבור באוניברסיטת פנסילבניה. בשנת 2015, הבוס שלי לשעבר, ג'ף סניידר, הצטרף לאובר והזמין אותי להצטרף ל- Uber ATG. זו תחילת הקריירה שלי בתעשיית הרכב בנהיגה עצמית.

האם תוכל לשתף את סיפור הבראשית מאחורי Graviti?

העבודה ב-Uber הייתה מאוד מסובכת בהתחלה כי אנשים לא השתמשו במודלים גדולים של למידת מכונה וחסר לנו כוח מחשוב ופלטפורמת ניהול נתונים להכשרת מודלים. הנתונים שאספנו עבור מכוניות בנהיגה עצמית היו כולם לא מובנים. לדוגמה, הם היו תמונות, סרטונים, נקודות LIDAR. כל הסוג הזה של נתונים מחיישנים מהעולם האמיתי ואספנו טונות של נתונים לא מובנים כל יום. עשינו סטטיסטיקה שבה הוא אמר לנו שכמות הנתונים שאספנו בחטיבת מכוניות בנהיגה עצמית במשך שבוע שווה לנתונים שאנו אוספים עבור כל עסקי המסעדות ברחבי העולם במשך השנה כולה. טונות של נתונים לא מובנים הצטברו עבור כל יום ויום וזה יצר בעיות גדולות לגבי איך לאחסן את הנתונים האלה, איך לנהל את הנתונים האלה ואיך להשתמש בנתונים האלה כדי ליצור ערכים עבור ארגונים שונים.

לאחר שלוש שנים שעבדתי ב-Uber, ראיתי את ההזדמנות לשפר כיצד ניתן לנהל נתונים לא מובנים בקנה מידה גדול. אז הקמתי את Graviti בשנת 2019 כדי להאיץ את החידושים ב-AI על ידי בניית פלטפורמת ניהול הנתונים הלא מובנית.

האם אתה יכול לדון כיצד Graviti היא פלטפורמה לניהול ומבנה נתונים בקנה מידה?

Graviti שואפת להשיק את פלטפורמת הנתונים הראשונה המאפשרת לארגונים לעבוד עם כמויות גדולות של נתונים לא מובנים כדי להפעיל יישומי AI חדשניים. פלטפורמה זו מבטלת את הטרחה ומסייעת למפתחים לנהל כמויות גדולות של נתונים לא מובנים עם הצוות.

בעוד שהרוב המכריע של המידע הזמין בפיתוח בינה מלאכותית הוא באיכות נמוכה ובלתי מובנית, צוותי פיתוח בדרך כלל מקדישים למעלה מ-50% מזמנם - לא בבניית מודלים - אלא בזיהוי, הגדלה או ניקוי נתונים לא מובנים, וזו רק ההתחלה של העבודה שלהם. Graviti מציעה דרך ניהול נתונים מומחית יותר לשחרר מפתחים ונותנת להם יותר זמן לנתח נתונים לא מובנים ולהכשיר מודלים של בינה מלאכותית.

אנו עוזרים למפתחים בשלושה מימדים: גילוי נתונים, איטרציה של נתונים ואוטומציה של זרימת עבודה.

גילוי נתונים:

Graviti מציעה תכונת אירוח נתונים שהופכת את ארגון הנתונים הגולמיים, ההערות והמטא נתונים להרבה יותר קל על ידי איחוד מערך הנתונים והפורמטים של ההערות. כאשר מפתחי בינה מלאכותית ניגשים למערכי נתונים שונים דרך Graviti, הם לא צריכים להמיר את פורמטי הנתונים, מה שמפשט את הניהול, השאילתה, הגישה ופעולות אחרות הכרוכות בהערה. Graviti עוזר להפחית את ההזדמנות של נתונים גולמיים לא תואמים או אובדן הערות. יתר על כן, פלטפורמת Graviti יכולה לעזור למפתחים להעריך את איכות מערכי הנתונים עם תכונת הדמיית נתונים, אשר חוסכת לפחות שמונה שעות שבועיות למפתחים.

איטרציה של נתונים:

כאשר מפתחים מאמנים את הבינה המלאכותית שלהם, הם צריכים לבדוק עם מערכי נתונים בגרסאות שונות כדי לראות תוצאות ולסמן את ההערות. האתגר הוא מעקב אחר עריכות וגרסאות שונות עם חברי הצוות שעובדים על אותו פרויקט. Graviti מציעה את הפתרון בכך שהיא מאפשרת הקצאת רמות שונות של זכויות גישה לעובדים כדי לאפשר להם להעלות את ההערות שלהם כדי לעקוב אחר התקדמות הפרויקט ולעבוד בו זמנית.

אוטומציה של זרימת עבודה:

עם תכונה הנקראת "Action", מהנדסים יכולים להפוך זרימות עבודה לאוטומטיות ולהפחית מטלות חוזרות, גוזלות זמן וידניות. זה משחרר מפתחים מכתיבת סקריפטים ידניים גדולים כדי להשיג זרימות עבודה אלו, ופותח להם זמן להגיע לעבודה שהם צריכים לעשות.

מדוע נתונים לא מובנים הם העתיד של AI?

למעלה מ-80% מהנתונים הארגוניים אינם מובנים כעת, כולל תמונות, הקלטות, סרטונים, פוסטים במדיה חברתית וכו'. AI הוא המפתח לאספקת ערכים מנתונים לא מובנים. ארגונים מתחילים למנף נתונים לא מובנים כדי לתמוך במחקר מעמיק ובניתוח נוסף.

Graviti השיקה לאחרונה את OpenBytes, פרויקט נתונים פתוח ללא מטרות רווח המתארח תחת קרן לינוקס. האם תוכל לדון במה זה OpenBytes ספציפית?

המשימה של OpenBytes היא להקל על שיתוף רחב יותר של נתונים בקהילת AI באמצעות יצירת תקני נתונים, פורמטים ותהליכים המאפשרים תרומות של נתונים. ההיקף של OpenBytes כולל איצור של מערכי נתונים פתוחים, מפרטי נתונים פתוחים ופיתוח שיתופי תחת רישיונות פתוחים התומכים במשימה, כולל תיעוד, בדיקות, אינטגרציה ויצירת חפצים אחרים המסייעים בפיתוח, פריסה, תפעול או אימוץ של ה-Open- פרויקט מקור.

OpenBytes יכול להפחית את סיכוני החבות של תורמי נתונים. בעלי מערכי נתונים אינם ששים לשתף את מערכי הנתונים שלהם בפומבי עקב חוסר ידע ברישיונות נתונים. ברגע שתורמי מערך הנתונים יצטרפו ל-OpenBytes, הנתונים שלהם יהיו מוגנים, ונתונים פתוחים נוספים יהפכו לנגישים.

אנו גם מייצרים פורמט מערך נתונים סטנדרטי בעת פרסום, שיתוף והחלפת נתונים. פורמט מאוחד יעזור לתורמי נתונים להבין מערכי נתונים ולמצוא נתונים רלוונטיים שהם צריכים, מה שיוביל לתרומות של מערכי נתונים פתוחים באיכות גבוהה יותר.

מהם כמה מהיתרונות של מערכי נתונים בקוד פתוח?

הם מועילים לחוקרים מכיוון שלמדענים יש יותר משאבים פנויים לשימוש כדי להכשיר מודלים ולהשלים מחקר.

הם נהנים מארגונים, המשתמשים במערך הנתונים כדי להתחיל לבנות יכולות בינה מלאכותית ולהעצים את המעבר מארגונים מסורתיים לארגוני בינה מלאכותית.

כיצד Graviti מאמת את איכות מערכי הנתונים?

אפילו מערכי נתונים פופולריים כגון COCO ו-KITTI אינם מושלמים עבור מפתחים. באגים תמיד מתרחשים כאשר מפתחים מאמנים מודלים ואף אחד לא מצא דרך מצוינת לשפר את איכויות הנתונים. Graviti מאמינה שמודל הערכת נתונים יוקם או מהפכה טכנית אחרת תעזור לקהילה לפתור את הבעיה, וזה גם חלק מהמשימה של Graviti להשיג בעתיד.

מה החזון שלך לעתיד לגבי האופן שבו מפתחים ניגשים לנתונים בעתיד?

עבור כמות קטנה של נתונים, מפתחים צריכים להיות מסוגלים לגשת לנתונים אלה בקלות. עבור כמויות גדולות יותר של נתונים, כמו מערכי נתונים מגוונים יותר עבור מודלים של אימון, טכנולוגיית למידה מאוחדת תעזור לעבוד בדרכים שיתופיות על ידי ניתוק היכולת לבצע למידת מכונה מאחסון הנתונים בשרת מרכזי.

האם יש משהו נוסף שתרצה לחלוק על Graviti?

Graviti גם מתפתח. אנו מקשיבים למשוב מהלקוחות שלנו, כולל סטארט-אפים, ארגונים, מפתחים בודדים וחוקרים. אנו גם מברכים על כל הזדמנויות לשיתוף פעולה או שותפות מכולם.

אנו רואים הזדמנויות גדולות בפיתוח AI מנתונים פתוחים בעתיד הקרוב מאוד. אנו בונים קהילה לשיתוף ותרומה של נתונים פתוחים. זה יועיל לא רק לחוקרים לדחוף את גבולות המדע הלאה, אלא גם לעסקים לחדד את המודלים שלהם ולפתח טכנולוגיה בסביבה מועילה הדדית.

תודה על הראיון הנהדר, קוראים שרוצים ללמוד עוד צריכים לבקר גרביטי.

שותף מייסד של unite.AI וחבר ב- המועצה הטכנולוגית של פורבס, אנטואן הוא א עתידן שהוא נלהב מהעתיד של AI ורובוטיקה.

הוא גם המייסד של Securities.io, אתר אינטרנט המתמקד בהשקעה בטכנולוגיה משבשת.