בדל הסיבים של אובר הם מסגרת אימון מודל AI חדשה מבוזרת - Unite.AI
צור קשר

בינה מלאכותית

הסיבים של אובר הם מסגרת אימון חדשה למודל AI מבוזרת

mm
מְעוּדכָּן on

לפי VentureBeat, פרסמו לאחרונה חוקרי בינה מלאכותית ב-Uber נייר לארקסיב מתווה פלטפורמה חדשה שנועדה לסייע ביצירת דגמי AI מבוזרים. הפלטפורמה נקראת סִיב, וניתן להשתמש בו כדי להניע הן משימות למידת חיזוק והן למידה מבוססת אוכלוסיה. Fiber נועד להפוך חישוב מקבילי בקנה מידה גדול לנגיש יותר למי שאינם מומחים, ולאפשר להם לנצל את הכוח של אלגוריתמים ומודלים מבוזרים של AI.

Fiber הפך לאחרונה לקוד פתוח ב-GitHub, והוא תואם ל-Python 3.6 ומעלה, כאשר Kubernetes פועל על מערכת לינוקס ופועל בסביבת ענן. לפי צוות החוקרים, הפלטפורמה מסוגלת להגדיל בקלות עד למאות או אלפי מכונות בודדות.

צוות החוקרים מאובר מסביר שרבים מההתקדמות העדכנית והרלוונטית ביותר בתחום הבינה המלאכותית הונעו על ידי מודלים גדולים יותר ואלגוריתמים נוספים שמאומנים באמצעות טכניקות אימון מבוזרות. עם זאת, יצירת מודלים מבוססי אוכלוסייה ומודלי חיזוק נותרה משימה קשה עבור תכניות הכשרה מבוזרות, מכיוון שלעתים קרובות יש להן בעיות של יעילות וגמישות. Fiber הופך את המערכת המבוזרת לאמינה וגמישה יותר על ידי שילוב של תוכנת ניהול אשכולות עם קנה מידה דינמי ומאפשר למשתמשים להעביר את עבודתם ממכונה אחת למספר גדול של מכונות בצורה חלקה.

סיבים עשויים משלושה רכיבים שונים: API, backend ושכבת אשכול. שכבת ה-API מאפשרת למשתמשים ליצור דברים כמו תורים, מנהלים ותהליכים. השכבה האחורית של Fiber מאפשרת למשתמש ליצור ולסיים עבודות המנוהלות על ידי אשכולות שונים, ושכבת האשכולות מנהלת את האשכולות הבודדים בעצמם יחד עם המשאבים שלהם, שהם במידה רבה מספר הפריטים שעל Fiber לעקוב אחריהם.

Fiber מאפשר תור לעבודות ולהפעיל אותן מרחוק במחשב מקומי אחד או במכונות רבות ושונות, תוך שימוש בקונספט של תהליכים מגובי עבודה. Fiber גם עושה שימוש במכולות כדי להבטיח שדברים כמו נתוני קלט וחבילות תלויות יהיו עצמאיים. מסגרת Fiber אפילו כוללת טיפול בשגיאות מובנה כך שאם עובד קורס ניתן להחיות אותו במהירות. FIber מסוגלת לעשות את כל זה תוך כדי אינטראקציה עם מנהלי אשכולות, ומאפשרת לאפליקציות Fiber לפעול כאילו היו אפליקציות רגילות הפועלות באשכול מחשב נתון.

תוצאות ניסויים הראו שבממוצע זמן התגובה של Fiber היה כמה אלפיות שניות ושהוא גם התרחב טוב יותר מטכניקות AI בסיסיות כאשר נבנה עם 2,048 ליבות מעבדים/עובדים. משך הזמן הנדרש להשלמת עבודות ירד בהדרגה ככל שמספר העובדים שנקבע גדל. IPyParallel השלימה 50 איטרציות של אימון בכ-1400 שניות, בעוד ש-Fiber הצליח להשלים את אותן 50 איטרציות של אימון בכ-50 שניות עם 512 עובדים זמינים.

המחברים השותפים של העיתון Fiber להסביר ש-Fiber מסוגל להשיג מטרות מרובות כמו קנה מידה דינמי של אלגוריתמים ושימוש בנפחים גדולים של כוח מחשוב:

"[העבודה שלנו מראה] ש-Fiber משיג יעדים רבים, כולל מינוף יעיל של כמות גדולה של חומרת מחשוב הטרוגנית, קנה מידה דינמי של אלגוריתמים כדי לשפר את יעילות השימוש במשאבים, הפחתת העומס ההנדסי הנדרש כדי לגרום [למידת חיזוק] ואלגוריתמים מבוססי אוכלוסייה לעבוד על אשכולות מחשבים, והתאמה מהירה לסביבות מחשוב שונות כדי לשפר את יעילות המחקר. אנו מצפים שזה יאפשר התקדמות נוספת בפתרון בעיות קשות [למידת חיזוק] עם אלגוריתמים [למידת חיזוק] ושיטות מבוססות אוכלוסיה על ידי כך שיהיה קל יותר לפתח את השיטות הללו ולאמן אותן בקנה מידה הנחוץ כדי לראות אותן זורחות באמת."