בדל AIs להתחרות בתחרות למידת מכונה של Minecraft - Unite.AI
צור קשר

בינה מלאכותית

AIs להתחרות בתחרות למידת מכונה של Minecraft

mm
מְעוּדכָּן on

כפי שדווח על ידי טבע, תחרות AI חדשה תתקיים בקרוב, תחרות MineRL, שתעודד מהנדסי בינה מלאכותית ומקודדים ליצור תוכניות המסוגלות ללמוד באמצעות תצפית ודוגמה. מקרה המבחן של מערכות בינה מלאכותיות אלו יהיה משחק הווידאו הפופולרי ביותר ליצירה והישרדות Minecraft.

מערכות בינה מלאכותית ראו כמה הישגים מרשימים לאחרונה בכל הקשור למשחקי וידאו. רק לאחרונה בינה מלאכותית ניצחה את השחקנים האנושיים הטובים בעולם במשחק האסטרטגיה StarCraft II. עם זאת, ל-StarCraft II יש יעדים ניתנים להגדרה שקל יותר לפרק אותם לשלבים קוהרנטיים שבהם AI יכול להשתמש כדי לאמן. משימה קשה הרבה יותר היא עבור AI ללמוד כיצד לנווט במשחק ארגז חול גדול ופתוח כמו Minecraft. חוקרים שואפים לעזור לתוכניות בינה מלאכותית ללמוד באמצעות תצפית ודוגמה, ואם הן יצליחו הן יכולות להפחית באופן משמעותי את כמות כוח העיבוד הדרושה לאימון תוכנית בינה מלאכותית.

למשתתפים בתחרות יהיו ארבעה ימים ליצור בינה מלאכותית שתיבדק עם מיינקראפט, תוך כדי אימון בינה מלאכותית של עד שמונה מיליון צעדים. המטרה של ה-AI היא למצוא יהלום בתוך המשחק על ידי חפירה. שמונה מיליון שלבים של אימון הם פרק זמן קצר בהרבה משך הזמן הדרוש לאימון דגמי AI חזקים בימינו, כך שהמשתתפים בתחרות צריכים להנדס שיטות המשתפרות באופן דרסטי לעומת שיטות האימון הנוכחיות.

הגישות שבהן משתמשים המשתתפים מבוססות על סוג למידה הנקרא חיקוי למידת. למידת חיקוי עומדת בניגוד ללמידת חיזוק, שהיא שיטה פופולרית לאימון מערכות מתוחכמות כמו זרועות רובוטיות במפעלים או AIs המסוגלים לנצח שחקנים אנושיים ב-StarCraft II. החיסרון העיקרי באלגוריתמי למידה חיזוקים הוא העובדה שהם דורשים כוח עיבוד מחשב עצום כדי לאמן, תוך הסתמכות על מאות או אפילו אלפי מחשבים המקושרים יחד כדי ללמוד. לעומת זאת, למידת חיקוי היא שיטת אימון הרבה יותר יעילה ופחות יקרה מבחינה חישובית. אלגוריתמי למידה חיקוי שואפים לחקות איך בני אדם לומדים על ידי תצפית.

וויליאם גאס, מועמד לדוקטורט בתיאוריית למידה עמוקה באוניברסיטת קרנגי מלון, הסביר לטבע שקבלת בינה מלאכותית לחקור וללמוד דפוסים בסביבה היא משימה קשה מאוד, אבל למידת חיקוי מספקת ל-AI קו בסיס של ידע, או טוב. הנחות קודמות, לגבי הסביבה. זה יכול להפוך את האימון של AI למהיר הרבה יותר בהשוואה ללמידת חיזוק.

Minecraft משמש כסביבת אימון שימושית במיוחד מסיבות רבות. אחת הסיבות היא שמיינקראפט מאפשרת לשחקנים להשתמש באבני בניין פשוטות כדי ליצור מבנים ופריטים מורכבים, והשלבים הרבים הדרושים ליצירת מבנים אלו משמשים כסמנים מוחשיים של התקדמות שחוקרים יכולים להשתמש בהם כמדדים. Minecraft הוא גם פופולרי מאוד, ובגלל זה, קל יחסית לאסוף נתוני אימון. מארגני תחרות MineRL גייסו הרבה שחקני Minecraft כדי להדגים מגוון משימות כמו יצירת כלים ובלימה של בלוקים. על ידי מיקור המונים של יצירת הנתונים, החוקרים הצליחו ללכוד 60 מיליון דוגמאות לפעולות שניתן לבצע במשחק. החוקרים נתנו כ-1000 שעות של וידאו לצוותי התחרות.

השתמש בידע שבני אדם בנו, אומר רוהין שאה, Ph.D. מועמד למדעי המחשב באוניברסיטת קליפורניה, ברקלי הסביר ל-Nature שהתחרות הזו היא ככל הנראה הראשונה שתתמקד בשימוש בידע שבני אדם כבר יצרו כדי לזרז את האימון של AI.

גאס והחוקרים האחרים מקווים שלתחרות יכולות להיות תוצאות עם השלכות מעבר למיינקראפט, שיולידו אלגוריתמים טובים יותר של למידה חיקוי ויעוררו אנשים נוספים לשקול למידת חיקוי כצורה קיימא של אימון AI. המחקר עשוי לסייע ביצירת AI בעלי יכולת טובה יותר לקיים אינטראקציה עם אנשים בסביבות מורכבות ומשתנות.