בדל חוקרים מחפשים מדעני מוח כדי להתגבר על הטיית מערכי נתונים - Unite.AI
צור קשר

אֶתִיקָה

חוקרים מחפשים מדעני מוח כדי להתגבר על הטיית מערכי נתונים

יצא לאור

 on

צוות חוקרים מ-MIT, אוניברסיטת הרווארד ו-Fujitsu, Ltd. חיפש כיצד מודל למידת מכונה יכול להתגבר על הטיית מערך הנתונים. הם הסתמכו על גישה של מדעי המוח כדי לחקור כיצד נתוני אימון משפיעים על האם רשת עצבית מלאכותית יכולה ללמוד לזהות אובייקטים שמעולם לא ראתה. 

המחקר פורסם ב- מחשב המודיעין

גיוון בנתוני אימון

תוצאות המחקר הוכיחו שגיוון בנתוני אימון משפיע על האם רשת עצבית מסוגלת להתגבר על הטיה. עם זאת, לגיוון הנתונים יכול להיות גם השפעה שלילית על ביצועי הרשת. החוקרים גם הראו שהאופן שבו רשת עצבית מאומנת יכולה גם להשפיע על האם היא יכולה להתגבר על מערך נתונים מוטה. 

Xavier Boix הוא מדען מחקר במחלקה למדעי המוח והקוגניציה (BCS) ובמרכז למוחות, מוחות ומכונות (CBMM). הוא גם מחבר בכיר של העיתון. 

"רשת עצבית יכולה להתגבר על הטיית מערך הנתונים, וזה מעודד. אבל הנקודה העיקרית כאן היא שאנחנו צריכים לקחת בחשבון את גיוון הנתונים. אנחנו צריכים להפסיק לחשוב שאם רק תאסוף המון נתונים גולמיים, זה יוביל אותך לאנשהו. אנחנו צריכים להיות זהירים מאוד לגבי האופן שבו אנחנו מעצבים מערכי נתונים מלכתחילה", אומר Boix.

הצוות אימץ את מוחו של מדען מוח כדי לפתח את הגישה החדשה. לפי Boix, מקובל להשתמש במערכי נתונים מבוקרים בניסויים, ולכן הצוות בנה מערכי נתונים שהכילו תמונות של אובייקטים שונים בתנוחות שונות. לאחר מכן הם שלטו בשילובים כך שכמה מערכי נתונים היו מגוונים יותר מאחרים. מערך נתונים עם יותר תמונות המציגות אובייקטים מנקודת מבט אחת בלבד הוא מגוון פחות, בעוד אחד עם יותר תמונות המציג אובייקטים מנקודות מבט מרובות הוא מגוון יותר. 

החוקרים לקחו מערכי נתונים אלה והשתמשו בהם כדי לאמן רשת עצבית לסיווג תמונות. לאחר מכן הם למדו עד כמה היא טובה בזיהוי עצמים מנקודות מבט שהרשת לא ראתה במהלך האימון. 

הם מצאו כי מערכי הנתונים המגוונים יותר מאפשרים לרשת להכליל טוב יותר תמונות או נקודות מבט חדשות, וזה חיוני כדי להתגבר על הטיה. 

"אבל זה לא שמגוון נתונים הוא תמיד טוב יותר; יש כאן מתח. כאשר הרשת העצבית תשתפר בזיהוי דברים חדשים שהיא לא ראתה, אז יהיה לה קשה יותר לזהות דברים שהיא כבר ראתה", אומר בויקס.

שיטות לאימון רשתות עצביות

הצוות גם מצא שמודל שהוכשר בנפרד עבור כל משימה מסוגל להתגבר טוב יותר על הטיה בהשוואה למודל שהוכשר לשתי המשימות יחד. 

"התוצאות היו ממש מדהימות. למעשה, בפעם הראשונה שעשינו את הניסוי הזה, חשבנו שזה באג. לקח לנו כמה שבועות להבין שזו הייתה תוצאה אמיתית כי זה היה כל כך לא צפוי", ממשיך בויקס.

ניתוח מעמיק יותר גילה שהתמחות נוירונים מעורבת בתהליך זה. כאשר הרשת העצבית מאומנת לזהות עצמים בתמונות, צצים שני סוגים של נוירונים. נוירון אחד מתמחה בזיהוי קטגוריית האובייקט ואילו השני מתמחה בזיהוי נקודת המבט. 

הנוירונים המיוחדים הופכים בולטים יותר כאשר הרשת מאומנת לבצע משימות בנפרד. עם זאת, כאשר רשת מאומנת להשלים את שתי המשימות בו-זמנית, חלק מהנוירונים מדללים. זה אומר שהם לא מתמחים במשימה אחת, ויש סיכוי גבוה יותר שהם יתבלבלו. 

"אבל השאלה הבאה עכשיו היא, איך הנוירונים האלה הגיעו לשם? אתה מאמן את הרשת העצבית והם יוצאים מתהליך הלמידה. אף אחד לא אמר לרשת לכלול את סוגי הנוירונים האלה בארכיטקטורה שלה. זה הדבר המרתק", אומר בויקס.

החוקרים ינסו לחקור שאלה זו בעבודתם העתידית, כמו גם ליישם את הגישה החדשה למשימות מורכבות יותר. 

אלכס מקפרלנד הוא עיתונאי וסופר בינה מלאכותית הבוחן את ההתפתחויות האחרונות בתחום הבינה המלאכותית. הוא שיתף פעולה עם סטארט-אפים ופרסומים רבים של AI ברחבי העולם.