בינה מלאכותית

כיצד הראייה ההיקפית של AI יכולה לשפר את הטכנולוגיה והבטיחות

מְעוּדכָּן on במרץ 18, 2024

ראייה היקפית, היבט שלעתים קרובות מתעלמים ממנו בראייה אנושית, ממלאת תפקיד מרכזי באופן שבו אנו מתקשרים עם הסביבה שלנו ומבינים אותה. היא מאפשרת לנו לזהות ולזהות צורות, תנועות ורמזים חשובים שאינם בקו הראייה הישיר שלנו, ובכך להרחיב את שדה הראייה שלנו מעבר לאזור המרכזי הממוקד. יכולת זו חיונית למשימות יומיומיות, החל מניווט ברחובות סואנים ועד תגובה לתנועות פתאומיות בספורט.

במכון הטכנולוגי של מסצ'וסטס (MIT), חוקרים מתעמקים בתחום הבינה המלאכותית עם גישה חדשנית, במטרה להעניק למודלים של AI צורה מדומה של ראייה היקפית. עבודתם פורצת הדרך מבקשת לגשר על פער משמעותי ביכולות הבינה המלאכותית הנוכחיות, שבניגוד לבני אדם, חסרות הסגל לתפיסה היקפית. מגבלה זו במודלים של AI מגבילה את הפוטנציאל שלהם בתרחישים שבהם זיהוי היקפי חיוני, כמו במערכות נהיגה אוטונומיות או בסביבות מורכבות ודינמיות.

הבנת ראייה היקפית ב-AI

ראייה היקפית בבני אדם מאופיינת ביכולת שלנו לתפוס ולפרש מידע בפאתי המיקוד החזותי הישיר שלנו. בעוד שראייה זו פחות מפורטת מהראייה המרכזית, היא רגישה מאוד לתנועה וממלאת תפקיד קריטי בהתרעתנו על סכנות והזדמנויות פוטנציאליות בסביבה שלנו.

לעומת זאת, דגמי AI נאבקו באופן מסורתי עם היבט זה של חזון. מערכות ראייה ממוחשבת נועדו בעיקר לעבד ולנתח תמונות שנמצאות ישירות בשדה הראייה שלהן, בדומה לראייה מרכזית בבני אדם. זה משאיר נקודה עיוורת משמעותית בתפיסת AI, במיוחד במצבים שבהם מידע היקפי הוא קריטי לקבלת החלטות מושכלות או תגובה לשינויים בלתי צפויים בסביבה.

המחקר שנערך על ידי MIT מתייחס לפער המכריע הזה. על ידי שילוב צורה של ראייה היקפית במודלים של AI, הצוות שואף ליצור מערכות שלא רק רואות אלא גם מפרשנות את העולם בצורה דומה יותר לראייה אנושית. התקדמות זו טומנת בחובה את הפוטנציאל לשפר יישומי בינה מלאכותית בתחומים שונים, מבטיחות רכב ועד רובוטיקה, ועשויה אפילו לתרום להבנתנו את העיבוד החזותי האנושי.

גישת MIT

כדי להשיג זאת, הם שדמיינו מחדש את האופן שבו תמונות מעובדות ונתפסות על ידי AI, וקירבו אותה לחוויה האנושית. מרכזי בגישתם הוא השימוש במודל ריצוף מרקם שונה. שיטות מסורתיות מסתמכות לרוב על טשטוש קצוות של תמונות כדי לחקות ראייה היקפית. עם זאת, חוקרי ה-MIT זיהו כי שיטה זו נופלת בייצוג מדויק של אובדן המידע המורכב המתרחש בראייה היקפית של האדם.

כדי להתמודד עם זה, הם חידדו את מודל ריצוף הטקסטורה, טכניקה שנועדה בתחילה לחקות את הראייה ההיקפית האנושית. מודל שונה זה מאפשר טרנספורמציה ניואנסית יותר של תמונות, לוכד את ההדרגתיות של אובדן הפרטים המתרחשת כאשר מבטו נע מהמרכז אל הפריפריה.

חלק מהותי מהמאמץ הזה היה יצירת מערך נתונים מקיף, שתוכנן במיוחד כדי לאמן מודלים של למידת מכונה בזיהוי ופרשנות של מידע חזותי היקפי. מערך נתונים זה מורכב ממגוון רחב של תמונות, שכל אחת מהן עברה טרנספורמציה קפדנית כדי להציג רמות שונות של נאמנות חזותית היקפית. על ידי אימון מודלים של AI עם מערך נתונים זה, החוקרים שאפו להטמיע בהם תפיסה מציאותית יותר של תמונות היקפיות, בדומה לעיבוד חזותי אנושי.

ממצאים והשלכות

לאחר אימון מודלים של AI עם מערך נתונים חדש זה, צוות MIT החל בהשוואה מדוקדקת של ביצועי המודלים הללו מול יכולות אנושיות במשימות זיהוי אובייקטים. התוצאות היו מאירות. בעוד שדגמי בינה מלאכותית הוכיחו יכולת משופרת לזהות ולזהות עצמים בפריפריה, הביצועים שלהם עדיין לא היו בקנה אחד עם היכולות האנושיות.

אחד הממצאים הבולטים ביותר היה דפוסי הביצועים המובהקים והמגבלות המובנות של AI בהקשר זה. בניגוד לבני אדם, גודלם של עצמים או כמות העומס החזותי לא השפיעו באופן משמעותי על הביצועים של דגמי הבינה המלאכותית, מה שמצביע על הבדל מהותי באופן שבו AI ובני אדם מעבדים מידע חזותי היקפי.

לממצאים אלו יש השלכות עמוקות על יישומים שונים. בתחום הבטיחות ברכב, מערכות בינה מלאכותית עם ראייה היקפית משופרת יכולות להפחית באופן משמעותי תאונות על ידי זיהוי סכנות פוטנציאליות הנופלות מחוץ לקו הראייה הישיר של נהגים או חיישנים. טכנולוגיה זו יכולה גם למלא תפקיד מרכזי בהבנת ההתנהגות האנושית, במיוחד באופן שבו אנו מעבדים ומגיבים לגירויים חזותיים בפריפריה שלנו.

בנוסף, התקדמות זו טומנת בחובה הבטחה לשיפור ממשקי המשתמש. על ידי הבנת האופן שבו AI מעבד ראייה היקפית, מעצבים ומהנדסים יכולים לפתח ממשקים אינטואיטיביים ומגיבים יותר המתואמים טוב יותר עם הראייה האנושית הטבעית, ובכך ליצור מערכות ידידותיות ויעילות יותר למשתמש.

למעשה, עבודתם של חוקרי MIT לא רק מסמנת צעד משמעותי באבולוציה של ראיית AI אלא גם פותחת אופקים חדשים לשיפור הבטיחות, הבנת הקוגניציה האנושית ושיפור האינטראקציה של המשתמשים עם הטכנולוגיה.

על ידי גישור על הפער בין תפיסת האדם למכונה, מחקר זה פותח שפע של אפשרויות בקידום טכנולוגי ושיפורי בטיחות. ההשלכות של מחקר זה מתרחבות לתחומים רבים, ומבטיחים עתיד שבו בינה מלאכותית לא רק יכולה לראות יותר כמונו אלא גם להבין ולקיים אינטראקציה עם העולם בצורה יותר ניואנסית ומתוחכמת.

נושאים קשורים:ראייה ממוחשבת

אבולוציה שקטה בבינה מלאכותית: עלייתן של מערכות בינה מלאכותית מורכבות מעבר לדגמי בינה מלאכותית מסורתית

לא לפספס

הדור הבא של AI זעיר: מחשוב קוונטי, שבבים נוירומורפיים ומעבר לכך

אלכס מקפרלנד

אלכס מקפרלנד הוא עיתונאי וסופר בינה מלאכותית הבוחן את ההתפתחויות האחרונות בתחום הבינה המלאכותית. הוא שיתף פעולה עם סטארט-אפים ופרסומים רבים של AI ברחבי העולם.