Connect with us

ืžื”ื• ืจืื™ื™ื” ืžืžื•ื—ืฉื‘ืช?

ื‘ื™ื ื” ืžืœืื›ื•ืชื™ืช 101

ืžื”ื• ืจืื™ื™ื” ืžืžื•ื—ืฉื‘ืช?

mm

מהו ראייה ממוחשבת?

אלגוריתמים של ראייה ממוחשבת הם אחד מהמערכות המהפכניות והחזקות ביותר של AI בעולם, ברגע זה. מערכות ראייה ממוחשבת נעשות בשימוש בכלי רכב אוטונומיים, ניווט רובוט, מערכות זיהוי פנים ועוד. אולם, מהו אלגוריתמים של ראייה ממוחשבת בדיוק? כיצד הם עובדים? על מנת לענות על שאלות אלו, נצלול לעומק התאוריה מאחורי ראייה ממוחשבת, אלגוריתמים של ראייה ממוחשבת ויישומים למערכות ראייה ממוחשבת.

כיצד פועלות מערכות ראייה ממוחשבת?

כדי להעריך במלוא המובן כיצד מערכות ראייה ממוחשבת פועלות, בואו נדבר קודם כל על איך בני אדם מזהים אובייקטים. ההסבר הטוב ביותר שיש לנויורופסיכולוגיה לגבי איך אנו מזהים אובייקטים הוא מודל שמתאר את השלב הראשוני של זיהוי אובייקט כאחד שבו הרכיבים הבסיסיים של אובייקטים, כגון צורה, צבע ועומק, מפורשים על ידי המוח תחילה. האותות מהעין שנכנסים למוח נבדקים כדי להוציא את הקצוות של אובייקט תחילה, וקצוות אלו מחוברים יחד לייצוג מורכב יותר שמשלים את צורת האובייקט.

מערכות ראייה ממוחשבת פועלות בצורה דומה מאוד למערכת הוויזואלית האנושית, על ידי זיהוי הקצוות של אובייקט ואיחודם לתוך צורת האובייקט. ההבדל הגדול הוא שכיוון שמחשבים מפרשים תמונות כמספרים, מערכת ראייה ממוחשבת זקוקה לדרך כלשהי לפרש את הפיקסלים היחידים שמרכיבים את התמונה. מערכת הראייה הממוחשבת תקצה ערכים לפיקסלים בתמונה, ובאמצעות בדיקת ההבדלים בערכים בין אזור אחד של פיקסלים לאזור אחר של פיקסלים, המחשב יכול לזהות קצוות. למשל, אם התמונה בשאלה היא בגווני אפור, אז הערכים ייערכו משחור (המיוצג על ידי 0) ללבן (המיוצג על ידי 255). שינוי פתאומי בטווח הערכים של פיקסלים ליד אחד האחר יצביע על קצוות.

עיקרון בסיסי זה של השוואת ערכי פיקסלים יכול גם להיעשות עם תמונות צבעוניות, עם המחשב שמשווה הבדלים בין ערוצי צבע RGB השונים. כעת שאנו יודעים כיצד מערכת ראייה ממוחשבת בוחנת ערכי פיקסלים כדי לפרש תמונה, בואו נביט בארכיטקטורה של מערכת ראייה ממוחשבת.

רשתות נוירונים מרוכבות (CNNs)

סוג ה-AI הראשי המשמש במשימות ראייה ממוחשבת הוא מבוסס על רשתות נוירונים מרוכבות. מהו קונבולוציה בדיוק?

קונבולוציות הן תהליכים מתמטיים שהרשת משתמשת בהם כדי לקבוע את ההבדלים בערכים בין פיקסלים. אם אתה מדמיין רשת של ערכי פיקסל, תמונה רשת קטנה יותר הנעה על גבי הרשת הראשית. הערכים מתחת לרשת השנייה נבדקים על ידי הרשת, כך שהרשת בודקת רק חלק קטן מהפיקסלים בכל פעם. זה נקרא לעיתים קרובות “טכניקת החלונות המחליקים”. הערכים הנבדקים על ידי החלון המחליק מסוכמים על ידי הרשת, מה שעוזר להפחית את המורכבות של התמונה ולהקל על הרשת להוציא דפוסים.

רשתות נוירונים מרוכבות מחולקות לשני חלקים שונים, החלק המרוכב והחלק המחובר לחלוטין. שכבות הקונבולוציה של הרשת הן מחלצי התכונות, שתפקידן לנתח את הפיקסלים בתוך התמונה וליצור ייצוגים שלהם ששכבות הרשת המחוברות לחלוטין יכולות ללמוד מהם. שכבות הקונבולוציה מתחילות בכך שהן בוחנות את הפיקסלים ומוציאות את התכונות הבסיסיות של התמונה כגון קצוות. שכבות קונבולוציה מאוחרות יותר מחברות את הקצוות לתוך צורות מורכבות יותר. בסוף, הרשת תהיה בעלת ייצוג של הקצוות והפרטים של התמונה שהיא יכולה להעביר לשכבות המחוברות לחלוטין.

סימון תמונה

בעוד שרשת נוירונים מרוכבת יכולה להוציא דפוסים מתמונות בעצמה, דיוקה של מערכת הראייה הממוחשבת יכול להשתפר באופן משמעותי על ידי סימון התמונות. סימון תמונה הוא התהליך של הוספת מטא-נתונים לתמונה שעוזרת למסווג לזהות אובייקטים חשובים בתמונה. השימוש בסימון תמונה הוא חשוב בכל מקרה שבו מערכות ראייה ממוחשבת צריכות להיות מדויקות מאוד, כגון כאשר מערכות אלו משלטות על כלי רכב אוטונומי או רובוט.

ישנם דרכים שונות לסמן תמונות כדי לשפר את הביצועים של מסווג ראייה ממוחשבת. סימון תמונה מבוצע לרוב עם קופסאות מגבילות, קופסה שמקיפה את הקצוות של האובייקט המטרה ואומרת למחשב להתמקד בתוך הקופסה. סימון סמנטי הוא סוג אחר של סימון תמונה, שפועל על ידי הקצאת מחלקה של תמונה לכל פיקסל בתמונה. במילים אחרות, כל פיקסל שיכול להיחשב “דשא” או “עצים” יסומן כשייך למחלקות אלו. הטכניקה מספקת דיוק ברמת הפיקסל, אך יצירת סימון סמנטי היא מורכבת וצורבת יותר מאשר יצירת קופסאות מגבילות פשוטות. קיימים גם שיטות סימון אחרות, כגון קווים ונקודות.

ื‘ืœื•ื’ืจ ื•ืžืชื›ื ืช ืขื ื”ืชืžื—ื•ื™ื•ืช ื‘ื ื•ืฉืื™ื Machine Learning ื• Deep Learning. ื“ื ื™ืืœ ืžืงื•ื•ื” ืœืขื–ื•ืจ ืœืื—ืจื™ื ืœื”ืฉืชืžืฉ ื‘ื›ื•ื— ืฉืœ AI ืœื˜ื•ื‘ืช ื”ื—ื‘ืจื”.