בדל מהן רשתות עצביות? - Unite.AI
צור קשר
כיתת אמן בינה מלאכותית:

AI 101

מהן רשתות עצביות?

mm
מְעוּדכָּן on

מהן רשתות עצביות מלאכותיות (ANNs)?

רבות מההתקדמות הגדולות ביותר ב-AI הן מונע על ידי רשתות עצביות מלאכותיות. רשתות עצביות מלאכותיות (ANNs) הן חיבור של פונקציות מתמטיות המחוברות זו לזו בפורמט בהשראת הרשתות העצביות המצויות במוח האנושי. ANNs אלה מסוגלים לחלץ דפוסים מורכבים מנתונים, להחיל דפוסים אלה על נתונים בלתי נראים כדי לסווג/ לזהות את הנתונים. בדרך זו, המכונה "לומדת". זו סקירה מהירה של רשתות עצביות, אבל בואו נסתכל מקרוב על רשתות עצביות כדי להבין טוב יותר מה הן וכיצד הן פועלות.

פרצפטרון רב שכבתי מוסבר

לפני שנסתכל על רשתות עצביות מורכבות יותר, אנחנו הולכים להסתכל רגע על גרסה פשוטה של ​​ANN, Perceptron רב שכבתי (MLP).

דמיינו פס ייצור במפעל. בפס הייצור הזה, עובד אחד מקבל פריט, מבצע בו כמה התאמות, ואז מעביר אותו לעובד הבא בתור שעושה את אותו הדבר. תהליך זה נמשך עד שאחרון העובד בתור שם את הגימור על הפריט ומרכיב אותו על חגורה שתוציא אותו מהמפעל. באנלוגיה זו, ישנן מספר "שכבות" לפס הייצור, ומוצרים נעים בין שכבות כאשר הם עוברים מעובד לעובד. לפס הייצור יש גם נקודת כניסה ונקודת יציאה.

ניתן להתייחס ל- Multi-Layer Perceptron כעל קו ייצור פשוט מאוד, העשוי משלוש שכבות בסך הכל: שכבת קלט, שכבה נסתרת ושכבת פלט. שכבת הקלט היא המקום שבו הנתונים מוזנים לתוך ה-MLP, ובשכבה הנסתרת מספר "עובדים" מטפלים בנתונים לפני שהם מעבירים אותם לשכבת הפלט שנותנת את המוצר לעולם החיצון. במקרה של MLP, עובדים אלה נקראים "נוירונים" (או לפעמים צמתים) וכאשר הם מטפלים בנתונים הם מבצעים מניפולציות בהם באמצעות סדרה של פונקציות מתמטיות.

בתוך הרשת, ישנם מבנים המחברים בין צומת לצומת הנקראים "משקולות". משקולות הן הנחה לגבי הקשר בין נקודות הנתונים כשהן נעות ברשת. במילים אחרות, משקלים משקפים את רמת ההשפעה שיש לנוירון אחד על נוירון אחר. המשקולות עוברות דרך "פונקציית הפעלה" כשהן יוצאות מהצומת הנוכחי, שהיא סוג של פונקציה מתמטית שהופכת את הנתונים. הם הופכים נתונים ליניאריים לייצוגים לא ליניאריים, מה שמאפשר לרשת לנתח דפוסים מורכבים.

האנלוגיה למוח האנושי המשתמעת מ"רשת עצבים מלאכותית" נובעת מהעובדה שהנוירונים המרכיבים את המוח האנושי מחוברים יחדיו באופן דומה לאופן שבו צמתים ב-ANN מקושרים.

בעוד שתפסים רב-שכבתיים קיימים מאז שנות ה-1940, היו מספר מגבלות שמנעו מהם להיות שימושיים במיוחד. עם זאת, במהלך העשורים האחרונים, טכניקה שנקראת "התפלגות גב" נוצר שאיפשר לרשתות להתאים את משקלם של הנוירונים ובכך ללמוד בצורה יעילה הרבה יותר. התפשטות לאחור משנה את המשקולות ברשת העצבית, ומאפשרת לרשת ללכוד טוב יותר את הדפוסים האמיתיים בתוך הנתונים.

רשתות עצביות עמוקות

רשתות עצביות עמוקות לוקחות את הצורה הבסיסית של MLP והופכות אותה לגדולה יותר על ידי הוספת שכבות נסתרות יותר באמצע המודל. אז במקום שתהיה שכבת קלט, שכבה נסתרת ושכבת פלט, יש הרבה שכבות נסתרות באמצע והפלטים של שכבה נסתרת אחת הופכות לכניסות לשכבה הנסתרת הבאה עד שהנתונים מגיעים עד הסוף. דרך הרשת והוחזרו.

השכבות הנסתרות המרובות של רשת עצבית עמוקה מסוגלות לפרש דפוסים מורכבים יותר מאשר התפיסה הרב-שכבתית המסורתית. שכבות שונות של הרשת העצבית העמוקה לומדים את הדפוסים של חלקים שונים של הנתונים. לדוגמה, אם נתוני הקלט מורכבים מתמונות, החלק הראשון של הרשת עשוי לפרש את הבהירות או הכהות של פיקסלים בעוד השכבות המאוחרות יותר יבחרו צורות וקצוות שניתן להשתמש בהם כדי לזהות אובייקטים בתמונה.

סוגים שונים של רשתות עצביות

ישנם סוגים שונים של רשתות עצביות, ולכל אחד מסוגי הרשתות העצביות השונות יש יתרונות וחסרונות משלו (ולכן מקרי שימוש משלו). הסוג של רשת עצבים עמוקה שתואר לעיל הוא הסוג הנפוץ ביותר של רשת עצבים, ולעתים קרובות מתייחסים אליו כרשת עצבית הזנה קדימה.

וריאציה אחת על רשתות עצביות היא ה-Recurrent Neural Network (RNN). במקרה של רשתות עצביות חוזרות, מנגנוני לולאה משמשים כדי להחזיק מידע ממצבי ניתוח קודמים, כלומר הם יכולים לפרש נתונים היכן שהסדר חשוב. RNNs שימושיים בגזירת דפוסים מנתונים עוקבים/כרונולוגיים. רשתות עצביות חוזרות יכולות להיות חד-כיווניות או דו-כיווניות. במקרה של רשת עצבית דו-כיוונית, הרשת יכולה לקחת מידע ממאוחר יותר ברצף כמו גם מחלקים מוקדמים יותר של הרצף. מכיוון שה-RNN הדו-כיווני לוקח בחשבון יותר מידע, הוא מסוגל לצייר את הדפוסים הנכונים מהנתונים.

רשת עצבית Convolutional היא סוג מיוחד של רשת עצבית המיומנת בפירוש הדפוסים המצויים בתמונות. CNN פועל על ידי העברת מסנן על פיקסלים של התמונה והשגת ייצוג מספרי של הפיקסלים בתוך התמונה, שאותם הוא יכול לנתח אחר דפוסים. CNN בנוי כך שהשכבות הקונבולוציוניות שמושכות את הפיקסלים מהתמונה מגיעות קודם, ואז מגיעות שכבות ההזנה קדימה המחוברות בצפיפות, אלו שלמעשה ילמדו לזהות אובייקטים, באות אחרי זה.

בלוגר ומתכנת עם התמחות ב למידת מכונה ו למידה עמוקה נושאים. דניאל מקווה לעזור לאחרים להשתמש בכוח של AI למען טוב חברתי.