בדל האם למידת מכונה מסורתית עדיין רלוונטית? - Unite.AI
צור קשר

בינה מלאכותית

האם למידת מכונה מסורתית עדיין רלוונטית?

mm

יצא לאור

 on

האם למידת מכונה מסורתית עדיין רלוונטית?

בשנים האחרונות, AI Generative הראה תוצאות מבטיחות בפתרון משימות AI מורכבות. דגמי AI מודרניים כמו ChatGPT, מְשׁוֹרֵר, לָאמָה, DALL-E.3, ו SAM הציגו יכולות יוצאות דופן בפתרון בעיות רב-תחומיות כמו מענה על שאלות חזותיות, פילוח, הנמקה ויצירת תוכן.

יתר על כך, AI רב-מודאלי צצו טכניקות המסוגלות לעבד מספר אופני נתונים, כלומר טקסט, תמונות, אודיו ווידאו בו-זמנית. עם ההתקדמות הללו, טבעי לתהות: האם אנחנו מתקרבים לסוף למידת מכונה מסורתית (ML)?

במאמר זה, נסקור את המצב של נוף למידת המכונה המסורתי בנוגע לחידושי AI גנרטיביים מודרניים.

מהי למידת מכונה מסורתית? - מהן המגבלות שלו?

למידת מכונה מסורתית היא מונח רחב המכסה מגוון רחב של אלגוריתמים המונעים בעיקר על ידי סטטיסטיקה. שני הסוגים העיקריים של אלגוריתמי ML מסורתיים הם בפיקוח ובלי פיקוח. אלגוריתמים אלו נועדו לפתח מודלים ממערכי נתונים מובנים.

אלגוריתמים סטנדרטיים של למידת מכונה כוללים:

  • אלגוריתמי רגרסיה כגון ליניארי, לאסו ורכס.
  • K-פירושו אשכול.
  • ניתוח רכיבים ראשיים (PCA).
  • תמיכה במכונות וקטור (SVM).
  • אלגוריתמים מבוססי עצים כמו עצי החלטה ויער אקראי.
  • מודלים חיזוק כגון שיפור שיפוע ו XGBoost.

מגבלות של למידת מכונה מסורתית

ל-ML מסורתי יש את המגבלות הבאות:

  1. יכולת הרחבה מוגבלת: מודלים אלה זקוקים לעתים קרובות לעזרה להרחיב את קנה המידה עם מערכי נתונים גדולים ומגוונים.
  2. עיבוד מוקדם של נתונים והנדסת תכונות: ML מסורתי דורש עיבוד מקדים נרחב כדי להפוך מערכי נתונים בהתאם לדרישות המודל. כמו כן, הנדסת תכונות יכולה להיות גוזלת זמן ודורשת איטרציות מרובות כדי ללכוד קשרים מורכבים בין תכונות נתונים.
  3. נתונים במימד גבוה ולא מובנים: ML מסורתי נאבק עם סוגי נתונים מורכבים כמו תמונות, אודיו, סרטונים ומסמכים.
  4. יכולת הסתגלות לנתונים בלתי נראים: מודלים אלה עשויים שלא להסתגל היטב לנתונים מהעולם האמיתי שלא היו חלק מהם נתוני אימונים.

רשת עצבית: מעבר מלמידת מכונה ללמידה עמוקה ומעבר

רשת עצבית: מעבר מלמידת מכונה ללמידה עמוקה ומעבר

מודלים של רשת עצבית (NN) הם הרבה יותר מסובכים ממודלים מסורתיים של למידת מכונה. ה-NN הפשוט ביותר - Perceptron רב שכבתי (MLP) מורכב מכמה נוירונים המחוברים יחדיו כדי להבין מידע ולבצע משימות, בדומה לאופן שבו מוח אנושי מתפקד.

ההתקדמות בטכניקות של רשתות עצביות היוו את הבסיס למעבר מ למידת מכונה ללמידה עמוקה. לדוגמה, NN המשמש למשימות ראייה ממוחשבת (זיהוי אובייקטים ופילוח תמונה) נקראות רשתות עצביות קונבולוציוניות (CNN), כמו אלכסנט, ResNet, ו Yolo.

כיום, טכנולוגיית AI גנרטיבית לוקחת את טכניקות הרשת העצבית צעד אחד קדימה, ומאפשרת לה להצטיין בתחומים שונים של AI. לדוגמה, רשתות עצביות המשמשות למשימות עיבוד שפה טבעית (כמו סיכום טקסט, מענה לשאלות ותרגום) ידועות בשם רוֹבּוֹטרִיקִים. דגמי שנאים בולטים כוללים ברט, GPT-4, ו T5. מודלים אלה יוצרים השפעה על תעשיות החל משירותי בריאות, קמעונאות, שיווק, לממן, וכו '

האם אנחנו עדיין צריכים אלגוריתמים מסורתיים של למידת מכונה?

האם אנחנו עדיין צריכים אלגוריתמים מסורתיים של למידת מכונה?

בעוד שרשתות עצביות והגרסאות המודרניות שלהן כמו שנאים זכו לתשומת לב רבה, שיטות ML מסורתיות נותרו חיוניות. הבה נבחן מדוע הם עדיין רלוונטיים.

1. דרישות נתונים פשוטות יותר

רשתות עצביות דורשות מערכי נתונים גדולים לאימון, בעוד שמודלים של ML יכולים להשיג תוצאות משמעותיות עם מערכי נתונים קטנים ופשוטים יותר. לפיכך, ML מועדף על פני למידה עמוקה עבור מערכי נתונים מובנים קטנים יותר ולהיפך.

2. פשטות ופרשנות

מודלים מסורתיים של למידת מכונה בנויים על גבי מודלים סטטיסטיים והסתברות פשוטים יותר. לדוגמה, קו המתאים ביותר רגרסיה לינארית מבסס את קשר הקלט-פלט בשיטת הריבועים הקטנים ביותר, פעולה סטטיסטית.

באופן דומה, עצי החלטה עושים שימוש בעקרונות הסתברותיים לסיווג נתונים. השימוש בעקרונות כאלה מציע פרשנות ומקל על מתרגלי AI להבין את פעולתם של אלגוריתמי ML.

ארכיטקטורות NN מודרניות כמו דגמי שנאים ודיפוזיה (משמשים בדרך כלל ליצירת תמונות כמו דיפוזיה יציבה or אמצע מסע) בעלי מבנה רשת רב-שכבתי מורכב. הבנת רשתות כאלה דורשת הבנה של מושגים מתמטיים מתקדמים. לכן הם מכונים גם 'קופסאות שחורות'.

3. יעילות משאבים

רשתות עצביות מודרניות כמו Large Language Models (LLMs) מאומנות על אשכולות של GPUs יקרים בהתאם לדרישות החישוביות שלהן. לדוגמה, על פי הדיווחים, GPT4 עבר הכשרה 25000 GPUs של Nvidia למשך 90 עד 100 ימים.

עם זאת, חומרה יקרה וזמן אימון ארוך אינם אפשריים עבור כל מתרגל או צוות AI. מצד שני, היעילות החישובית של אלגוריתמים מסורתיים של למידת מכונה מאפשרת למתרגלים להשיג תוצאות משמעותיות גם עם משאבים מוגבלים.

4. לא כל הבעיות מצריכות למידה עמוקה

למידה עמוקה אינו הפתרון המוחלט לכל הבעיות. קיימים תרחישים מסוימים שבהם ML מתגבר על למידה עמוקה.

לדוגמה, ב אבחון ופרוגנוזה רפואית עם נתונים מוגבלים, אלגוריתם ML עבור גילוי חריגות כמו REMED מספק תוצאות טובות יותר מאשר למידה עמוקה. באופן דומה, למידת מכונה מסורתית היא משמעותית בתרחישים עם יכולת חישובית נמוכה פתרון גמיש ויעיל.

בראש ובראשונה, בחירת הדגם הטוב ביותר לכל בעיה תלויה בצרכי הארגון או העוסק באופי הבעיה שעל הפרק.

למידת מכונה בשנת 2023

למידת מכונה בשנת 2023

תמונה שנוצרה באמצעות לאונרדו AI

בשנת 2023, למידת מכונה מסורתית ממשיכה להתפתח ומתחרה בלמידה עמוקה ובינה מלאכותית מחוללת. יש לו מספר שימושים בתעשייה, במיוחד כאשר עוסקים במערכי נתונים מובנים.

למשל, רבים מוצרי צריכה הנעים במהירות (FMCG) חברות מתמודדות עם כמות גדולה של נתונים טבלאיים בהסתמכות על אלגוריתמי ML עבור משימות קריטיות כמו המלצות מוצר מותאמות אישית, אופטימיזציה של מחירים, ניהול מלאי ואופטימיזציה של שרשרת האספקה.

יתר על כן, רבים מודלים של חזון ושפה עדיין מבוססים על טכניקות מסורתיות, ומציעות פתרונות בגישות היברידיות ויישומים מתפתחים. לדוגמה, מחקר שנערך לאחרונה בשם "האם אנחנו באמת צריכים מודלים של למידה עמוקה לחיזוי סדרות זמן?" דנה כיצד עצי רגרסיה מגבירי שיפוע (GBRTs) יעילים יותר עבורם תחזית סדרת זמן מאשר רשתות עצביות עמוקות.

הפרשנות של ML נשארת בעלת ערך רב עם טכניקות כמו מעצב (הסברים תוספים של שאפלי) ו ליים (הסברים מקומיים לפירוש מודל-אגנוסטי). טכניקות אלו מסבירות מודלים מורכבים של ML ומספקות תובנות לגבי התחזיות שלהם, ובכך עוזרות למתרגלי ML להבין את המודלים שלהם אפילו טוב יותר.

לבסוף, למידת מכונה מסורתית נותרה פתרון חזק עבור תעשיות מגוונות המתייחסות למדרגיות, מורכבות נתונים ומגבלות משאבים. אלגוריתמים אלו אינם ניתנים להחלפה עבור ניתוח נתונים ומודלים חזויים וימשיכו להיות חלק מ ארסנל של מדען נתונים.

אם נושאים כאלה מסקרנים אותך, חקור איחוד AI לתובנות נוספות.