Connect with us

ื””ืืงืกื•ืœื•ืฆื™ื”” ื”ืžืชืงืจื‘ืช ืฉืœ AI

ืžื ื”ื™ื’ื™ ื“ืขื”

ื””ืืงืกื•ืœื•ืฆื™ื”” ื”ืžืชืงืจื‘ืช ืฉืœ AI

mm

כיום, תוך כדי שהוא נמצא בשולי קו התרסיס הטכנולוגי, אנו צופים במסע מ-LLMs לסוכנים, ולבסוף ל-AI אגנטי ו-AGI, וזה לא רק עניין של מודלים גדולים יותר או תגובות מהירות יותר. זה גם עניין של מכונות שעוברות מלהיות עוזרים פסיביים לשותפים פעילים, ואולי, יום אחד, מחשבים עצמאיים.

בואו נעקב אחר הנתיב הזה ונחקור מה זה אומר עבור עבודה, מומחיות, ותפקידם של בני אדם בעיצוב האינטליגנציה של מחר.

ההבדל בין LLMs, מערכות מבוססות סוכנים, ו-AI אגנטי

כדי להבין טוב יותר את ההבדל, כאן יש דוגמה. אם אני שואל LLM משהו כמו: “אני רוצה לנסוע משיקגו לאוסטין, לנהוג לא יותר מארבע שעות ביום, ולעצור במקומות נוף”, LLM רגיל יחזיר תגובה סטטית בפורמט טקסט על בסיס יצירת שפה. הוא כנראה רק יגיב לבקשה ללא ביצוע ניתוח מעמיק.

סוכן יסווג את הבקשה כקשורה לנסיעות. אז, הוא יקבע מהי המידע הדרוש: נתיבים המשתמשים בשירותי מיפוי, מידע מזג אוויר, עלות דלק, בתי מלון, מסעדות וכו’. לאחר מכן, הסוכן יפריד את הבקשה למשימות משנה וישלח אותן למודולים מיוחדים או LLMs שאומנו על מקורות רלוונטיים. זוהי תזמור ותיאום של מודלים וכלים תחת לוגיקה מאוחדת.

היום, רוב המערכות הגדולות כמו ChatGPT או Claude מ-Anthropic בעצם כבר סוכנים. אף על פי שזה עשוי להראות למשתמש שהוא מתקשר עם מודל בודד, מאחורי הקלעים יש ארכיטקטורה מורכבת הכוללת הרבה מודלים ומערכות. הם כבר יכולים לטפל בשאילתות מורכבות, אך יכולותיהם מוגבלות בעיקר לספק מידע; הם עדיין לא פועלים.

סוכן אוטונומי מלא הוא מערכת שאוספת מידע ויכולה, למשל, להזמין מלון, לרכוש כרטיס, או לאתחל תשלום, בהנחה שיש לה גישה ל-APIs רלוונטיים או נתוני משתמש. סוכנים כאלה נמצאים כרגע בשלבי פיתוח מוקדמים. בשלב זה, הם יותר כמו סוכנים-חצי, מסוגלים לעבד מידע אך עדיין לא מבצעים פעולות אוטונומיות.

תחום מעניין של דיון בקהילת המחקר הוא AI אגנטי. לא כמו סוכן רגיל, שהתנהגותו מתוכננת על ידי מפתחים, AI אגנטי הוא מערכת שקובעת בעצמה אילו משימות לבצע, איזה מידע היא צריכה, ואפילו איך להמשיך את האימון שלה. זה הולך מעבר לביצוע הוראות; זה כולל קבלת החלטות אוטונומיות. אולם, AI אגנטי נותר תאורטי בשלב זה; אין מערכות כאלה בפועל עדיין.

AGI – האופק החדש. אבל האם זה מימושי?

Meta השקיעה ב-Scale AI לפני שלושה חודשים. המטרה הייתה להצטרף לכוחות בנתיב לבניית AGI, אינטליגנציה מלאכותית כללית, המסוגלת לבצע כל משימה ברמה אנושית או אפילו לעקוף אותה. אם AI של היום הוא מהפכה טכנולוגית, AGI תהיה מהפכה אמיתית; לפעמים אני קורא לזה “אקסולוציה”, משמע “יציאה” של AI מהצללים. מי שישיג את זה ראשון יזכה ביתרון אסטרטגי גלובלי.

כלומר, כמה קרובים אנו ל-AGI אמיתי, תלוי במידה רבה באיך אנו מגדירים אותו. אני מסכים עם דעתו של Ilya Sutskever: AGI הוא מערכת המסוגלת לבצע כל משימה אינטלקטואלית שאדם יכול. לא רק לענות על שאילתות, אלא גם לתהות, קבלת החלטות, הכללה, ופרשנות ברחבי תחומים. AGI אמיתי הוא אוניברסלי ולא מוגבל לגבולות משימות צרים.

אף אחד מהמודלים הנוכחיים לא הגיע לרמה זו. אנו נעים בכיוון הזה, אך AGI אמיתי, במובן התאורטי, עדיין לא קיים. ואולי זה לטובה. אנו עדיין בשלב של קירוב, וכנראה שנישאר שם לזמן רב.

היסוד ל-AGI כנראה יהיה מערכת מבוססת סוכנים. היא לא תסתמך בהכרח על LLM בודד, מכיוון שכשום שאף אדם, לא משנה כמה הוא מחונן, לא יכול לשלוט בכל תחומי הידע והמיומנויות, גם LLM בודד לא יכול לטפל במלוא הספקטרום של משימות AGI בעצמו. מה שאנו צריכים זהו סוג של “אינטליגנציה קולקטיבית”: ארכיטקטורה המסוגלת לתאם מודלים ורכיבים רבים.

AGI כנראה תופיע לא רק כסוכן שתוכנן על ידי בני אדם, אלא כמעין “מטא-סוכן”. זה יהיה מערכת שתפותח חלקית ותתפתח עם עזרת AI עצמו. זה חשוב מכיוון שמערכות שתוכננו כולן על ידי בני אדם עשויות לשאת מגבלות מולדות. השתתפות AI בתהליך העיצוב עשויה לעזור להתגבר על המגבלות האלה ולהפוך את המערכת ליותר גמישה.

AGI כנראה לא תבוא מפריצת דרך מסוימת. לא במיוחד LLMs גדולים יותר, סוכנים חכמים יותר, או ארכיטקטורות חדשות לגמרי, אלא דווקא מסינתזה של השלושה. כנראה, משהו חדש לגמרי שעובר את הקטגוריות שאנו משתמשים בהן כיום.

“מבחן הגמר של האנושות” ובנקי מבחן AGI אחרים

“מבחן הגמר של האנושות” (HLE) הוא אחד הבנקים המתוחכמים יותר שמודברים כרגע בהקשר של LLMs, סוכנים, ו-AGI. בעצם, זהו מבחן הכולל כ-2,500 שאילתות המשרתות טווח רחב של תחומים אקדמיים – מתמטיקה, פיזיקה, ביולוגיה, כימיה, הנדסה, מדעי המחשב, ואפילו שחמט. הרעיון הוא לבדוק האם מערכת AI יכולה לפתור בעיות ברמה המשקפת הבנה אנושית אמיתית.

המודלים הלשוניים הנוכחיים מבצעים ביצועים נמוכים מאוד ב-HLE, לעיתים קרובות עם דיוק של פחות מ-5%. זה בניגוד לבנקים אחרים כמו MMLU או GPQA, שבהם המודלים משיגים ציונים גבוהים בהרבה. הקושי של המודלים עם HLE מדגיש רק כמה הם עדיין רחוקים מאינטליגנציה כללית אמיתית.

זה חשוב לציין שביצועים גבוהים בבנקים עם נתונים ידועים או צרים לא מעידים בהכרח על נוכחותה של אינטליגנציה כללית אמיתית. מודל יכול להיות מסוגנן או “מאומן למבחן”, מה שעלול לנפח את יכולותיו הנראות. כך שאפילו ציון מושלם ב-HLE לא יוכיח שהגענו ל-AGI; זה רק יוכיח שעברנו מבחן מסוים.

מה מניע את AGI

אני מסכים לחלוטין שהעמודים המרכזיים של AGI הם נתונים, חישוב, וכישרון. המצב עם החישוב ברור. שחקנים מפתחים כמו Meta ניסו לייצר שבבים משלהם, השקיעו מיליארדים בתהליך פיתוח השבבים שלהם. אך חברות עדיין מסתמכות במידה רבה על שבבים ועוצמת חישוב של שחקנים אחרים כמו Nvidia, שלא רק מספקים את החומרה הדרושה אלא גם מבינים את חשיבות הגדלת הייצור.

יותר שאלות קשורות לנתונים וכישרונות. האינטרנט “נגמר” – אין שום טקסט שנוצר על ידי בני אדם ממקורות פתוחים שלא היה בשימוש לאימון ברגע זה. כמות המידע שהאנושות הפיקה עד כה מתגלה כקטנה בהפתעה. זה למה חברות מתחילות לשתף פעולה עם אלה שיכולים לייצר נתונים אנושיים באיכות גבוהה.

אוטומציה מלאה או אדם בלופ?

נקודה נוספת – ירידה בדרישה לסימון נתונים ידני. לפני מספר שנים, התעשייה התרחבה במהירות מלאה. אלפי סימנים הועלו על הספינה כדי להאכיל את הרעב של צינורות AI. היום, התנעה הרבה מזו עברה לעבר אוטומציה.

לקחו, למשל, זיהוי פנים. היה אחד המניעים העיקריים של נפח סימון תמונות. אך הקטגוריה ברובה כבר נפתרה. מודלים כמו YOLO, SAM, ו-Samurai בולעים עבודה שגרתית. מערכות אלה לוחצות שבועות של מאמץ ידני לדקות, לעיתים קרובות עם דיוק מדהים. גם יישמנו הרבה כלים מסייעים ב-Machine Learning בפלטפורמה הפרופרית שלנו Keylabs. זה באמת עוזר לקצץ את העבודה השגרתית.

אך כל המודלים האלה מוגבלים על ידי הכללה שלהם ומתאימים לאוטומציה של פעולות סטנדרטיות ואחידות. מקרים מורכבים או ייחודיים עדיין דורשים תשומת לב אנושית.

אנו זזים מהפרדיגמה הישנה שבה סימן היה פשוט אדם שיכול להכיר פרטים, לזהות אובייקט או רגש. במציאות החדשה, מקצוענים נדרשים: רופאים לסימון תמונות רפואיות, מתכנתים לקוד, אדריכלים ליצור תוכניות, שיווקים לתובנות לקוחות, ומומחים צבאיים לתרחישי הגנה.

אנו כבר רואים מקרים בעולם האמיתי, כגון טייסי קרב המסמנים נתונים ל-AI ומרוויחים 1,000 דולר לשעה עבור המומחיות שלהם. מכיוון שמומחים כאלה נדירים, וידיעתם היא קריטית לאימון AI בביצועים גבוהים.

העולם משתנה: יותר ויותר אנשים הופכים למופעלים ו”מאמנים” של בינה מלאכותית. עד לא מזמן, קיבלתי הודעה ב-LinkedIn שביקשה ממני לבדוק מערכת נתונים עבור אפליקציית AI שנועדה למנכ”לים. בעתיד, כל אחד מאיתנו עלול לקבל הצעת עבודה כסימן, לא רק מישהו שלוחץ כפתורים, אלא מומחה שידעו מעצב את האינטליגנציה של מחר.

אנו כבר חיים במציאות הזו, עולם של סימון נתונים ואימון AI. מי שמזהה זאת ומסתגל יזכה ביתרון משמעותי.

ืžื™ื™ืงืœ ืื‘ืจืžื•ื‘ ื”ื•ื ื”ืžื™ื™ืกื“ ื•ื”ืžื ื›"ืœ ืฉืœ Introspector, ืžื‘ื™ื ื™ื•ืชืจ ืž-15+ ืฉื ื•ืช ื ื™ืกื™ื•ืŸ ื‘ื”ื ื“ืกืช ืชื•ื›ื ื” ื•ืžืขืจื›ื•ืช AI ืฉืœ ืจืื™ื™ื” ืžืžื•ื—ืฉื‘ืช ืœื‘ื ื™ื™ืช ื›ืœื™ื ืœืกื™ืžื•ืŸ ื‘ืจืžื” ืชืขืฉื™ื™ืชื™ืช.

ืžื™ื™ืงืœ ื”ืชื—ื™ืœ ืืช ื”ืงืจื™ื™ืจื” ืฉืœื• ื›ืžื”ื ื“ืก ืชื•ื›ื ื” ื•ืžื ื”ืœ ืžื—ืงืจ ื•ืคื™ืชื•ื—, ื‘ื ื™ื™ืช ืžืขืจื›ื•ืช ื ืชื•ื ื™ื ืžืกื•ืœืกืœื•ืช ื•ื ื™ื”ื•ืœ ืฆื•ื•ืชื™ื ื”ื ื“ืกื™ื™ื ืจื‘-ืชืคืงื™ื“ื™ื™ื. ืขื“ 2025, ื”ื•ื ืฉื™ืžืฉ ื›ืžื ื›"ืœ Keymakr, ื—ื‘ืจืช ืฉื™ืจื•ืชื™ ืกื™ืžื•ืŸ ื ืชื•ื ื™ื, ืฉื ื”ื•ื ื—ื™ื“ืฉ ืขื‘ื•ื“ื•ืช ื”ื™ื‘ืจื™ื“ื™ื•ืช, ืžืขืจื›ื•ืช QA ืžืชืงื“ืžื•ืช ื•ื›ืœื™ื ืžื•ืชืืžื™ื ืื™ืฉื™ืช ืœืชืžื™ื›ื” ื‘ืฆื•ืจื›ื™ ื ืชื•ื ื™ื ืฉืœ ืจืื™ื™ื” ืžืžื•ื—ืฉื‘ืช ื•ืื•ื˜ื•ื ื•ืžื™ื” ื‘ืงื ื” ืžื™ื“ื” ื’ื“ื•ืœ.

ื”ื•ื ืžื—ื–ื™ืง ื‘ืชื•ืืจ B.Sc. ื‘ืžื“ืขื™ ื”ืžื—ืฉื‘ ื•ืจืงืข ื‘ื”ื ื“ืกื” ื•ืืžื ื•ื™ื•ืช ื™ืฆื™ืจืชื™ื•ืช, ืžื‘ื™ื ืขื“ืฉื” ืจื‘-ืชื—ื•ืžื™ืช ืœืคืชืจื•ืŸ ื‘ืขื™ื•ืช ืงืฉื•ืช. ืžื™ื™ืงืœ ื—ื™ ื‘ืžืคื’ืฉ ืฉืœ ื—ื“ืฉื ื•ืช ื˜ื›ื ื•ืœื•ื’ื™ืช, ื”ื•ื‘ืœืช ืžื•ืฆืจ ืืกื˜ืจื˜ื’ื™ืช ื•ื”ืฉืคืขื” ื‘ืขื•ืœื ื”ืืžื™ืชื™, ืžื ื™ืข ืืช ื”ื—ื–ื™ืช ื”ื‘ืื” ืฉืœ ืžืขืจื›ื•ืช ืื•ื˜ื•ื ื•ืžื™ื•ืช ื•ืื•ื˜ื•ืžืฆื™ื” ืžื‘ื•ื“ื“ืช.