ืืื ื ืืืืืืชืืช ืืืืืช
ืืื GPT-4 ืืื ืงืคืืฆืช ืืืจืื ืืขืืจ ืืืขื ื-AGI?

Microsoft פרסמה לאחרונה מאמר מחקר בשם: Sparks of Artificial General Intelligence: Early experiments with GPT-4. כפי שתואר על ידי Microsoft:
מאמר זה דן בחקירה שלנו של גרסה מוקדמת של GPT-4, כאשר היא עדיין הייתה בפיתוח פעיל על ידי OpenAI. אנו טוענים ש-(גרסה מוקדמת זו של) GPT-4 היא חלק מקבוצה חדשה של LLMs (יחד עם ChatGPT ו-Google’s PaLM, למשל) שמציגים אינטליגנציה כללית יותר מאשר מודלי AI קודמים.
במאמר זה יש ראיות מוכרעות המוכיחות כי GPT-4 הולך הרבה מעבר לזיכרון, וכי יש לו הבנה עמוקה וגמישה של מושגים, מיומנויות ותחומים. בעובדה, יכולתו לכלליות עולה על זו של בן אדם חי היום.
כאשר דנו לפני כן ב יתרונות של AGI, אנו צריכים לסכם במהירות את ההסכמה הכללית של מהו מערכת AGI. במהות, AGI הוא סוג מתקדם של AI שיכול לכלליות במספר רב של תחומים ואינו צר בטווח. דוגמאות ל-AI צר הן רכב אוטונומי, צ’אטבוט, בוט שחמט, או כל AI אחר שתוכנן למטרה בודדת.
AGI, לעומת זאת, יוכל לחלופין בין כל אחד מהאלה או כל תחום מומחיות אחר. זהו AI שינצל אלגוריתמים נאים כגון למידת העברה, ולמידה אבולוציונית, תוך ניצול אלגוריתמים מסורתיים כגון למידה עמוקה חיזוקית.
התיאור הנ”ל של AGI תואם את הניסיון האישי שלי עם שימוש ב-GPT-4, כמו גם את הראיות שחולקו במאמר המחקר שפורסם על ידי Microsoft.
אחד הפרומפטים שתוארו במאמר הוא ל-GPT-4 לכתוב הוכחה לאינסוף הראשוניים בצורת שיר.

אם ננתח את הדרישות ליצירת שיר כזה, אנו מבינים כי הוא דורש תכנון מתמטי, ביטוי פואטי, ויצירת שפה טבעית. זוהי אתגר שיעלה על יכולתו של מרבית בני האדם.
המאמר רצה להבין אם GPT-4 פשוט מייצר תוכן על בסיס זיכרון כללי מול הבנת הקשר ויכולת להיגיון. כאשר נתבקש ליצור שיר בסגנון שייקספיר, הוא הצליח לעשות זאת. זה דורש רמה רב-תחומית של הבנה שעולה על יכולתו של האוכלוסייה הכללית, וכוללת תיאוריה של מוח וגאונות מתמטית.
איך לחשב את האינטליגנציה של GPT-4?
השאלה אז היא כיצד ניתן למדוד את האינטליגנציה של LLM? והאם GPT-4 מציג התנהגויות של למידה אמיתית או זיכרון בלבד?
הדרך הנוכחית לבדוק מערכת AI היא על ידי הערכת המערכת על סט של מאגרי בדיקה סטנדרטיים, ולוודא שהם עצמאיים מנתוני האימון ושהם כוסים טווח רחב של משימות ותחומים. סוג זה של בדיקה כמעט בלתי אפשרי בגלל כמות הנתונים הכמעט בלתי מוגבלת ש-GPT-4 הוכשר עליה.
המאמר דן ביצירת משימות/שאלות חדשות וקשות שמוכיחות באופן משכנע ש-GPT-4 הולך הרבה מעבר לזיכרון, ושיש לו הבנה עמוקה וגמישה של מושגים, מיומנויות ותחומים.
כאשר מדובר באינטליגנציה, GPT-4 יכול ליצור סיפורים קצרים, תסריטים, והוא יכול לחשב את הנוסחאות המורכבות ביותר.
GPT-4 גם מסוגל לתכנת ברמה גבוהה מאוד, הן בכתיבת קוד מהוראות והן בהבנת קוד קיים. GPT-4 יכול לטפל במגוון רחב של משימות קידוד, מאתגרי קידוד ליישומים בעולם האמיתי, מאסיפת נמוכה למסגרות ברמה גבוהה, ממבני נתונים פשוטים לתוכניות מורכבות כגון משחקים. GPT-4 יכול גם להיגיון על ביצוע קוד, לדמות את השפעות ההוראות, ולהסביר את התוצאות בשפה טבעית. GPT-4 אפילו יכול לבצע קוד סמלי,
GPT-4 יכול להציע תגובות רציונליות לכמעט כל פרומפט נתון. בעובדה, האינטליגנציה שלו היא כמעט בלתי מנוצחת במורכבות שלה.
מגבלות GPT-4
המאמר ממשיך לתאר כיצד הם בדקו את תגובות GPT-4 והתנהגויות, כדי לאמת את עקביות, עקביות ונכונות, ולחשוף את מגבלותיו והטיותיו.
המגבלה הבולטת ביותר היא נטייתו להזיות. כאן יש דוגמה להזיה שניתנה במאמר, שבו GPT-4 היה בטוח בתשובתו, שהייתה שקרית לחלוטין.

נראה כי אפילו GPT-4 מבין את המגבלה הנוכחית עם הזיות, שכן זו הייתה התגובה שנתן כאשר שאלתי אותו מהו GPT הזיה:
הזיה GPT מתייחסת לתופעה שבה מודל Generative Pre-trained Transformer (GPT), כגון המודל שאתה משוחח איתו כרגע, מייצר תגובה שאינה מבוססת על מידע עובדתי או אינה עקבית עם ההקשר שניתן. הזיות אלה מתרחשות כאשר המודל מייצר טקסט שעשוי להיראות סביר, אך בעצם שקרי, מוטעה או חסר משמעות.
במילים אחרות, כאשר אתה מאמן LLM AI על נתוני העולם, איך אתה מונע מערכת שלומדת מידע שגוי, ותיאוריות קשר? LLM גדול שלומד ומיצר מידע שגוי, יכול להיות אחד המלכודים והאיומים הגדולים ביותר שאנושות פונה אליו עם אימוץ LLMs בקנה מידה גדול.
הוכחות GPT-4 לאינטליגנציה
המאמר מאייר כי לא היה משנה סוג הפרומפטים המורכבים שננתנו לו, GPT-4 עלה על הציפיות. כפי שצוין במאמר:
האימון הבלתי נלאה שלו בשפה טבעית. הוא יכול לא רק לייצר טקסט זורם ועקבי, אלא גם להבין ולהנדס אותו בדרכים שונות, כגון סיכום, תרגום או ענישה על שאילתות רחבות. ועוד, בתרגום אנו מתכוונים לא רק בין שפות טבעיות שונות, אלא גם תרגומים בטון וסגנון, כמו גם בתחומים כגון רפואה, משפטים, חשבונאות, תכנות, מוזיקה ועוד.
בדיקות טכניות מדומות ניתנו ל-GPT-4, והוא עבר בקלות, מה שאומר שאם זה היה בן אדם בצד השני, הוא היה מועסק מיד כמהנדס תוכנה. בדיקה דומה של GPT-4 במבחן ה- Multistate Bar Exam הראתה דיוק של מעל 70%. זה אומר שבעתיד, אנו יכולים לאוטומט את רוב המשימות שניתנות כיום לעורכי דין. בעובדה, יש חברות הזנק שעובדות כעת על יצירת עורכי דין רובוטיים המשתמשים ב-GPT-4.
יצירת ידע חדש
אחד הטיעונים במאמר הוא כי הדבר היחיד שנותר ל-GPT-4 להוכיח רמות אמיתיות של הבנה הוא לייצר ידע חדש, כגון הוכחת משפטים מתמטיים חדשים, הישג שעדיין נמצא מחוץ להישג LLMs.
אז שוב, זהו הגראל הקדוש של AGI. בעוד שיש סכנות עם AGI שנשלט בידיים הלא נכונות, היתרונות של AGI שיכול לנתח במהירות את כל הנתונים ההיסטוריים, לגלות משפטים, תרופות וטיפולים חדשים, הוא כמעט אינסופי.
AGI יכול להיות הקישור החסר למציאת תרופות למחלות גנטיות נדירות, שחסרות מימון פרטי, לריפוי סרטן, ולאופטימיזציה של אנרגיה מתחדשת, כדי להסיר את התלות שלנו באנרגיה בלתי בר-קיימא. בעובדה, הוא יכול לפתור כל בעיה משמעותית שתוכנס למערכת AGI. זה מה ש-Sam Altman והצוות ב-OpenAI מבינים, AGI הוא המצאה האחרונה שנחוצה לפתרון רוב הבעיות, ולהביא תועלת לאנושות.
כמובן, זה לא פותר את הבעיה של לוחצן הגרעין, של מי ששולט ב-AGI, ומהם כוונותיו. בכל אופן, מאמר זה עושה עבודה נפלאה בטיעון כי GPT-4 הוא קפיצת מדרגה לעבר השגת החלום של חוקרי AI, מאז 1956, כאשר הפרויקט הראשון של קיץ המחקר על AI בדרטמות’ הושק.
בעוד שזה מוטל בספק אם GPT-4 הוא AGI, ניתן לטעון בקלות כי זו הפעם הראשונה בתולדות האנושות, שמערכת AI יכולה לעבור את מבחן טיורינג.












