הנדסה מהירה

הנחיה אנלוגית וצעד אחורה: צלילה אל ההתקדמות האחרונה מאת Google DeepMind

יצא לאור

לפני 6 חודשים

3 בנובמבר 2023

Google DeepMind Prompt Engineering מחקר חדש

מבוא

הנדסה מהירה מתמקדת בהמצאת הנחיות יעילות להנחות מודלים של שפה גדולה (LLMs) כגון GPT-4 ביצירת תגובות רצויות. הנחיה מעוצבת היטב יכולה להיות ההבדל בין תשובה מעורפלת או לא מדויקת לבין תשובה מדויקת ומלאת תובנה.

במערכת האקולוגית הרחבה יותר של AI, הנדסה מהירה היא אחת מכמה שיטות המשמשות לחילוץ מידע מדויק יותר ורלוונטי יותר מבחינה הקשרית ממודלים של שפות. אחרות כוללות טכניקות כמו למידה של מעט יריות, שבהן המודל מקבל כמה דוגמאות כדי לעזור לו להבין את המשימה, וכיוונון עדין, שבו המודל מאומן על מערך נתונים קטן יותר כדי להתמחות בתגובות שלו.

גוגל DeepMind פרסם לאחרונה שני מאמרים שמתעמקים בהנדסה מהירה ובפוטנציאל שלה לשפר תגובות על מצבים מרובים.

מאמרים אלה הם חלק מהחקירה המתמשכת בקהילת הבינה המלאכותית כדי לחדד ולייעל את האופן שבו אנו מתקשרים עם מודלים של שפות, והם מספקים תובנות חדשות לגבי מבנה הנחיות לטיפול טוב יותר בשאילתות ואינטראקציה עם מסד נתונים.

מאמר זה מתעמק בפרטים של מאמרי מחקר אלה, מבהיר את המושגים, המתודולוגיות וההשלכות של הטכניקות המוצעות, מה שהופך אותם לנגישים אפילו לקוראים בעלי ידע מוגבל ב-AI ו-NLP.

מאמר 1: מודלים שפה גדולים כסמקולים אנלוגיים

המאמר הראשון, שכותרתו "מודלים של שפה גדולה כסומקים אנלוגיים", מציג גישה חדשה של הנחיה בשם הנחיה אנלוגית. המחברים, Michihiro Yasunaga, Xinyun Chen ואחרים, שואבים השראה מהיגיון אנלוגי - תהליך קוגניטיבי שבו בני אדם ממנפים את חוויות העבר כדי להתמודד עם בעיות חדשות.

מושגי מפתח ומתודולוגיה

הנחיה אנלוגית מעודדת את ה-LLMs ליצור בעצמם דוגמאות או ידע רלוונטיים בהקשר לפני המשך פתרון בעיה נתונה. גישה זו מבטלת את הצורך במופתים מתויגים, המציעים כלליות ונוחות, ומתאימה את המופתים שנוצרו לכל בעיה ספציפית, מה שמבטיח יכולת הסתגלות.

משמאל: שיטות מסורתיות להנחות LLMs מסתמכות על תשומות גנריות (0-shot CoT) או מחייבות דוגמאות מתויגות (few-shot CoT). מימין: הגישה החדשנית מניחה את ה-LLMs ליצור בעצמם דוגמאות רלוונטיות לפני פתרון בעיות, תוך הסרת הצורך בתיוג תוך התאמה אישית של דוגמאות לכל

מופתים שנוצרו בעצמם

הטכניקה הראשונה המוצגת במאמר היא מופתים שנוצרו בעצמם. הרעיון הוא למנף את הידע הנרחב שרכשו אנשי LLM במהלך ההכשרה שלהם כדי לעזור להם לפתור בעיות חדשות. התהליך כרוך בהגדלת בעיית יעד עם הוראות המניעות את המודל להיזכר או ליצור בעיות ופתרונות רלוונטיים.

לדוגמה, בהינתן בעיה, המודל מקבל הוראה להיזכר בשלוש בעיות מובחנות ורלוונטיות, לתאר אותן ולהסביר את הפתרונות שלהן. תהליך זה נועד להתבצע במעבר אחד, מה שמאפשר ל-LLM ליצור דוגמאות רלוונטיות ולפתור את הבעיה הראשונית בצורה חלקה. השימוש בסמלים '#' בהנחיות מסייע במבנה התגובה, מה שהופך אותה למאורגנת יותר וקלה יותר עבור המודל לעקוב אחריה.

החלטות טכניות מרכזיות המודגשות במאמר כוללות את הדגש על יצירת דוגמאות רלוונטיות ומגוונות, אימוץ גישה של מעבר יחיד לנוחות רבה יותר, והממצא שיצירת שלושה עד חמישה דוגמאות מניבה את התוצאות הטובות ביותר.

ידע שנוצר בעצמו + מופתים

הטכניקה השנייה, ידע שנוצר בעצמו + מופתים, מוצגת כדי להתמודד עם אתגרים במשימות מורכבות יותר, כגון יצירת קוד. בתרחישים אלה, LLMs עשויים להסתמך יתר על המידה על מופתים ברמה נמוכה ולהתקשה להכליל בעת פתרון בעיות היעד. כדי למתן את זה, המחברים מציעים לשפר את ההנחיה עם הוראה נוספת המעודדת את המודל לזהות מושגי ליבה בבעיה ולספק הדרכה או טייק אווי ברמה גבוהה.

שיקול קריטי אחד הוא הסדר שבו נוצרים ידע ומופת. המחברים מצאו שיצירת ידע לפני מופתים מובילה לתוצאות טובות יותר, מכיוון שהיא עוזרת ל-LLM להתמקד בגישות הבסיסיות לפתרון בעיות ולא רק בדמיון ברמת השטח.

יתרונות ויישומים

גישת ההנחיה האנלוגית מציעה מספר יתרונות. הוא מספק דוגמאות מפורטות של נימוקים ללא צורך בתיוג ידני, תוך התייחסות לאתגרים הקשורים לשיטות של 0-shot ו-what-shot chain-of-thought (CoT). בנוסף, הדוגמאות שנוצרו מותאמות לבעיות אינדיבידואליות, ומציעות הדרכה רלוונטית יותר מ-CoT מסורתיים של מעט יריות, המשתמשת בדוגמאות קבועות.

המאמר מדגים את היעילות של גישה זו על פני משימות חשיבה שונות, כולל פתרון בעיות במתמטיקה, יצירת קוד ומשימות חשיבה אחרות ב-BIG-Bench.

הטבלאות שלהלן מציגות מדדי ביצועים של שיטות הנחיה שונות על פני ארכיטקטורות מודלים שונות. יש לציין, ששיטת "מופתים שנוצרו בעצמם" עולה באופן עקבי על שיטות אחרות מבחינת דיוק. ברמת דיוק GSM8K, שיטה זו משיגה את הביצועים הגבוהים ביותר בדגם PaLM2 ב-81.7%. באופן דומה, עבור דיוק MATH, הוא נמצא בראש הטבלה ב-GPT3.5-טורבו ב-37.3%.

ביצועים במשימות מתמטיות, GSM8K ו-MATH

בטבלה השנייה, עבור הדגמים GPT3.5-turbo-16k ו-GPT4, "ידע שנוצר בעצמו + מופתים" מציג את הביצועים הטובים ביותר.

ביצועים במשימת יצירת קוד של Codeforces

מאמר 2: קח צעד אחורה: עורר היגיון באמצעות הפשטה במודלים של שפות גדולות

סקירה כללית

העיתון השני, "קח צעד אחורה: עורר היגיון באמצעות הפשטה במודלים של שפות גדולותמציג Step-Back Prompting, טכניקה המעודדת LLMs להפשט מושגים ברמה גבוהה ועקרונות ראשונים ממופעים מפורטים. המחברים, Huaixiu Steven Zheng, Swaroop Mishra ואחרים שואפים לשפר את יכולות החשיבה של LLMs על ידי הדרכתם ללכת בנתיב חשיבה נכון לקראת הפתרון.

מתאר STEP-BACK PROMPTING דרך שני שלבים של הפשטה והיגיון, המנווטים על ידי מושגים ועקרונות מפתח.

בואו ניצור דוגמה פשוטה יותר באמצעות שאלה בסיסית במתמטיקה כדי להדגים את טכניקת "שאלת צעד אחורה":

Original Question: If a train travels at a speed of 60 km/h and covers a distance of 120 km, how long will it take?

Options:

3 hours
2 hours
1 hour
4 hours
Original Answer [Incorrect]: The correct answer is 1).

Stepback Question: What is the basic formula to calculate time given speed and distance?

Principles:
To calculate time, we use the formula:
Time = Distance / Speed

Final Answer:
Using the formula, Time = 120 km / 60 km/h = 2 hours.
The correct answer is 2) 2 hours.

למרות שלימודי תואר שני בימינו יכולים לענות בקלות על השאלה שלעיל, דוגמה זו היא רק כדי להדגים כיצד תעבוד טכניקת הצעד האחורי. עבור תרחישים מאתגרים יותר, ניתן ליישם את אותה טכניקה כדי לנתח ולטפל בבעיה באופן שיטתי. להלן מקרה מורכב יותר שהודגם במאמר:

בקשת צעד אחורה במערך הנתונים של MMLU-Chemistry