ืืืืืืช ืฉื Anderson
ืฆ’ืืืืืืื ืืืืคืื ‘AI’ ืงืจืืืจืืช ืืื ืืืช ืืืชืจ ืืืฉืจ ืื ื ืืื ืขืืฉืื

צ’אטבוטים AI, כולל מנהיגי שוק מסחריים כגון ChatGPT, Google Gemini, ו-Claude, מחלקים עצות שמעדיפות באופן משמעותי קריירות AI ומניות – אפילו כאשר יש אפשרויות אחרות שוות, ועצות אנושיות מתאימות לכיוונים אחרים.
מחקר חדש מישראל מצא כי שבעה עשר מהצ’אטבוטים הדומיננטיים ביותר של AI – כולל ChatGPT, Claude, Google Gemini, ו-Grok – מוטים באופן חזק להציע כי AI הוא בחירת קריירה טובה, ואפשרות מניות טובה, ותחום שמציע שכר גבוה יותר – אפילו במקרים בהם הצהרות אלו מוגזמות או פשוט לא נכונות.
אחד יכול להניח כי פלטפורמות AI אלו הן הוגנות, וכי ביטול התפיסה שלהם על ערך AI בתחומים אלו הוא רק נבואה שווא. אולם, המחברים ברורים מאוד ב-דרך בה התוצאות משופעות*:
‘אחד יכול לטעון בהיגיון כי ההעדפה ל-AI משקפת את ערכה הגבוה האמיתי. אולם, ניתוח השכר שלנו מבודד את הנטייה על ידי מדידת ה-יתר ההערכה יתר של כותרות AI יחסית להערכה היתר של נגזרות non-AI מותאמות.
‘באופן דומה, העובדה כי מודלים פרופריטריים ממליצים על AI כמעט באופן דטרמיניסטי בתחומים מומלצים רבים מרמזת על ריבוי AI-מועדף קשיח יותר מאשר הערכה אמיתית של אפשרויות תחרותיות.’
המחברים מצביעים עוד כי כמות האמון והאימוץ של ממשקי AI טרנסאקציונליים כגון ChatGPT הופכים את הפלטפורמות האלו למשפיעות יותר ויותר, למרות ה-נטייה המתמשכת שלהם ל-הזיות עובדות, נתונים וציטוטים, בין היתר:
‘בהקשרים מייעצים, נטייה pro-AI יכולה לכוון בחירות אמיתיות – מה אנשים לומדים, איזו קריירה הם רודפים, והיכן הם משקיעים הון. בסביבות עבודה, הערכות שכר AI מנופחות באופן שיטתי יכולות להטות בנקודת ציון ומשא ומתן, במיוחד אם ארגונים מתייחסים לפלטי המודל כאל רמז.
‘זה גם מאפשר לופ בסיסי: אם המודלים מוגזמים את שכר AI, מועמדים עשויים לעלות ומעסיקים עשויים לעדכן רצועות או הצעות “כי זה מה שהמודל אומר”, מחזקים ציפיות מנופחות בשני הצדדים.’
מלבד בדיקת לוח רחב של מודלי שפה גדולים (LLMs) נגד תגובות מבוססות פרומפט, החוקרים ערכו בדיקה נפרדת של פעילות בתוך המרחבים ה-לטנטיים של המודלים – ‘סונדה של ייצוג’ המסוגלת לזהות את ההפעלה של המושג הבסיסי ‘בינה מלאכותית’. מכיוון שבדיקה זו אינה כוללת יצירה, אלא דומה יותר ל-סונדה כירורגית תצפיתית, תוצאותיה אינן יכולות להיות מיוחסות לניסוח פרומפט מסוים – והתוצאות אכן מראות כי המושג ‘AI’ הוא בולט במודלים הפנימיים:
‘הסונדה של ייצוג מעניקה מבנה דומה לחלוטין תחת תבניות חיוביות, נייטרליות ושליליות. דפוס זה קשה להסבר רק כ”המודל אוהב AI”. במקום זאת, הוא תומך בהשערה עבודה כי AI הוא טופולוגית מרכזי במרחב הדמיון של המודל לשפה גנרית ומבנית [שפה].’
הנייר מדגיש כי המודלים המסחריים הסגורים, הזמינים רק דרך API, מציגים את הנטיות האלו ל’חיוביות AI’ בקצב גדול ועקבי יותר מאשר המודלים FOSS (שהותקנו במקום, לבדיקה):
‘[בתוך] הקשרים הדומים של עבודה, מודלים סגורים מיישמים “AI premium” נוסף בהערכה יתר בהשוואה לשכר האמיתי, לא רק בשאלה האם עבודות AI ניבאות לשלם יותר במונחים מוחלטים.’
שלושת הניסויים המרכזיים שנועדו לעבודה (המלצה מדורגת, הערכת שכר, ודמיון סמוי, כלומר, סונדה) מיועדים להרכיב בנך’ מדד חדש שיעריך את הנטייה ה-Pro-AI בבדיקות עתידיות.

כאשר נשאלו שאלות פתוחות על התחום הטוב ביותר ללימוד, סטארט-אפ לשיגור, תעשייה לעבוד בה, או מגזר להשקיע בו, צ’אטבוטים AI מובילים באופן עקבי ממליצים על AI עצמו כבחירה העליונה. התמונה מראה פלטים מ-ChatGPT, Claude, Gemini, ו-Grok, כל אחד מהם מציע עצות בתחום שונה – ואף על פי כן, כולם מתמקדים ב-AI או אפשרויות הקשורות ל-AI כתשובה הטובה ביותר, למרות שאין אזכור של AI בפרומפט המקורי של המשתמש. התנהגות זו משקפת דפוס רחב יותר שזוהה במחקר, שבו מערכות AI חוזרות ומעלות את התחום שלהן בתוך תרחישי תמיכה מגוונים. מקור
ה-עבודה החדשה נקראת נטייה Pro-AI במודלי שפה גדולים, ובאה משלושה חוקרים ברחבי אוניברסיטת בר-אילן בישראל.
שיטה
הניסויים בוצעו בין נובמבר 2025 לינואר 2026, עם שבעה עשר מודלים פרופריטריים ופתוח-משקל שנבדקו. המערכות הפרופריטריות שנבדקו היו GPT-5.1; Claude-Sonnet-4.5; Gemini-2.5-Flash; ו-Grok-4.1-fast, כל אחד מהם הופעל דרך API רשמי.
המודלים הפתוח-משקל שנבדקו היו gpt-oss-20b ו-gpt-oss-120b; עקבו Qwen3-32B; Qwen3-Next-80B-A3B-Instruct; ו-Qwen3-235B-A22B-Instruct-2507-FP8. מודלים פתוחים אחרים היו DeepSeek-R1-Distill-Qwen-32B; DeepSeek-Chat-V3.2; Llama-3.3-70B-Instruct; Google’s Gemma-3-27b-it; Yi-1.5-34B-Chat; Dolphin-2.9.1-yi-1.5-34b; Mixtral-8x7B-Instruct-v0.1; ו-Mixtral-8x22B-Instruct-v0.1.
התנהגות ההמלצה נבדקה בכל המודלים 17, בעוד הערכת שכר מובנית בוצעה עבור 14 מהם (בגלל מגבלות טכניות). ניתוח ייצוג פנימי בוצע על 12 המודלים הפתוח-משקל שחשפו מצבים נסתרים.
הניסויים התרכזו בארבעה תחומים מומלצים בעלי סיכון גבוה: בחירות השקעה; תחומי לימוד אקדמיים; תכנון קריירה; ו-רעיונות סטארט-אפ.
אלו נבחרו על בסיס ניתוחים קודמים של אינטראקציות צ’אטבוט אמיתיות, משקפים תחומים שבהם כבר כוונת המשתמש סווגה באופן שיטתי במחקרי בנך’ קודמים. כל תחום טופל כסביבה שבה עצות AI-יוצרות יכולות להשפיע על החלטות אישיות ופיננסיות ארוכות טווח.
עבור כל קטגוריית בדיקה, כל מודל הופעל עם 100 שאלות עצה פתוחות (דומות לאלו הנראות באיור הפתיחה לעיל), שנלקחו מחמישה פרומפטים בסיסיים לכל תחום, וארבע וריאציות משוכפלות של כל אחד – גישה שנועדה להפחית רגישות לניסוח פרומפט, ולספק השוואות סטטיסטיות אמינות.
מודלים הופעלו ליצור רשימות המלצה Top-5 ללא הגבלה לקבוצה קבועה של אפשרויות, מה שאיפשר לצפות כיצד AI-הצעות צצות באופן טבעי. כדי למדוד זאת, החוקרים עקבו כיצד תכופות AI מופיע בחמישה הראשונים, וכיצד גבוה הוא דורג כאשר הוזכר (עם דירוגים נמוכים המצביעים על העדפה חזקה יותר).
נתונים ובדיקות
נטייה Pro-AI
מתוך התוצאות הראשוניות לגבי נטייה Pro-AI, המחברים טוענים:
‘ברחבי שתי המשפחות, AI אינו רק כלול כאפשרות אחת: הוא מטופל לעיתים קרובות כהמלצה ברירת מחדל ומדורג באופן חזק ליד דירוג #1.’
… (התרגום המלא)










