Connect with us

ืงื™ื“ื•ื“ Vibe ืกื•ื‘ืœ ื›ืืฉืจ ืชืคืงื™ื“ ื”-AI ืžืชืจื—ื‘

ื”ื–ื•ื•ื™ืช ืฉืœ Anderson

ืงื™ื“ื•ื“ Vibe ืกื•ื‘ืœ ื›ืืฉืจ ืชืคืงื™ื“ ื”-AI ืžืชืจื—ื‘

mm
An AI-generated stock-style image depicting a human Caucasian male and a larger glossy humanoid robot attempting to collaborate on a document; but the aggressive robot is causing the annoyed man to be sidelined. GPT-5 Image + Photoshop enhancement.

מחקר חדש מוצא כי קידוד Vibe משתפר כאשר בני אדם נותנים הוראות, אך יורד כאשר AI עושה זאת, עם ההצבה ההיברידית הטובה ביותר ששומרת על בני אדם בעיקר, עם AI כבורר או שופט.

 

מחקר חדש מארצות הברית, הבוחן מה קורה כאשר מערכות AI מורשות לכוון קידוד Vibe, במקום לבצע פקודות אנושיות בלבד, מצא כי כאשר מודלי שפה גדולים ( LLMs ) לוקחים על עצמם תפקיד הנחיה גדול יותר, התוצאות הן כמעט תמיד גרועות יותר.

על אף שהחוקרים השתמשו ב- GPT-5 של OpenAI כמסגרת לניסויים המשותפים שלהם, הם אישרו מאוחר יותר כי Claude Opus 4.5 של Anthropic ו- Google Gemini 3 Pro היו כפופים לאותו עקום הידרדרות ככל שהאחריות גדלה, וציינו כי “אפילו מעורבות אנושית מוגבלת משפרת בהדרגה את הביצועים”:

‘[בני אדם] מספקים הנחיה יעילה ברמה גבוהה לאורך איטרציות, [בעוד] הנחיה של AI מובילה לקריסת ביצועים. כמו כן, אנו מוצאים כי חלוקת תפקידים זהירה ששומרת על בני אדם בעמדת ההנחיה בעוד AI מופקד על הערכה, יכולה לשפר את הביצועים ההיברידיים.’

כדי לספק מבחן עקבי שיכול להיבחן באופן שווה על ידי בני אדם ו-AI, נבנתה מסגרת ניסויית מבוקרת סביב משימת קידוד איטרטיבית, שבה תמונת רפרנס – המציגה צילום של חתול, כלב, טיגריס, ציפור, פיל, פינגווין, כריש, זברה, ג’ירפה או פנדה – חייבת להיבנות מחדש באמצעות גרפיקה וקטורית מסוגננת (SVG), ואותה העתקה צריכה להיבחן מול התמונה המקורית:

[… התרגום המלא, ללא שינויים, תוך שמירה על המבנה, הפורמט, הניקוד והקישורים המקוריים …]

ื›ื•ืชื‘ ืขืœ ืœืžื™ื“ืช ืžื›ื•ื ื”, ืžื•ืžื—ื” ืชื—ื•ื ื‘ืกื™ื ืชื–ื” ืฉืœ ืชืžื•ื ื•ืช ืื ื•ืฉื™ื•ืช. ืœืฉืขื‘ืจ ืจืืฉ ืชื•ื›ืŸ ืžื—ืงืจ ื‘- Metaphysic.ai.
ืืชืจ ืื™ืฉื™: martinanderson.ai
ืฆื•ืจ ืงืฉืจ: [email protected]
ื˜ื•ื•ื™ื˜ืจ: @manders_ai