בינה מלאכותית

כיצד טוקנים בודדים יכולים ליצור או לשבור תהליכי היגיון של AI

Published December 9, 2024

Updated April 3, 2026

Alex McFarland

תדמיינו שאתם מבקשים מ-AI לפתור בעיה מתמטית פשוטה בנוגע להחזר הלוואה. כאשר ה-AI נתקל במילה “חייב”, הוא מתקלקל, מייצר חישובים שגויים ולוגיקה פגומה. אבל שנו את המילה היחידה הזו ל-“שולם”, ופתאום תהליך ההיגיון של ה-AI משתנה – הופך לברור, מדויק ומדויק. זה לא תכונה או מקרה; זו תובנה יסודית שמשנה את הבנתנו את הדרך בה מערכות AI חושבות.

מדענים באוניברסיטת צינגהואה וב-Tencent AI Lab גילו תופעה ב-AI: מילים מסוימות פועלות כמחלפי נוירונים, מסוגלות להכווין מחדש את שרשרת ההיגיון של AI. “טוקנים קריטיים” אלה, כפי שהחוקרים קוראים להם, יכולים להיות ההבדל בין בהירות לוגית לבלבול חישובי.

חשבו על זה כמו מערכת GPS. שם רחוב שגוי יכול לשלוח אותך מיילים רחוק מהמסלול, אפילו אם כל ההוראות האחרות מושלמות. באופן דומה, מילים קריטיות אלה יכולות להכווין מחדש את מסע ההיגיון של AI, ללא קשר לכך כמה חזק ההקשר המקיף.

פיצוח קוד המילים

הפריצה הגיעה כאשר החוקרים פיתחו שיטה הנקראת cDPO (אופטימיזציה ישירה קונטראסטיבית). לא כמו גישות קודמות שטיפלו בכל המילים באופן שווה, cDPO מכיר בכך שבתחום ההיגיון של AI, לא לכל המילים יש משקל שווה.

צוות המחקר הדגים זאת דרך בדיקות נרחבות במודלי AI רבים, כולל Llama-3 ו-DeepSeek-math. תוצאותיהם הראו כי כאשר טוקנים קריטיים מסוימים היו נוכחים, דיוק ה-AI יכול לרדת משמעותית – לפעמים עד כ-15.94%. אולם, כאשר טוקנים אלה זוהו ונמנעו בצורה י