ืืื ื ืืืืืืชืืช
ืืืื ื ืืชืืืืงื ืืืืืืื ืืืื ื: ืืงืฉืืื ืืืืจืื ืื ืฉื AI

לאחרונה, בינה מלאכותית (AI) הגיעה לנקודת ציון היסטורית באחד מתחרויות המתמטיקה הקשות בעולם, האולימפיאדה הבינלאומית למתמטיקה (IMO). Gemini Deep Think של Google DeepMind ודגם ניסיוני של OpenAI פתרו כל אחד חמישה מתוך שש בעיות מאתגרות, וקיבלו 35 נקודות מתוך 42, שהיו הרף לזכייה במדליית זהב. תוצאת DeepMind אושרה רשמית על ידי שופטי IMO, בעוד שזוכי מדליית זהב לשעבר של IMO אישרו את תוצאות OpenAI תחת אותם המגבלות של זמן וכלים כמו המתמודדים האנושיים. שני המערכות יצרו הוכחות מפורטות בשפה טבעית, והציגו התקדמות מרשימה ביכולות ההיגיון המתמטי של AI.
בעוד שהן מבצעות היטב בתחרויות כאלה, AI מתקשה במשימות הדורשות יצירתיות, חשיבה מופשטת וניתוח לוגי עמוק. מערכות אלה יכולות להתמודד עם סוגי בעיות מוכרים בהצלחה, אך הן מתקשות בבעיות לא מוכרות או מורכבות מאוד שדורשות תובנה מקורית. מגבלה זו מדגישה את המגבלות הנוכחיות של יכולות ההיגיון של AI ומזהה אזורים מרכזיים למחקר עתידי.
מחשבונים בסיסיים למתמודדי AI קוגניטיביים במתמטיקה
AI במתמטיקה החלה עם כלים מבוססי כללים פשוטים. מחשבונים דיגיטליים מוקדמים היו מוגבלים לביצוע רק פעולות אריתמטיות בסיסיות. מאוחר יותר, תוכנות כמו Wolfram Alpha ומפתחים סימבוליים אוטומטיים אלגברה וחשבון אינפיניטסימלי. מערכות אלה צייתו לכללים קפדניים וסיפקו תשובות מדויקות. הן לא יכלו להסביר את ההיגיון שלהן בשפה טבעית.
מודלים גדולים של שפה (LLM) שינו גישה זו. בניגוד למערכות סימבוליות, LLMs לומדים מאוסף גדול של טקסט. בתחילה, כישורים המתמטיים שלהם היו מוגבלים. הם לעיתים קרובות נכשלו בבעיות מילים בסיסיות. שיפור הדרגתי שיפר את הביצועים. אימון על מאגרי נתונים כמו GSM8K ו-MATH עזר להם לע












