צור קשר

מבט אישי על מגמות ספרותיות בתחום הראייה הממוחשבת בשנת 2025

זווית אנדרסון

מבט אישי על מגמות ספרותיות בתחום הראייה הממוחשבת בשנת 2025

mm
תמונה שנוצרה על ידי בינה מלאכותית, מאת gpt-image-1 דרך ChatGPT-5.2, הכוללת איור איזומטרי מסוגנן של מדענים בחלוקים לבנים במעבדת מחשבים.

גילויים אתיים ו"גאוסיאן ספלאטינג" נמצאים בירידה, בעוד שכמות המאמרים שהוגשו מייצגת בעיה חדשה שעומדת בפני הבינה המלאכותית בשנת 2026.

 

דעה עקבתי אחר מחקר ראייה ממוחשבת וסינתזת תמונה ב-arXiv ובאתרים קשורים במשך כשבע שנים, במגוון ערוצי תקשורת - מספיק זמן כדי להבחין בדפוסים חוזרים ובשינויים במגמות. אבל תצפיות אלה הן אנקדוטליות. אני באמת מאחל שהייתה לי זמן לנצל את מאגר הנתונים העצום ההולך וגדל המיוצג על ידי זרם הפרסומים של Arxiv בלבד, שהוא בוודאי עשיר בתובנות נסתרות, באמצעות ניתוח למידת מכונה. כפי שהדברים עומדים, אני יכול לדווח רק בצורה אגבית יותר על מה שהגיע לתשומת ליבי. מאז הפעם האחרונה ששקלתי את העניין.

נפח ב-11

רבות מהמגמות בהגשת מאמרי מחקר בבינה מלאכותית שצפיתי בהן בשנת 2024 התבססו כמגמות קבועות בשנת 2025; לא פחות חשוב מביניהן העלייה הבלתי נמנעת והמתמשכת ב... כֶּרֶך של מאמרים הקשורים לבינה מלאכותית, כשלעצמם מונעים על ידי בינה מלאכותית, עד כדי כך ש משבר נתפס:

הגשות חודשיות למדעי המחשב ב-Arxiv, אוקטובר 2023 - נובמבר 2025, עם ממוצע מתגלגל של 3 חודשים. מקור: https://arxiv.org/stats/monthly_submissions

הגשות חודשיות למדעי המחשב ב-Arxiv, אוקטובר 2023-נובמבר 2025, עם ממוצע מתגלגל של 3 חודשים.. מָקוֹר

קצב צמיחה זה התאפיין כהכפלה אקספוננציאלית בכמות הגשות המאמרים בתחום הבינה המלאכותית, לפני מספר שנים, וזה רק השתלט יותר עם הופעתו האחרונה של שיגעון השקעות בבינה מלאכותית העלתה את ההימור, כמו גם את כמות המימון הזמין למחקר הקשור לבינה מלאכותית.

נתונים סטטיסטיים מלאים לשנת 2025 אינם זמינים עדיין, והנתונים הסטטיסטיים המצטברים המוצגים לעיל מייצגים את המספרים הכלליים העולים בכל הקטגוריות. להלן ניתן לראות שמדעי המחשב ממשיכים לרכוב על מגמה דומיננטית, משמעותית מעל חברותיהם היציבות:

עלייה בהגשות מדעי המחשב בשנים 2022-2025. מקור - https://info.arxiv.org/about/reports/submission_category_by_year.html

עלייה בהגשות מדעי המחשב בשנים 2022-2025. מָקוֹר

מיון המוץ

באוקטובר, תחילת עונת הכנסים בסתיו, שתמיד מביאה עמה שטף של מחקרים חדשים, הביאה במקום זאת נפח הגשות ברמת התקפת DOS, מה שנותן דחיפה ודחיפות נוספת לתחום המחקר שעד כה לא זכה למספר מועמדים רב של ניתוח מגמות מחקרבמילים אחרות, צצים יותר ויותר מאמרים ומאגרים אשר, כשלעצמם, מבקשים לחתוך דרך יחס אות לרעש ההולך ומחמיר בזירת המחקר.

האחרון הגיע רק בשבוע שעבר, בצורה של דירוג חדשנות, מאמר ו מאגר GitHub אשר מכוון עדין תארים במשפטים כגון Qwen3-4B-Instruct-2507 ו SciBERT כדי שיוכלו לבצע סיווג בינארי של מאמרים שהוגשו (ניבוי 'חדשנות' מהגשות קודמות), או השוואת חדשנות זוגית (השוואת הגשות נוכחיות עבור 'חדשנות'):

מערכת NoveltyRank משווה את הכותרת והתקציר של הגשה לעבודות קודמות דומות, מסכמת את ההבדלים באמצעות תואר ראשון במשפטים (LLM), ומעבירה זאת למודל Qwen3-4B מכוון ומחליט אם העבודה נחשבת "חדשה מבחינה מושגית". מקור - https://arxiv.org/pdf/2512.14738

מערכת NoveltyRank משווה את הכותרת והתקציר של הגשה לעבודות קודמות דומות, מסכמת את ההבדלים באמצעות תואר ראשון במשפטים (LLM), ומעבירה זאת למודל Qwen3-4B מכוון ומחליט אם העבודה נחשבת "חדשה מבחינה מושגית". מָקוֹר

הבעיה עם גישות "ניפוי" כאלה היא האתגר של הגדרת משתנים משמעותייםגישת NoveltyRank משתמשת בקבלת מאמר לכנס כמדד לחידוש, ואולי - באופן מזלזל למדי - משתמשת בפרסום ב-Arxiv כמדד רקע של שלילי חידוש.

זה מניח שתי הנחות שגויות: ראשית, שכל ההגשות המתקבלות בכנס הן חדשות, או בעלות חשיבות, וזה בבירור לא המקרה; ושנית, שהחידוש עצמו הוא בעל ערך בלתי מוגבל. כל מי שבזבז חצי שעה על כמה מהמאמרים המפוקפקים, אפילו המגוחכים, שהוגשו - אולי - אך ורק כדי לטעון... מכסות "לפרסם או להיעלם", ידעו שחידוש הוא לעתים קרובות טריוויאלי, ועבודה הדרגתית היא לעתים קרובות משמעותית.

הבנת הערך של מאמר חדש כרוכה בתחום שבו בינה מלאכותית נמצאת כיום... חלש מאוד – לטווח ארוך הקשרבשל אופן כתיבתם, שלעתים קרובות הוא חסר כנות, מאמרים שנראים פורצי דרך יכולים להתגלות לעתים קרובות כהתקדמות קלה על עבודה קיימת; עם זאת, מערכות אוטומטיות יצטרכו לפתח "אינטואיציה" למקרים כאלה, מבלי לסמן מספר רב של תוצאות חיוביות שגויות, ומבלי להסתמך על כנותם של המחברים המגישים.

צניחה אתית

כמו שיש לי נצפה בעברפורטלים כמו Arxiv עמידים למדי בפני פייר לייז גירוד, ומאגרי הנתונים שהם מספקים לרוב חסרים פרטים מפורטים.

לכן, גם אם היו לי המשאבים והזמן להוריד ולחלץ מאפיינים מחתך רוחב מייצג כראוי של מאמרים במדעי המחשב, רבות מהמגמות העדינות יותר לא היו ממוקדות או מנותחות.

אחת מהן היא נוכחות או היעדרות של קודצילים של הצהרות אתיותארוך הכללה חובה עבור מדעי הביולוגיה הנוגעים לניסויים בבעלי חיים, שנת 2024 ראתה את שיאה של המגמה לאפיון אתי של עבודה מוצעת, בסוף הגשת המאמרים בקטגוריית מדעי המחשב.

באופן אנקדוטי, אני אומר שהנוהג הזה צנח בצורה דרמטית במהלך שנת 2025. הניחוש שלי הוא שהמאמצים הנלהבים להסרת הרגולציה של ממשלת ארה"ב הנוכחית, ביחס לפיתוח בינה מלאכותית, העניקו לקהילת המחקר, הן בארצות הברית והן בחו"ל, רישיון מוגבר מסוים ותחושה של הגנה מרומזת מפני חשיפה משפטית.

למרות זאת תמיכה בכל הנוגע לרגולציה נגד דיפפייק, הממשל האמריקאי הנוכחי החזיר למעשה חלק ניכר מעמדת "המערב הפרוע" שאפיינה את עידן 2021-23 - למרות שההקשר של מחקר מדעי טהור שהגדיר אותו התפתח מאז לרמות השקעה נלהבות, אפילו היסטוריות.

מאמרי וידאו גנרטיביים כ'שפשופי בינה מלאכותית'

עם ההשקה של Hunyuan וידאו ו-WAN סדרת וידאו יצירתית בחורף האחרון, וידאו מבוסס בינה מלאכותית עבר טרנספורמציה מלאה בשנת 2025. מחסומים ישנים כמו קושי ביצירת אווטארים בעלי גוף מלא, או של קבלת צפיות משכנעות בפרופיל של אדם, נסחפו ככל הנראה בן לילה.

ההפצות השופעות הכוללות משקלים מסוג זה מסין, ניתן לטעון, קובעים את הקצב להשקת וידאו גנרטיבי השנה, ולפחות מהווים לחץ נגדי על הנטייה של ארכיטקטורות וידאו מערביות מבוססות בינה מלאכותית להיות מצונזרות, טרום-מסחורות ומוגדרות מראש הרבה יותר.

השמיים היעדר חפיר בסצנה הדמוקרטית האירונית הזו, בהובלת CCCP, הובילה למאות, אם לא אלפי, חברות המבקשות לנצל את השוק המתהווה להסקת מסקנות על ידי הצעת פורטלים ידידותיים למשתמש, עם שחקנים מגוונים כמו civit.ai ו RunPod להרוויח מנהלים וטכנולוגיות שבמקרים רבים ניתן להריץ על מחשבים ביתיים.

באופן כללי, יוזמות אלה הן גיוסי מזומנים לטווח קצר, אשר צפויים להיגזל על ידי קונסולידציה עתידית של השוק (אם כי, אין ספק שמייסדיהן לא יתנגדו למעוד בטעות על נתח שוק דומיננטי, אם זה יקרה).

אותה שגרה ושכפול פגעו בקו הווידאו היצירתי בהגשות של Arxiv בשנת 2025. כפי שאני נצפה בשבוע שעבר, יחס אות לרעש עבור קטגוריה זו הגיע לשיא קהות חושים, כאשר חוקרים מתחרים בפומבי על סכומי המימון הפוטנציאליים העצומים שפריצות הדרך של השנה ללא ספק שחררו.

עם זאת, הרוב המכריע של הגשות מסוג זה הן במקרה הטוב התקדמות הדרגתית בלבד. בעיות הליבה שנותרו בבינה מלאכותית גנרטיבית לא צפו הרבה השנה: הצורך ב לשמור על זהות, בסגנון LoRA, לאורך כל תיאור הדמות; הצורך בזמני ריצה ארוכים יותר עבור סרטוני פלט, תוך שמירה על עקביות כוללת (כלומר, של סביבות ונושאים וכו', לא רק מזהה); ולשיפור יצירת אודיו ומניפולציה בתוך וידאו גנרטיבי וארכיטקטורות עריכת וידאו; בין היתר.

חום הרשת פוחת

בשנה שעברה ראיתי עלייה ניכרת במספר העיתונים המקדמים מערכות הממנפות CGI מסורתי (כלומר, ייצוגים מבוססי רשת מהסוג שמקורו בשנות ה-1970), או לשלב אותו במסגרות עצביותראיתי ירידה משמעותית בדחף כלפי פתרונות מבוססי רשת, במיוחד במחצית השנייה של השנה, במהלך 2025.

רבים מהפתרונות ששולבו ב-CGI בגל מאמרים קודם, במיוחד אלו שעסקו בדמויות "שליטה" אנושיות פרמטריות כגון מודלים תלת-ממדיים ניתנים לשינוי צורה, ייתכן שהוחלפו על ידי היכולות החדשות של מסגרות גנרטיביות מבוססות דיפוזיה כגון Veo, Kling, Hunyuan ו-WAN, בין רבות אחרות.

במקביל, מסמכים העוסקים בנושא גאוסיאן ספלאט נראה כי גישות אלו הושפעו גם מקיפאון התפתחותי, או כתוצאה מהאפלה על ידי מערכות הבינה המלאכותית מבוססות הדיפוזיה של 2025; או שניהם.

לפני שנה ציינתי שההתרגשות הראשונית מ-GSplat, מה שגרם ל- רושם בולט בסוף 2023, שקעה בקווי מחקר צרים יותר. השנה, אני רואה זרם של מאמרים שמטרתם לטפל בדרישות המשאבים המשמעותיות של גישה זו, בין היתר.

למרות שהייתי מאפיין את שיטת התזת גאוס כ"תקועה כרגע", עלינו לזכור שטכנולוגיה זו מתוארכת לתחילת שנות ה-1990, והיא חדשה מטבעה.

יוצא מן הכלל אחד לנסיגה הכללית הזו מגישות מבוססות רשת הוא עלייה ניכרת בעניין בשילוב בינה מלאכותית במסגרות שמטרתן הדפסה תלת-ממדית.

ירידה בהגשות אבטחת בינה מלאכותית

התצפית האחרונה שלי לשנת 2025 היא שקטגוריית ההגשות "אבטחה" במדור מדעי המחשב ב-Arxiv הראתה ירידה ניכרת בתדירות ובאיכות בשנת 2025, ולא קל לנחש מדוע.

השמיים קריפטוגרפיה ואבטחה ניתן לטעון שארכיון תמיד היה מקום סוג ב' לפרסם מאמרים, שכן באופן לא מפתיע, תחום מחקר זה נשלט על ידי קניין רוחני קנייני של המגזר הפרטי - שמעט ממנו צץ בכתבי עת אקדמיים, וכמעט אף אחד ממנו לא נראה בפלטפורמות חינמיות כמו Arxiv.

בנוסף, הגשות לקטגוריה זו ב-Arxiv מכילות מספר גבוה מהממוצע של "תפיסות" - הודאות שלא זוכות לתשומת לב מספקת, שלעתים קרובות קבורות במקומות בלתי צפויים, אשר שוללות או מפחיתות את הערך והחידוש לכאורה של המאמר. דוגמה אחת תהיה שיטת הפרת אבטחה לכאורה סנסציונית אשר למעשה מסתמכת על היבט של "קופסה לבנה" - כלומר, גישה מועדפת כלשהי לנתונים או לנהלים, כאלה שתוקף כנראה לא יוכל לאבטח.

למה לצפות ב 2026

למרות שהתקשורת היא ריפים תמיד על פריחת הבינה המלאכותית של הדור כחזרה על כשלון הפריחה והשפל של הדוט.קום של תחילת שנות ה-2000 (עם קצת התנגדות), נראה שזה למעשה מייצג סוג של ביטחון כוזב. מבחינת תשתיות, השקעות, תרבות ו מחקרים, כנראה שלא היה זמן כזה בהיסטוריה האנושית.

לכן קשה לראות לאיזה כיוון תתפתח סצנת המחקר בשנת 2026, אלא שכרגיל - מספר מאמצים ארוכי טווח יגיעו לשיאם בין עכשיו לאפריל, כאשר "חותם" מסוים של האובססיות והמגמות של 2025 יבדיל ביניהם.

התפתחות אחת שעשויה לסייע במשבר נפח ההגשות ב-Arxiv ובפורטלים אחרים, היא איסור או בדיקה של מסמכים שנוצרו/נעזרים בבינה מלאכותית, שכן Arxiv אושר לאחרונה כמאמרי סקירה – עם זאת, ייתכן שקשה לכמת את היקף מעורבותה של הבינה המלאכותית בכל מאמר מסוים, מכיוון שבינה מלאכותית כבר... חדרה לתרבות המחקרעמיתי ביקורת) ככל שפגע בתחומים אחרים – כטיפת 'דיו' שמשפיעה על כל כוס המים (הקיימת), במקום לשנות את המדיום באופן קיצוני.

 

פורסם לראשונה ביום שני, 22 בדצמבר 2025

כותב בנושא למידת מכונה, מומחה בתחום סינתזת תמונות אנושיות. ראש מחלקת תוכן מחקר לשעבר ב-Metaphysic.ai.
אתר אישי: martinanderson.ai
איש קשר: [מוגן בדוא"ל]
טוויטר: @manders_ai