בינה מלאכותית

Zephyr-7B : HuggingFace’s Hyper-Optimized LLM Built on Top of Mistral 7B

Published November 23, 2023

Updated April 28, 2026

Aayush Mittal Mittal

מבוא

התפתחותם של מודלי שפה גדולים פתוחים (LLM) השפיעה במידה ניכרת על קהילת המחקר בתחום האינטליגנציה המלאכותית, במיוחד בפיתוח צ’אטבוטים ויישומים דומים. לאחר יציאתם של מודלים כגון LLaMA, חלה עלייה במחקר בנושאי עדינות יעילה, טיפול בפרומפטים מורחב, יצירה משופרת עם אחזור (RAG) וקוונטיזציה.

מודל LLaMA, למשל, סימן תקופה חדשה בעדינות והקשר עם פרומפט, ופתח את הדרך למודלים מאוחרים יותר כגון MPT של MosaicML, RedPajama-INCITE של Together AI, Falcon של TII ו-Llama 2 של Meta. כל אחד ממודלים אלו תורם יכולות ייחודיות, משפר את התפקוד הכללי ואת היקף ה-LLM.

Mistral AI, סטארט-אפ מפריז שנוסד על ידי עובדים לשעבר של Google DeepMind ו-Meta, עשה לעצמו שם עם ההצעה הראשונה שלו: Mistral 7B.

יתרונו של Mistral 7B טמון ביעילותו, והוא מספק יכולות דומות או משופרות בהשוואה לעמיתים כגון Llama 2, אך עם פחות דרישות חישוביות.

במיוחד, Mistral 7B Instruct מצטיין במשימות הוראה, ובלט בפלטפורמות כגון Hugging Face, שם הוא עוקף מודלים אחרים באותו גודל ומתחרה בצמוד עם אלו שיש להם כמעט פי שניים פרמטרים.

בנייה על כך, Hugging Face הציגה Zephyr 7B Alpha, והראתה כי מודל Mistral 7B מעודן יכול לעקוף את היכולות של מודלים גדולים יותר ואף להתחרות ב-GPT-4 בחלק מהמשימות. ה-“Alpha” היה רק ההתחלה, כי Zephyr 7B Beta הופיע זמן קצר לאחר מכן.

מאמר זה יחקור כיצד Zephyr 7B מנצל את כוחם של מודלים גדולים יותר כדי לשפר את יכולתו להגיב ולהתאים להוראות אנושיות, תהליך המתאפשר דרך שיטת התהליך של עיבוי ידע. שיטה זו כוללת אימון מודלים קטנים יותר על בסיס הדפוסים המורכבים שלמדו מודלים גדולים יותר, תוך הפחתת דרישות האימון מבלי לוותר על יכולות המודל.

עיבוי ידע

חידוש מרכזי בפיתוח מודלים כגון Zephyr-7B הוא עיבוי ידע מפורט (dSFT). שיטה זו כוללת שימוש בפלט ממודל “מורה” גדול יותר ומתקדם יותר כדי לאמ

Related Topics:GPT LLM Mistral 7B zephyr Zephyr-7B

Aayush Mittal

ביליתי את חמש השנים האחרונות בטבילה בעולם המרתק של למידת מכונה ולמידה עמוקה. תשוקתי ומומחיותי הובילו אותי לתרום ליותר מ-50 פרויקטים שונים של הנדסת תוכנה, עם דגש מיוחד על AI/ML. סקרנותי המתמשכת גם הובילה אותי לעבר עיבוד שפה טבעית, תחום שאני שואף לחקור עוד.

Unite.AI

Zephyr-7B : HuggingFace’s Hyper-Optimized LLM Built on Top of Mistral 7B

מבוא

עיבוי ידע

You may like