ืจืืืื ืืช
Etan Ginsberg, ืืืืกื-ืฉืืชืฃ ืฉื Martian – ืกืืจืช ืจืืืื ืืช

Etan Ginsberg הוא מייסד-שותף של Martian, פלטפורמה שמרוטת באופן דינאמי כל פניה ל-LLM הטוב ביותר. דרך רוטינג, Martian משיגה ביצועים גבוהים יותר ועלות נמוכה יותר מכל ספק יחיד, כולל GPT-4. המערכת בנויה על טכנולוגיית Model Mapping ייחודית של החברה, שמפרקת LLMs מתיבות שחורות מורכבות לארכיטקטורה יותר מפורשת, מה שהופך אותה ליישום המסחרי הראשון של פרשנות מכנית.
אטאן היה מקוד, מעצב אתרים ובונה עסקים אלקטרוניים עבור לקוחות מאז שהיה בחטיבת הביניים. פולימת אטאן הוא מתמודד באליפות הזיכרון העולמית וסיים במקום ה-2 באליפות הקריאה המהירה בעולם בשנזן, סין.
הוא הוא מתמודד בהאקתון וידאו. פרסים קודמים כוללים מקום שלישי ב-Tech Crunch SZ, פיינליסט טופ 7 ב-Princeton Hackathon, ו-3 פרסי תעשייה ב-Yale Hackathon.
אתה היית מייסד-שותף של שתי חברות הזנק בעבר, מה היו החברות האלה ומה למדת מחוויה זו?
חברתי הראשונה הייתה הפלטפורמה הראשונה לקידום וקידום של ספורט American Ninja Warrior. בשנת 2012, ראיתי את American Ninja Warrior כספורט תת-קרקע (דומה ל-MMA בשנות ה-90) ויצרתי את הפלטפורמה הראשונה שבה אנשים יכולים לקנות תוכניות, להזמין מכשולים ולמצוא חדרי כושר לאימון. ייעצתי לחברות שרצו לפתוח את הגימנסיה שלהן, כולל עזרה לכוחות המיוחדים של ארצות הברית עם קורס אימון והרחבת מתקן ממחברת ל-300,000 דולר בהכנסה ב-3 החודשים הראשונים. אף על פי שהייתי בתיכון, הייתי לי החוויה הראשונה בניהול צוותים של 20+ עובדים ולמדתי על ניהול יעיל ויחסים בין-אישיים.
חברתי השנייה הייתה חברה לניהול נכסים אלטרנטיביים שהקמתי ב-2017, לפני גל ה-ICO בקריפטו. זו הייתה החשיפה הראשונה שלי ל-NLP, שבה השתמשנו בניתוח רגשות של נתוני מדיה חברתית כאסטרטגיית השקעות.
למדתי הרבה מהמיומנויות הקשות והרכות שנכנסות לרוח ההזנק – מאיך לנהל צוות להיבטים הטכניים של NLP. בו-זמנית, למדתי גם הרבה על עצמי ועל מה שרציתי לעבוד. אני מאמין שהחברות המוצלחות ביותר מוקמות על ידי מייסדים שיש להם חזון רחב יותר או מטרה שמניעה אותם. עזבתי את הקריפטו ב-2017 כדי להתמקד ב-NLP, משום ששיפור והבנת האינטליגנציה של האדם היא משהו שמניע אותי באמת. הייתי שמח לגלות את זה.
בזמן שהיית לומד באוניברסיטת פנסילבניה, עשית מחקר ב-AI, מהו המחקר הספציפי שעשית?
מחקרנו במקור התמקד בבניית יישומים של LLMs. בפרט, עבדנו על יישומים חינוכיים של LLMs ובנינו את המורה הקוגניטיבי הראשון שהונע על ידי LLM. התוצאות היו טובות מאוד – ראינו שיפור של 0.3 סטיות תקן בתוצאות התלמידים בניסויים הראשוניים – ומערכתנו שימשה מאוניברסיטת פנסילבניה עד אוניברסיטת בהוטן.
האם תוכל לדון באופן שמחקר זה הוביל אותך להקמת Martian?
משום שהיינו מבין הראשונים שבונים יישומים על גבי LLMs, היינו גם מבין הראשונים שנתקלים בבעיות שאנשים פוגשים כאשר הם בונים יישומים על גבי LLMs. זה הוביל את מחקרנו לשכבת התשתית. למשל, מאוד מוקדם, עשינו עידון של מודלים קטנים יותר על פלטי מודלים גדולים יותר כמו GPT-3, ועידון מודלים על מקורות נתונים מיוחדים עבור משימות כמו תכנות ופתרון בעיות מתמטיות. זה הוביל אותנו בסופו של דבר לבעיות של הבנת התנהגות המודל ורוטינג המודל.
מקורות השם Martian והקשר שלו לאינטליגנציה גם מעניינים, האם תוכל לשתף את סיפור הבחירה של שם זה?
חברתנו נקראה על שם קבוצה של מדענים הונגרי-אמריקאים הידועה בשם “The Martians“. קבוצה זו, שחיה במאה ה-20, הורכבה מאנשים מהחכמים ביותר שחיו אי פעם:
- המפורסם ביניהם היה John Von Neumann; הוא המציא את תורת המשחקים, ארכיטקטורת המחשב המודרנית, תורת האוטומטים ותרם תרומות מהותיות בעשרות תחומים אחרים.
- Paul Erdos היה המתמטיקאי הפורה ביותר בכל הזמנים, עם יותר מ-1500 מאמרים.
- Theodore Von Karman קבע את התאוריות הבסיסיות של אווירודינמיקה ועזר להקים את תוכנית החלל האמריקאית. הגבול המוגדר על ידי בני אדם בין כדור הארץ לחלל החיצון נקרא “קו קרמן” בהכרה לעבודתו.
- Leo Szilard המציא את פצצת האטום, טיפול בקרינה ומאיץ חלקיקים.
מדענים אלה ו-14 אחרים כמוהם (כולל ממציא הפצצה ההידרוגנית, האיש שהביא את תורת הקבוצות לפיזיקה המודרנית, ותרומות מהותיות לתחומים כמו קומבינטוריקה, תורת המספרים, ניתוח נומרי ותורת ההסתברות) חלקו דמיון מרשים – כולם נולדו באותו חלק של בודפשט. זה הוביל אנשים לשאול: מהו המקור לכל כך הרבה אינטליגנציה?
בתגובה, Szilard צחק ואמר, “המרטיאנים כבר כאן, והם קוראים לעצמם הונגרים!” במציאות… איש לא יודע.
האנושות נמצאת במצב דומה היום, ביחס לקבוצה חדשה של מוחות על-אינטליגנטיים: בינה מלאכותית. אנשים יודעים שמודלים יכולים להיות מאוד חכמים, אבל אין להם מושג איך הם עובדים.
משימתנו היא לענות על שאלה זו – להבין ולנצל את האינטליגנציה העל-אינטליגנטית המודרנית.
יש לך היסטוריה של הישגים מדהימים בזיכרון, כיצד התעניינת באתגרים אלה וכיצד ידע זה סייע לך עם המושג של Martian?
ברוב הספורט, ספורטאי מקצועי יכול לבצע טוב יותר פי 2-3 מאשר אדם ממוצע (השוואה כמה רחוק אדם ממוצע יכול לבעוט שער וכמה מהר הוא יכול לזרוק כדור ביחס לספורטאי מקצועי). ספורט זיכרון הוא מרתק משום שהספורטאים הטובים ביותר יכולים לזכור 100 פעם או אפילו 1000 פעם יותר מאדם ממוצע עם פחות אימון מרוב הספורט. בנוסף, אלה לעיתים קרובות אנשים עם זיכרון טבעי ממוצע שמייחסים את ביצועיהם לטכניקות מסוימות שכולם יכולים ללמוד. רציתי למקסם את הידע של האנושות, וראיתי את אליפות הזיכרון העולמית כתובנה מוערכת לגבי איך אנחנו יכולים להפיק תשואות יוצאות דופן בשיפור האינטליגנציה האנושית.
רציתי לפרוש טכניקות זיכרון ברחבי מערכת החינוך, לכן התחלתי לחקור כיצד NLP ו-LLMs יכולים לסייע בהפחתת עלות ההקמה שמונעת משיטות חינוך יעילות ביותר מלהיות משותפות במערכת החינוך המיינסטרימית. Yash ואני יצרנו את המורה הקוגניטיבי הראשון שהונע על ידי LLM, וזה הוביל אותנו לגלות את הבעיות עם LLM-Deployment שאנחנו עוזרים לפתור היום.
Martian בעצם מוחק את ההחלטה על איזה Large Language Model (LLM) להשתמש, למה זה כרגע נקודת כאב עבור מפתחים?
זה הופך להיות יותר ויותר קל ליצור מודלי שפה – עלות החישוב יורדת, אלגוריתמים הופכים ליעילים יותר, ויותר כלים מקור פתוחים זמינים ליצור מודלים אלה. כתוצאה מכך, יותר חברות ומפתחים יוצרים מודלים מותאמים אישית שאומנו על נתונים מותאמים. כאשר למודלים אלה יש עלויות ויכולות שונות, אתה יכול לקבל ביצועים טובים יותר על ידי שימוש במודלים מרובים, אבל זה קשה לבדוק אותם כולם ולמצוא את הנכונים להשתמש. אנחנו דואגים לזה עבור מפתחים.
האם תוכל לדון באופן שהמערכת מבינה מה LLM הוא הטוב ביותר לכל משימה ספציפית?
רוטינג טוב הוא בעצם בעיה של הבנת מודלים. כדי לרוט בין מודלים באופן יעיל, אתה רוצה להיות מסוגל להבין מה גורם להם להיכשל או להצליח. היות מסוגל להבין את האפיונים האלה עם Model Mapping מאפשר לנו לקבוע כיצד כל מודל יבצע על בקשה ללא צורך לרוץ את המודל. כתוצאה מכך, אנחנו יכולים לשלוח את הבקשה למודל שיפיק את התוצאה הטובה ביותר.
האם תוכל לדון בסוג החיסכון בעלות שיכול להיראות מאופטימיזציה של LLM שמשמש?
אנחנו מאפשרים למשתמשים לקבוע כיצד הם מסחרים בין עלות לביצועים. אם אתה דואג רק לביצועים, אנחנו יכולים לעקוף את GPT-4 על openai/evals. אם אתה מחפש עלות מסוימת כדי להפוך את הנתונים שלך לעבוד, אנחנו מאפשרים לך לקבוע את העלות המקסימלית עבור בקשתך, ואז למצוא את המודל הטוב ביותר להשלים את הבקשה. ואם אתה רוצה משהו יותר דינאמי, אנחנו מאפשרים לך לקבוע כמה אתה מוכן לשלם עבור תשובה טובה יותר – כך שאם שני מודלים הם דומים בביצועים אבל יש הבדל גדול בעלות, אנחנו יכולים לאפשר לך להשתמש במודלים הפחות יקרים. חלק מלקוחותינו ראו ירידה של עד 12 פעם בעלות.
מהו חזונך לעתיד של Martian?
כל פעם שאנחנו משפרים את ההבנה הבסיסית שלנו של מודלים, זה גורם לשינוי תפיסה ב-AI. עידון הוא התפיסה שנהוגה על ידי הבנת פלט. רמיזה היא התפיסה שנהוגה על ידי הבנת קלט. הבדל זה בהבנתנו של מודלים הוא הרבה מה שמבדיל בין ML מסורתי (“תנו לי לאמן מודל רגרסיה”) ל-AI יוצרת מודרנית (“תנו לי לרמוז ל-AGI תינוק”).
מטרתנו היא לספק התפתחויות חדשות באופן עקבי בתחום הפרשנות עד ש-AI תהיה מובנת לחלוטין ונהיה בעלי תורת אינטליגנציה חזקה כמו תורות הלוגיקה או החשבון.
לנו, זה אומר בנייה. זה אומר יצירת כלים AI מדהימים ומקשים אותם בידי אנשים. זה אומר שחרור דברים ששוברים את הטיפוס, שאיש לא עשה לפני, וש-מעניינים ושימושיים מעל הכל.
במילותיו של סר פרנסיס בייקון, “ידע הוא כוח”. לפיכך, הדרך הטובה ביותר לוודא שאנחנו מבינים AI היא לשחרר כלים חזקים. בדעתנו, מרוטר מודל הוא כלי מסוג זה. אנחנו שמחים לבנות אותו, לגדל אותו ולשים אותו בידי אנשים.
זהו הכלי הראשון מבין רבים שאנחנו הולכים לשחרר בחודשים הקרובים. כדי לגלות תורה יפה של בינה מלאכותית, לאפשר תשתיות AI חדשות לגמרי, לעזור לבנות עתיד יותר בהיר עבור האדם והמכונה – אנחנו לא יכולים לחכות לשתפם את הכלים האלה איתכם.
תודה על הראיון הנהדר, קוראים שרוצים ללמוד יותר צריכים לבקר ב-Martian.












