Connect with us

рдорд╛рдЗрдХреНрд░реЛрд╕реЙрдлреНрдЯ рдХреЗ Phi-3 рдорд┐рдиреА рдХреЗ рдЕрдВрджрд░: рдПрдХ рд╣рд▓реНрдХреЗ рд╡рдЬрди рд╡рд╛рд▓рд╛ рдПрдЖрдИ рдореЙрдбрд▓ рдЬреЛ рдЕрдкрдиреЗ рд╡рдЬрди рд╕реЗ рдКрдкрд░ рдореБрдХреНрдХрд╛ рдорд╛рд░рддрд╛ рд╣реИ

рдХреГрддреНрд░рд┐рдо рдмреБрджреНрдзрд┐рдорддреНрддрд╛

рдорд╛рдЗрдХреНрд░реЛрд╕реЙрдлреНрдЯ рдХреЗ Phi-3 рдорд┐рдиреА рдХреЗ рдЕрдВрджрд░: рдПрдХ рд╣рд▓реНрдХреЗ рд╡рдЬрди рд╡рд╛рд▓рд╛ рдПрдЖрдИ рдореЙрдбрд▓ рдЬреЛ рдЕрдкрдиреЗ рд╡рдЬрди рд╕реЗ рдКрдкрд░ рдореБрдХреНрдХрд╛ рдорд╛рд░рддрд╛ рд╣реИ

mm
Phi-3 : A Highly Capable Language Model Locally on Your Phone

माइक्रोसॉफ्ट ने हाल ही में अपने नवीनतम हल्के भाषा मॉडल को Phi-3 मिनी नामक एक तिकोनी कompact एआई मॉडल के रूप में पेश किया है, जो कि सीमित कंप्यूटिंग संसाधनों वाले उपकरणों पर कुशलता से चलने के लिए डिज़ाइन किए गए हैं। केवल 3.8 बिलियन पैरामीटर के साथ, Phi-3 मिनी जीपीटी-4 जैसे एआई दिग्गजों के आकार का एक अंश है, फिर भी यह कई क्षेत्रों में उनकी क्षमताओं को मैच करने का वादा करता है।

Phi-3 मिनी का विकास उन्नत एआई क्षमताओं को व्यापक हार्डवेयर श्रृंखला पर सुलभ बनाने की दिशा में एक महत्वपूर्ण मील का पत्थर है। इसका छोटा आकार इसे स्मार्टफोन, टैबलेट और अन्य एज डिवाइस पर स्थानीय रूप से तैनात करने की अनुमति देता है, जो क्लाउड-आधारित मॉडल से जुड़े विलंबता और गोपनीयता चिंताओं को दूर करता है। यह विभिन्न डोमेन में बुद्धिमान ऑन-डिवाइस अनुभवों के लिए नए अवसर खोलता है, जिनमें वर्चुअल सहायक, संवादात्मक एआई, कोडिंग सहायक और भाषा समझने के कार्य शामिल हैं।

4-рдмрд┐рдЯ рд╕рдВрдХреНрд╖рд┐рдкреНрдд phi-3-mini рдЖрдИрдлрд╝реЛрди рдкрд░ рд╕реНрд╡рджреЗрд╢реА рд░реВрдк рд╕реЗ рдЪрд▓ рд░рд╣рд╛ рд╣реИ
4-बिट संक्षिप्त phi-3-mini आईफ़ोन पर स्वदेशी रूप से चल रहा है

अंदर की कहानी: आर्किटेक्चर और प्रशिक्षण

मूल रूप से, Phi-3 मिनी एक ट्रांसफॉर्मर डिकोडर मॉडल है जो ओपन-सोर्स लामा -2 मॉडल के समान आर्किटेक्चर पर बनाया गया है। इसमें 32 परतें, 3072 छिपी हुई आयाम और 32 ध्यान देने वाले सिर हैं, जिसमें 4,000 टोकन की डिफ़ॉल्ट संदर्भ लंबाई है। माइक्रोसॉफ्ट ने लॉन्गरोप जैसी तकनीकों का उपयोग करके 128,000 टोकन तक संदर्भ लंबाई बढ़ाने वाले एक लंबे संदर्भ संस्करण को भी पेश किया है, जिसे Phi-3 मिनी-128K कहा जाता है।

हालांकि, जो Phi-3 मिनी को अलग करता है वह इसकी प्रशिक्षण विधि है। बड़े डेटासेट और कंप्यूट शक्ति के बल पर भरोसा करने के बजाय, माइक्रोसॉफ्ट ने एक उच्च गुणवत्ता वाले, तर्कसंगत घने प्रशिक्षण डेटासेट को बनाने पर ध्यान केंद्रित किया है। यह डेटा भारी फ़िल्टर्ड वेब डेटा और बड़े भाषा मॉडल द्वारा उत्पन्न सिंथेटिक डेटा से बना है।

рдирдП Phi-3 рдореЙрдбрд▓ рдХреА рдЧреБрдгрд╡рддреНрддрд╛, рдЬреИрд╕рд╛ рдХрд┐ Massive Multitask Language Understanding (MMLU) рдмреЗрдВрдЪрдорд╛рд░реНрдХ рдкрд░ рдкреНрд░рджрд░реНрд╢рди рджреНрд╡рд╛рд░рд╛ рдорд╛рдкрд╛ рдЬрд╛рддрд╛ рд╣реИ
नए Phi-3 मॉडल की गुणवत्ता, जैसा कि Massive Multitask Language Understanding (MMLU) बेंचमार्क पर प्रदर्शन द्वारा मापा जाता है

यह डेटा-केंद्रित दृष्टिकोण ने परिणाम दिया है, क्योंकि Phi-3 मिनी विभिन्न अकादमिक बेंचमार्क पर उल्लेखनीय प्रदर्शन प्राप्त करता है, अक्सर बड़े मॉडलों को पीछे छोड़ देता है। उदाहरण के लिए, यह मल्टी-टास्क लर्निंग और समझने के लिए एमएमएलयू बेंचमार्क पर 69% स्कोर करता है और गणितीय तर्क के लिए एमटी-बेंच पर 8.38 – परिणाम जो मिक्सट्रल 8x7B और जीपीटी-3.5 जैसे मॉडलों के साथ तुलना करते हैं।

सुरक्षा और मजबूतता

इसके प्रभावशाली प्रदर्शन के साथ-साथ, माइक्रोसॉफ्ट ने Phi-3 मिनी के विकास में सुरक्षा और मजबूतता पर मजबूत जोर दिया है। मॉडल को पर्यवेक्षित फाइन-ट्यूनिंग (एसएफटी) और डायरेक्ट प्राथमिकता अनुकूलन (डीपीओ) के साथ एक कठोर पोस्ट-ट्रेनिंग प्रक्रिया से गुजरना पड़ा है।

एसएफटी चरण में गणित, कोडिंग, तर्क, बातचीत, मॉडल पहचान और सुरक्षा सहित विभिन्न डोमेन में उच्च स्तर से फ़िल्टर्ड डेटा का लाभ उठाया जाता है। यह मॉडल की क्षमताओं को इन क्षेत्रों में मजबूत करने में मदद करता है जबकि एक मजबूत पहचान और नैतिक व्यवहार की भावना पैदा करता है।

डीपीओ चरण, दूसरी ओर, अवांछित व्यवहार से मॉडल को दूर करने पर केंद्रित है, जो अस्वीकृत प्रतिक्रियाओं का उपयोग नकारात्मक उदाहरणों के रूप में करता है। यह प्रक्रिया चैट फॉर्मेट डेटा, तर्क कार्यों और जिम्मेदार एआई (आरएआई) प्रयासों को कवर करती है, यह सुनिश्चित करती है कि Phi-3 मिनी माइक्रोसॉफ्ट के नैतिक और विश्वसनीय एआई के सिद्धांतों का पालन करता है।

इसकी सुरक्षा प्रोफ़ाइल को और मजबूत बनाने के लिए, Phi-3 मिनी को दर्जनों आरएआई हानि श्रेणियों में व्यापक रेड-टीमिंग और स्वचालित परीक्षण के अधीन किया गया है। माइक्रोसॉफ्ट में एक स्वतंत्र रेड टीम ने मॉडल की जांच की, सुधार के लिए क्षेत्रों की पहचान की, जिन्हें बाद में अतिरिक्त क्यूरेटेड डेटासेट और पुनः प्रशिक्षण के माध्यम से संबोधित किया गया।

इस बहुस्तरीय दृष्टिकोण ने हानिकारक प्रतिक्रियाओं, तथ्यात्मक अशुद्धियों और पूर्वाग्रहों की घटना को काफी कम कर दिया है, जैसा कि माइक्रोसॉफ्ट के आंतरिक आरएआई बेंचमार्क द्वारा प्रदर्शित किया गया है। उदाहरण के लिए, मॉडल में हानिकारक सामग्री जारी रखने (0.75%) और सारांश (10%) के लिए कम दोष दर प्रदर्शित करता है, साथ ही साथ दिए गए संदर्भ में इसकी प्रतिक्रियाओं को दृढ़ता से जमीन पर रखते हुए एक कम दर अनियंत्रितता (0.603) है।

अनुप्रयोग और उपयोग के मामले

इसके प्रभावशाली प्रदर्शन और मजबूत सुरक्षा उपायों के साथ, Phi-3 मिनी विशेष रूप से संसाधन-सीमित वातावरण और विलंबता-बाध्य परिदृश्यों में विभिन्न अनुप्रयोगों के लिए उपयुक्त है।

एक सबसे रोमांचक संभावना मोबाइल डिवाइस पर सीधे बुद्धिमान वर्चुअल सहायक और संवादात्मक एआई की तैनाती है। स्थानीय रूप से चलने से, ये सहायक तुरंत प्रतिक्रिया दे सकते हैं बिना नेटवर्क कनेक्शन की आवश्यकता के, साथ ही साथ यह सुनिश्चित करते हुए कि संवेदनशील डेटा डिवाइस पर रहता है, गोपनीयता चिंताओं को दूर करता है।

Phi-3 मिनी की मजबूत तर्क क्षमता इसे कोडिंग सहायता और गणितीय समस्या समाधान के लिए एक मूल्यवान संपत्ति बनाती है। डेवलपर और छात्र डिवाइस पर कोड पूर्णता, बग पता लगाने और व्याख्या से लाभान्वित हो सकते हैं, जो विकास और सीखने की प्रक्रिया को सुव्यवस्थित करते हैं।

इन अनुप्रयोगों के परे, मॉडल की बहुमुखी प्रतिभा भाषा समझ, पाठ सारांश और प्रश्न उत्तर देने जैसे क्षेत्रों में अवसर खोलती है। इसका छोटा आकार और कुशलता इसे विभिन्न उपकरणों और प्रणालियों में एआई क्षमताओं को एम्बेड करने के लिए एक आकर्षक विकल्प बनाती है, स्मार्ट होम उपकरणों से लेकर औद्योगिक स्वचालन प्रणालियों तक।

आगे देखते हुए: Phi-3 छोटा और Phi-3 मध्यम

जबकि Phi-3 मिनी अपने आप में एक उल्लेखनीय उपलब्धि है, माइक्रोसॉफ्ट के पास Phi-3 परिवार के लिए और भी बड़ी योजनाएं हैं। कंपनी ने पहले से ही दो बड़े मॉडल, Phi-3 छोटा (7 बिलियन पैरामीटर) और Phi-3 मध्यम (14 बिलियन पैरामीटर) का पूर्वावलोकन किया है, जो कॉम्पैक्ट भाषा मॉडल के लिए प्रदर्शन की सीमाओं को आगे बढ़ाने की उम्मीद है।

Phi-3 छोटा, उदाहरण के लिए, एक अधिक उन्नत टोकनाइज़र (टिक्टोकन) और एक समूहकृत-प्रश्न ध्यान तंत्र का लाभ उठाता है, साथ ही एक नोवेल ब्लॉकस्पार्स ध्यान परत का उपयोग करके अपने मेमोरी फुटप्रिंट को अनुकूलित करता है, जबकि लंबे संदर्भ पुनर्प्राप्ति प्रदर्शन को बनाए रखता है। इसमें कई भाषाओं में भाषा समझ और पीढ़ी में इसकी क्षमताओं को बढ़ाने के लिए अतिरिक्त 10% बहुसांस्कृतिक डेटा शामिल है।

Phi-3 मध्यम, दूसरी ओर, एक महत्वपूर्ण पैमाने पर एक कदम है, जिसमें 40 परतें, 40 ध्यान देने वाले सिर और 5,120 का एम्बेडिंग आयाम है। जबकि माइक्रोसॉफ्ट नोट करता है कि कुछ बेंचमार्क मॉडल की बढ़ी हुई क्षमता का पूरी तरह से लाभ उठाने के लिए प्रशिक्षण डेटा मिश्रण को और परिष्कृत करने की आवश्यकता हो सकती है, प्रारंभिक परिणाम आशाजनक हैं, एमएमएलयू, ट्रिवियाक्यूए और ह्यूमनइवल जैसे कार्यों पर Phi-3 छोटे पर महत्वपूर्ण सुधार के साथ।

सीमाएं और भविष्य के दिशानिर्देश

इसकी प्रभावशाली क्षमताओं के बावजूद, Phi-3 मिनी की अपनी सीमाएं हैं, जैसा कि सभी भाषा मॉडल में है। सबसे उल्लेखनीय कमजोरियों में से एक इसकी वास्तविक ज्ञान को संग्रहीत करने की सीमित क्षमता है, जैसा कि ट्रिवियाक्यूए जैसे बेंचमार्क पर इसके निचले प्रदर्शन से स्पष्ट है।

हालांकि, माइक्रोसॉफ्ट का मानना है कि इस सीमा को मॉडल को खोज इंजन क्षमताओं के साथ बढ़ाकर कम किया जा सकता है, जिससे यह प्रासंगिक जानकारी को आवश्यकतानुसार पुनर्प्राप्त और तर्क कर सके। यह दृष्टिकोण हगिंग फेस चैट-यूआई में प्रदर्शित किया गया है, जहां Phi-3 मिनी अपनी प्रतिक्रियाओं को बढ़ाने के लिए खोज का लाभ उठा सकता है।

एक और क्षेत्र में सुधार की आवश्यकता है मॉडल की बहुसांस्कृतिक क्षमता। जबकि Phi-3 छोटे ने अतिरिक्त बहुसांस्कृतिक डेटा को शामिल करके प्रारंभिक कदम उठाए हैं, कॉम्पैक्ट मॉडल की संभावनाओं को पूरी तरह से अनलॉक करने के लिए आगे का काम करने की आवश्यकता है।

निष्कर्ष

माइक्रोसॉफ्ट का Phi-3 मिनी उन्नत एआई क्षमताओं के लोकतंत्रीकरण में एक महत्वपूर्ण छलांग है। राज्य-ऑफ-द-आर्ट प्रदर्शन को एक कॉम्पैक्ट, संसाधन-कुशल पैकेज में वितरित करके, यह विभिन्न अनुप्रयोगों में बुद्धिमान ऑन-डिवाइस अनुभवों के लिए नए अवसर खोलता है।

मॉडल की नवाचारी प्रशिक्षण दृष्टिकोण, जो बड़े डेटासेट और कंप्यूट शक्ति पर भरोसा करने के बजाय उच्च गुणवत्ता वाले, तर्कसंगत घने प्रशिक्षण डेटा पर जोर देता है, एक खेल परिवर्तक साबित हुआ है, जिससे Phi-3 मिनी अपने वजन वर्ग से ऊपर मुक्का मार सकता है। इसके मजबूत सुरक्षा उपायों और निरंतर विकास प्रयासों के साथ, Phi-3 मॉडल परिवार बुद्धिमान प्रणालियों के भविष्य को आकार देने में एक महत्वपूर्ण भूमिका निभाने के लिए तैयार है, एआई को अधिक सुलभ, कुशल और विश्वसनीय बना रहा है।

जैसा कि तकनीकी उद्योग एआई के साथ संभावित की सीमाओं को आगे बढ़ाता है, माइक्रोसॉफ्ट की कॉम्पैक्ट, उच्च-प्रदर्शन वाले मॉडल जैसे Phi-3 मिनी पर प्रतिबद्धता “बड़ा ही बेहतर” होने की पारंपरिक बुद्धिमत्ता से एक ताज़ा विचलन का प्रतिनिधित्व करती है। यह दिखाकर कि आकार सब कुछ नहीं है, Phi-3 मिनी एआई के मूल्य और प्रभाव को अधिकतम करने के लिए बुद्धिमान डेटा क्यूरेशन, सोच-समझकर मॉडल डिज़ाइन और जिम्मेदार विकास अभ्यास पर ध्यान केंद्रित एक नए नवाचार लहर को प्रेरित करने की क्षमता रखता है।

рдореИрдВ рдкрд┐рдЫрд▓реЗ рдкрд╛рдВрдЪ рд╡рд░реНрд╖реЛрдВ рд╕реЗ рдорд╢реАрди рд▓рд░реНрдирд┐рдВрдЧ рдФрд░ рдбреАрдк рд▓рд░реНрдирд┐рдВрдЧ рдХреА рдЖрдХрд░реНрд╖рдХ рджреБрдирд┐рдпрд╛ рдореЗрдВ рдЦреБрдж рдХреЛ рдбреВрдмрд╛ рд░рд╣рд╛ рд╣реВрдВред рдореЗрд░рд╛ рдЬреБрдиреВрди рдФрд░ рд╡рд┐рд╢реЗрд╖рдЬреНрдЮрддрд╛ рдиреЗ рдореБрдЭреЗ 50 рд╕реЗ рдЕрдзрд┐рдХ рд╡рд┐рд╡рд┐рдз рд╕реЙрдлреНрдЯрд╡реЗрдпрд░ рдЗрдВрдЬреАрдирд┐рдпрд░рд┐рдВрдЧ рдкрд░рд┐рдпреЛрдЬрдирд╛рдУрдВ рдореЗрдВ рдпреЛрдЧрджрд╛рди рджреЗрдиреЗ рдХреЗ рд▓рд┐рдП рдкреНрд░реЗрд░рд┐рдд рдХрд┐рдпрд╛ рд╣реИ, рдЬрд┐рд╕рдореЗрдВ рд╡рд┐рд╢реЗрд╖ рд░реВрдк рд╕реЗ рдПрдЖрдИ/рдПрдордПрд▓ рдкрд░ рдзреНрдпрд╛рди рдХреЗрдВрджреНрд░рд┐рдд рдХрд┐рдпрд╛ рдЧрдпрд╛ рд╣реИред рдореЗрд░реА рд▓рдЧрд╛рддрд╛рд░ рдЬрд┐рдЬреНрдЮрд╛рд╕рд╛ рдиреЗ рдореБрдЭреЗ рдкреНрд░рд╛рдХреГрддрд┐рдХ рднрд╛рд╖рд╛ рдкреНрд░рд╕рдВрд╕реНрдХрд░рдг рдХреА рдУрд░ рдЖрдХрд░реНрд╖рд┐рдд рдХрд┐рдпрд╛ рд╣реИ, рдЬреЛ рдПрдХ рдХреНрд╖реЗрддреНрд░ рд╣реИ рдЬрд┐рд╕реЗ рдореИрдВ рдЖрдЧреЗ рдЕрдиреНрд╡реЗрд╖рдг рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдЙрддреНрд╕реБрдХ рд╣реВрдВред