कृत्रिम बुद्धिमत्ता

माइक्रोसॉफ्ट के Phi-3 मिनी के अंदर: एक हल्के वजन वाला एआई मॉडल जो अपने वजन से ऊपर मुक्का मारता है

Published May 1, 2024

Updated April 27, 2026

Aayush Mittal Mittal

माइक्रोसॉफ्ट ने हाल ही में अपने नवीनतम हल्के भाषा मॉडल को Phi-3 मिनी नामक एक तिकोनी कompact एआई मॉडल के रूप में पेश किया है, जो कि सीमित कंप्यूटिंग संसाधनों वाले उपकरणों पर कुशलता से चलने के लिए डिज़ाइन किए गए हैं। केवल 3.8 बिलियन पैरामीटर के साथ, Phi-3 मिनी जीपीटी-4 जैसे एआई दिग्गजों के आकार का एक अंश है, फिर भी यह कई क्षेत्रों में उनकी क्षमताओं को मैच करने का वादा करता है।

Phi-3 मिनी का विकास उन्नत एआई क्षमताओं को व्यापक हार्डवेयर श्रृंखला पर सुलभ बनाने की दिशा में एक महत्वपूर्ण मील का पत्थर है। इसका छोटा आकार इसे स्मार्टफोन, टैबलेट और अन्य एज डिवाइस पर स्थानीय रूप से तैनात करने की अनुमति देता है, जो क्लाउड-आधारित मॉडल से जुड़े विलंबता और गोपनीयता चिंताओं को दूर करता है। यह विभिन्न डोमेन में बुद्धिमान ऑन-डिवाइस अनुभवों के लिए नए अवसर खोलता है, जिनमें वर्चुअल सहायक, संवादात्मक एआई, कोडिंग सहायक और भाषा समझने के कार्य शामिल हैं।

: 4-बिट संक्षिप्त phi-3-mini आईफ़ोन पर स्वदेशी रूप से चल रहा है

अंदर की कहानी: आर्किटेक्चर और प्रशिक्षण

मूल रूप से, Phi-3 मिनी एक ट्रांसफॉर्मर डिकोडर मॉडल है जो ओपन-सोर्स लामा -2 मॉडल के समान आर्किटेक्चर पर बनाया गया है। इसमें 32 परतें, 3072 छिपी हुई आयाम और 32 ध्यान देने वाले सिर हैं, जिसमें 4,000 टोकन की डिफ़ॉल्ट संदर्भ लंबाई है। माइक्रोसॉफ्ट ने लॉन्गरोप जैसी तकनीकों का उपयोग करके 128,000 टोकन तक संदर्भ लंबाई बढ़ाने वाले एक लंबे संदर्भ संस्करण को भी पेश किया है, जिसे Phi-3 मिनी-128K कहा जाता है।

हालांकि, जो Phi-3 मिनी को अलग करता है वह इसकी प्रशिक्षण विधि है। बड़े डेटासेट और कंप्यूट शक्ति के बल पर भरोसा करने के बजाय, माइक्रोसॉफ्ट ने एक उच्च गुणवत्ता वाले, तर्कसंगत घने प्रशिक्षण डेटासेट को बनाने पर ध्यान केंद्रित किया है। यह डेटा भारी फ़िल्टर्ड वेब डेटा और बड़े भाषा मॉडल द्वारा उत्पन्न सिंथेटिक डेटा से बना है।

: नए Phi-3 मॉडल की गुणवत्ता, जैसा कि Massive Multitask Language Understanding (MMLU) बेंचमार्क पर प्रदर्शन द्वारा मापा जाता है

यह डेटा-केंद्रित दृष्टिकोण ने परिणाम दिया है, क्योंकि Phi-3 मिनी विभिन्न अकादमिक बेंचमार्क पर उल्लेखनीय प्रदर्शन प्राप्त करता है, अक्सर बड़े मॉडलों को पीछे छोड़ देता है। उदाहरण के लिए, यह मल्टी-टास्क लर्निंग और समझने के लिए एमएमएलयू बेंचमार्क पर 69% स्कोर करता है और गणितीय तर्क के लिए एमटी-बेंच पर 8.38 – परिणाम जो मिक्सट्रल 8x7B और जीपीटी-3.5 जैसे मॉडलों के साथ तुलना करते हैं।

सुरक्षा और मजबूतता

इसके प्रभावशाली प्रदर्शन के साथ-साथ, माइक्रोसॉफ्ट ने Phi-3 मिनी के विकास में सुरक्षा और मजबूतता पर मजबूत जोर दिया है। मॉडल को पर्यवेक्षित फाइन-ट्यूनिंग (एसएफटी) और डायरेक्ट प्राथमिकता अनुकूलन (डीपीओ) के साथ एक कठोर पोस्ट-ट्रेनिंग प्रक्रिया से गुजरना पड़ा है।

एसएफटी चरण में गणित, कोडिंग, तर्क, बातचीत, मॉडल पहचान और सुरक्षा सहित विभिन्न डोमेन में उच्च स्तर से फ़िल्टर्ड डेटा का लाभ उठाया जाता है। यह मॉडल की क्षमताओं को इन क्षेत्रों में मजबूत करने में मदद करता है जबकि एक मजबूत पहचान और नैतिक व्यवहार की भावना पैदा करता है।

डीपीओ चरण, दूसरी ओर, अवांछित व्यवहार से मॉडल को दूर करने पर केंद्रित है, जो अस्वीकृत प्रतिक्रियाओं का उपयोग नकारात्मक उदाहरणों के रूप में करता है। यह प्रक्रिया चैट फॉर्मेट डेटा, तर्क कार्यों और जिम्मेदार एआई (आरएआई) प्रयासों को कवर करती है, यह सुनिश्चित करती है कि Phi-3 मिनी माइक्रोसॉफ्ट के नैतिक और विश्वसनीय एआई के सिद्धांतों का पालन करता है।

इसकी सुरक्षा प्रोफ़ाइल को और मजबूत बनाने के लिए, Phi-3 मिनी को दर्जनों आरएआई हानि श्रेणियों में व्यापक रेड-टीमिंग और स्वचालित परीक्षण के अधीन किया गया है। माइक्रोसॉफ्ट में एक स्वतंत्र रेड टीम ने मॉडल की जांच की, सुधार के लिए क्षेत्रों की पहचान की, जिन्हें बाद में अतिरिक्त क्यूरेटेड डेटासेट और पुनः प्रशिक्षण के माध्यम से संबोधित किया गया।

इस बहुस्तरीय दृष्टिकोण ने हानिकारक प्रतिक्रियाओं, तथ्यात्मक अशुद्धियों और पूर्वाग्रहों की घटना को काफी कम कर दिया है, जैसा कि माइक्रोसॉफ्ट के आंतरिक आरएआई बेंचमार्क द्वारा प्रदर्शित किया गया है। उदाहरण के लिए, मॉडल में हानिकारक सामग्री जारी रखने (0.75%) और सारांश (10%) के लिए कम दोष दर प्रदर्शित करता है, साथ ही साथ दिए गए संदर्भ में इसकी प्रतिक्रियाओं को दृढ़ता से जमीन पर रखते हुए एक कम दर अनियंत्रितता (0.603) है।

अनुप्रयोग और उपयोग के मामले

इसके प्रभावशाली प्रदर्शन और मजबूत सुरक्षा उपायों के साथ, Phi-3 मिनी विशेष रूप से संसाधन-सीमित वातावरण और विलंबता-बाध्य परिदृश्यों में विभिन्न अनुप्रयोगों के लिए उपयुक्त है।

एक सबसे रोमांचक संभावना मोबाइल डिवाइस पर सीधे बुद्धिमान वर्चुअल सहायक और संवादात्मक एआई की तैनाती है। स्थानीय रूप से चलने से, ये सहायक तुरंत प्रतिक्रिया दे सकते हैं बिना नेटवर्क कनेक्शन की आवश्यकता के, साथ ही साथ यह सुनिश्चित करते हुए कि संवेदनशील डेटा डिवाइस पर रहता है, गोपनीयता चिंताओं को दूर करता है।

Phi-3 मिनी की मजबूत तर्क क्षमता इसे कोडिंग सहायता और गणितीय समस्या समाधान के लिए एक मूल्यवान संपत्ति बनाती है। डेवलपर और छात्र डिवाइस पर कोड पूर्णता, बग पता लगाने और व्याख्या से लाभान्वित हो सकते हैं, जो विकास और सीखने की प्रक्रिया को सुव्यवस्थित करते हैं।

इन अनुप्रयोगों के परे, मॉडल की बहुमुखी प्रतिभा भाषा समझ, पाठ सारांश और प्रश्न उत्तर देने जैसे क्षेत्रों में अवसर खोलती है। इसका छोटा आकार और कुशलता इसे विभिन्न उपकरणों और प्रणालियों में एआई क्षमताओं को एम्बेड करने के लिए एक आकर्षक विकल्प बनाती है, स्मार्ट होम उपकरणों से लेकर औद्योगिक स्वचालन प्रणालियों तक।

आगे देखते हुए: Phi-3 छोटा और Phi-3 मध्यम

जबकि Phi-3 मिनी अपने आप में एक उल्लेखनीय उपलब्धि है, माइक्रोसॉफ्ट के पास Phi-3 परिवार के लिए और भी बड़ी योजनाएं हैं। कंपनी ने पहले से ही दो बड़े मॉडल, Phi-3 छोटा (7 बिलियन पैरामीटर) और Phi-3 मध्यम (14 बिलियन पैरामीटर) का पूर्वावलोकन किया है, जो कॉम्पैक्ट भाषा मॉडल के लिए प्रदर्शन की सीमाओं को आगे बढ़ाने की उम्मीद है।

Phi-3 छोटा, उदाहरण के लिए, एक अधिक उन्नत टोकनाइज़र (टिक्टोकन) और एक समूहकृत-प्रश्न ध्यान तंत्र का लाभ उठाता है, साथ ही एक नोवेल ब्लॉकस्पार्स ध्यान परत का उपयोग करके अपने मेमोरी फुटप्रिंट को अनुकूलित करता है, जबकि लंबे संदर्भ पुनर्प्राप्ति प्रदर्शन को बनाए रखता है। इसमें कई भाषाओं में भाषा समझ और पीढ़ी में इसकी क्षमताओं को बढ़ाने के लिए अतिरिक्त 10% बहुसांस्कृतिक डेटा शामिल है।

Phi-3 मध्यम, दूसरी ओर, एक महत्वपूर्ण पैमाने पर एक कदम है, जिसमें 40 परतें, 40 ध्यान देने वाले सिर और 5,120 का एम्बेडिंग आयाम है। जबकि माइक्रोसॉफ्ट नोट करता है कि कुछ बेंचमार्क मॉडल की बढ़ी हुई क्षमता का पूरी तरह से लाभ उठाने के लिए प्रशिक्षण डेटा मिश्रण को और परिष्कृत करने की आवश्यकता हो सकती है, प्रारंभिक परिणाम आशाजनक हैं, एमएमएलयू, ट्रिवियाक्यूए और ह्यूमनइवल जैसे कार्यों पर Phi-3 छोटे पर महत्वपूर्ण सुधार के साथ।

सीमाएं और भविष्य के दिशानिर्देश

इसकी प्रभावशाली क्षमताओं के बावजूद, Phi-3 मिनी की अपनी सीमाएं हैं, जैसा कि सभी भाषा मॉडल में है। सबसे उल्लेखनीय कमजोरियों में से एक इसकी वास्तविक ज्ञान को संग्रहीत करने की सीमित क्षमता है, जैसा कि ट्रिवियाक्यूए जैसे बेंचमार्क पर इसके निचले प्रदर्शन से स्पष्ट है।

हालांकि, माइक्रोसॉफ्ट का मानना है कि इस सीमा को मॉडल को खोज इंजन क्षमताओं के साथ बढ़ाकर कम किया जा सकता है, जिससे यह प्रासंगिक जानकारी को आवश्यकतानुसार पुनर्प्राप्त और तर्क कर सके। यह दृष्टिकोण हगिंग फेस चैट-यूआई में प्रदर्शित किया गया है, जहां Phi-3 मिनी अपनी प्रतिक्रियाओं को बढ़ाने के लिए खोज का लाभ उठा सकता है।

एक और क्षेत्र में सुधार की आवश्यकता है मॉडल की बहुसांस्कृतिक क्षमता। जबकि Phi-3 छोटे ने अतिरिक्त बहुसांस्कृतिक डेटा को शामिल करके प्रारंभिक कदम उठाए हैं, कॉम्पैक्ट मॉडल की संभावनाओं को पूरी तरह से अनलॉक करने के लिए आगे का काम करने की आवश्यकता है।

निष्कर्ष

माइक्रोसॉफ्ट का Phi-3 मिनी उन्नत एआई क्षमताओं के लोकतंत्रीकरण में एक महत्वपूर्ण छलांग है। राज्य-ऑफ-द-आर्ट प्रदर्शन को एक कॉम्पैक्ट, संसाधन-कुशल पैकेज में वितरित करके, यह विभिन्न अनुप्रयोगों में बुद्धिमान ऑन-डिवाइस अनुभवों के लिए नए अवसर खोलता है।

मॉडल की नवाचारी प्रशिक्षण दृष्टिकोण, जो बड़े डेटासेट और कंप्यूट शक्ति पर भरोसा करने के बजाय उच्च गुणवत्ता वाले, तर्कसंगत घने प्रशिक्षण डेटा पर जोर देता है, एक खेल परिवर्तक साबित हुआ है, जिससे Phi-3 मिनी अपने वजन वर्ग से ऊपर मुक्का मार सकता है। इसके मजबूत सुरक्षा उपायों और निरंतर विकास प्रयासों के साथ, Phi-3 मॉडल परिवार बुद्धिमान प्रणालियों के भविष्य को आकार देने में एक महत्वपूर्ण भूमिका निभाने के लिए तैयार है, एआई को अधिक सुलभ, कुशल और विश्वसनीय बना रहा है।

जैसा कि तकनीकी उद्योग एआई के साथ संभावित की सीमाओं को आगे बढ़ाता है, माइक्रोसॉफ्ट की कॉम्पैक्ट, उच्च-प्रदर्शन वाले मॉडल जैसे Phi-3 मिनी पर प्रतिबद्धता “बड़ा ही बेहतर” होने की पारंपरिक बुद्धिमत्ता से एक ताज़ा विचलन का प्रतिनिधित्व करती है। यह दिखाकर कि आकार सब कुछ नहीं है, Phi-3 मिनी एआई के मूल्य और प्रभाव को अधिकतम करने के लिए बुद्धिमान डेटा क्यूरेशन, सोच-समझकर मॉडल डिज़ाइन और जिम्मेदार विकास अभ्यास पर ध्यान केंद्रित एक नए नवाचार लहर को प्रेरित करने की क्षमता रखता है।

Aayush Mittal

मैं पिछले पांच वर्षों से मशीन लर्निंग और डीप लर्निंग की आकर्षक दुनिया में खुद को डूबा रहा हूं। मेरा जुनून और विशेषज्ञता ने मुझे 50 से अधिक विविध सॉफ्टवेयर इंजीनियरिंग परियोजनाओं में योगदान देने के लिए प्रेरित किया है, जिसमें विशेष रूप से एआई/एमएल पर ध्यान केंद्रित किया गया है। मेरी लगातार जिज्ञासा ने मुझे प्राकृतिक भाषा प्रसंस्करण की ओर आकर्षित किया है, जो एक क्षेत्र है जिसे मैं आगे अन्वेषण करने के लिए उत्सुक हूं।

Unite.AI