कृत्रिम बुद्धिमत्ता

लामा 3 के बारे में जानने के लिए सब कुछ | सबसे शक्तिशाली ओपन-सोर्स मॉडल अभी तक | अवधारणा से उपयोग तक

प्रकाशित 24 अप्रैल 2024

अपडेट किया गया 21 मई 2026

Aayush Mittal मित्तल

Meta Llama 3 open source LLM OUTPERFORM GPT 4

मेटा ने हाल ही में लामा 3 जारी किया है, अपने राज्य-ऑफ-द-आर्ट ओपन सोर्स बड़े भाषा मॉडल (एलएलएम) की अगली पीढ़ी। अपने पूर्ववर्ती द्वारा निर्धारित आधारों पर निर्माण करके, लामा 3 उन क्षमताओं को बढ़ाने का लक्ष्य रखता है जो लामा 2 को चैटजीपीटी के लिए एक महत्वपूर्ण ओपन-सोर्स प्रतियोगी के रूप में स्थापित करते हैं, जैसा कि लामा 2: चैटजीपीटी के लिए ओपन-सोर्स चैलेंजर में एक गहरा गोता लेख में व्यापक समीक्षा में रेखांकित किया गया है।

इस लेख में, हम लामा 3 के पीछे की मूल अवधारणाओं पर चर्चा करेंगे, इसके नवाचारी वास्तुकला और प्रशिक्षण प्रक्रिया का अन्वेषण करेंगे, और इस ग्राउंडब्रेकिंग मॉडल को जिम्मेदारी से एक्सेस, उपयोग और तैनात करने के लिए व्यावहारिक मार्गदर्शन प्रदान करेंगे। चाहे आप एक शोधकर्ता हों, डेवलपर हों, या एआई उत्साही हों, यह पोस्ट आपको लामा 3 की शक्ति को अपने परियोजनाओं और अनुप्रयोगों के लिए हार्नेस करने के लिए आवश्यक ज्ञान और संसाधनों से लैस करेगी।

लामा की विकास: लामा 2 से लामा 3 तक

मेटा के सीईओ, मार्क जुकरबर्ग, घोषणा की है लामा 3 की शुरुआत, मेटा एआई द्वारा विकसित नवीनतम एआई मॉडल। यह राज्य-ऑफ-द-आर्ट मॉडल, अब ओपन-सोर्स, मेटा के विभिन्न उत्पादों को बढ़ाने के लिए तैयार है, जिनमें मैसेंजर और इंस्टाग्राम शामिल हैं। जुकरबर्ग ने इस बात पर प्रकाश डाला कि लामा 3 मेटा एआई को सबसे उन्नत नि:शुल्क उपलब्ध एआई सहायक के रूप में स्थापित करता है।

लामा 3 के विशिष्ट विवरण पर चर्चा करने से पहले, आइए इसके पूर्ववर्ती को जल्दी से देखें। 2022 में पेश किया गया, लामा 2 ओपन-सोर्स एलएलएम परिदृश्य में एक महत्वपूर्ण मील का पत्थर था, जो उपभोक्ता हार्डवेयर पर चलने में सक्षम एक शक्तिशाली और कुशल मॉडल प्रदान करता था।

हालांकि, जबकि लामा 2 एक उल्लेखनीय उपलब्धि थी, इसकी सीमाएं थीं। उपयोगकर्ताओं ने झूठे इनकार (मॉडल के हानिरहित प्रॉम्प्ट का जवाब देने से इनकार करना), सीमित उपयोगिता और तर्क और कोड जेनरेशन जैसे क्षेत्रों में सुधार की गुंजाइश की समस्याओं की सूचना दी।

लामा 3 प्रवेश करें: मेटा की इन चुनौतियों और समुदाय की प्रतिक्रिया का जवाब। लामा 3 के साथ, मेटा ने आज उपलब्ध शीर्ष प्रोप्राइटरी मॉडल के बराबर ओपन-सोर्स मॉडल बनाने का लक्ष्य रखा है, साथ ही जिम्मेदार विकास और तैनाती प्रथाओं को प्राथमिकता दी है।

लामा 3: वास्तुकला और प्रशिक्षण

लामा 3 में एक प्रमुख नवाचार इसका टोकनाइज़र है, जो 128,256 टोकन (लामा 2 में 32,000 से ऊपर) का व्यापक रूप से विस्तारित शब्दावली पेश करता है। यह बड़ी शब्दावली इनपुट और आउटपुट दोनों के लिए पाठ के अधिक कुशल एन्कोडिंग की अनुमति देती है, जिससे संभावित रूप से मजबूत बहुभाषावाद और समग्र प्रदर्शन में सुधार होता है।

लामा 3 में ग्रुप्ड-क्वेरी अटेंशन (जीक्यूए) भी शामिल है, एक कुशल प्रतिनिधित्व तकनीक जो स्केलेबिलिटी में सुधार करती है और मॉडल को अधिक प्रभावी ढंग से लंबे संदर्भों से निपटने में मदद करती है। लामा 3 के 8B संस्करण में जीक्यूए का उपयोग किया जाता है, जबकि 8B और 70B दोनों मॉडल 8,192 टोकन तक के अनुक्रमों को संसाधित कर सकते हैं।

प्रशिक्षण डेटा और स्केलिंग

लामा 3 के प्रदर्शन में सुधार के लिए उपयोग किया जाने वाला प्रशिक्षण डेटा एक महत्वपूर्ण कारक है। मेटा ने लामा 2 के लिए उपयोग किए गए डेटासेट की तुलना में सात गुना बड़ा, 15 ट्रिलियन से अधिक टोकन का एक विशाल डेटासेट क्यूरेट किया है। यह डेटासेट में 30 से अधिक भाषाओं में 5% से अधिक उच्च गुणवत्ता वाले गैर-अंग्रेजी डेटा भी शामिल है, भविष्य के बहुभाषी अनुप्रयोगों के लिए तैयारी के रूप में।

डेटा की गुणवत्ता सुनिश्चित करने के लिए, मेटा ने उन्नत फिल्टरिंग तकनीकों का उपयोग किया, जिनमें संवेदी फिल्टर, एनएसएफडब्ल्यू फिल्टर, सेमांटिक डुप्लिकेशन और लामा 2 पर प्रशिक्षित पाठ वर्गीकरणकर्ता शामिल हैं ताकि डेटा गुणवत्ता की भविष्यवाणी की जा सके। टीम ने प्री-ट्रेनिंग के लिए डेटा मिश्रण का अनुकूलन निर्धारित करने के लिए व्यापक प्रयोग भी किए, यह सुनिश्चित करते हुए कि लामा 3 विभिन्न उपयोग के मामलों में अच्छा प्रदर्शन करता है, जिसमें ट्रिविया, स्टेम, कोडिंग और ऐतिहासिक ज्ञान शामिल हैं।

प्री-ट्रेनिंग को स्केल करना लामा 3 के विकास का एक और महत्वपूर्ण पहलू था। मेटा ने स्केलिंग के नियमों का विकास किया जो उन्हें अपने सबसे बड़े मॉडलों के प्रदर्शन की भविष्यवाणी करने की अनुमति देते हैं, जैसे कि कोड जेनरेशन जैसे कार्यों पर, वास्तव में उन्हें प्रशिक्षित करने से पहले। यह डेटा मिश्रण और कंप्यूट अलोकेशन पर निर्णयों को सूचित किया, अंततः अधिक कुशल और प्रभावी प्रशिक्षण के लिए।

लामा 3 के सबसे बड़े मॉडल दो कस्टम-निर्मित 24,000 जीपीयू क्लस्टर पर प्रशिक्षित किए गए थे, जो डेटा समानांतरीकरण, मॉडल समानांतरीकरण और पाइपलाइन समानांतरीकरण तकनीकों के संयोजन का लाभ उठाते हैं। मेटा के उन्नत प्रशिक्षण स्टैक ने स्वचालित रूप से त्रुटि का पता लगाया, संभाला और रखरखाव किया, जीपीयू अपटाइम को अधिकतम कर दिया और लामा 2 की तुलना में लगभग तीन गुना प्रशिक्षण की दक्षता में वृद्धि की।

निर्देश फ़ाइन-ट्यूनिंग और प्रदर्शन

चैट और संवाद अनुप्रयोगों के लिए लामा 3 की पूरी क्षमता को अनलॉक करने के लिए, मेटा ने निर्देश फ़ाइन-ट्यूनिंग के दृष्टिकोण में नवाचार किया। इसकी विधि पर्यवेक्षित फ़ाइन-ट्यूनिंग (एसएफटी), अस्वीकार नमूनाकरण, प्रॉक्सिमल पॉलिसी ऑप्टिमाइजेशन (पीपीओ) और डायरेक्ट प्रिफरेंस ऑप्टिमाइजेशन (डीपीओ) को जोड़ती है।

एसएफटी और पीपीओ और डीपीओ में उपयोग किए जाने वाले प्रॉम्प्ट्स की गुणवत्ता और प्राथमिकता रैंकिंग का संरेखित मॉडल के प्रदर्शन में एक महत्वपूर्ण भूमिका थी। मेटा की टीम ने इस डेटा को सावधानीपूर्वक क्यूरेट किया और मानव अनnotators द्वारा प्रदान किए गए एनोटेशन पर गुणवत्ता आश्वासन के कई दौर किए।

पीपीओ और डीपीओ के माध्यम से प्राथमिकता रैंकिंग पर प्रशिक्षण ने भी लामा 3 के तर्क और कोडिंग कार्यों पर प्रदर्शन में काफी सुधार किया। मेटा ने पाया कि जब एक मॉडल सीधे एक तर्क प्रश्न का उत्तर देने के लिए संघर्ष कर रहा हो, तो यह अभी भी सही तर्क ट्रेस उत्पन्न कर सकता है। प्राथमिकता रैंकिंग पर प्रशिक्षण ने मॉडल को इन ट्रेस से सही उत्तर चुनने के लिए सीखने में मदद की।

परिणाम खुद बोलते हैं: लामा 3 कई उपलब्ध ओपन-सोर्स चैट मॉडलों को सामान्य उद्योग बेंचमार्क पर पार करता है, 8B और 70B पैरामीटर स्केल पर एलएलएम के लिए नए राज्य-ऑफ-द-आर्ट प्रदर्शन की स्थापना करता है।

जिम्मेदार विकास और सुरक्षा विचार

लामा 3 के कटिंग-एज प्रदर्शन का पीछा करते हुए, मेटा ने जिम्मेदार विकास और तैनाती प्रथाओं को भी प्राथमिकता दी है। कंपनी ने एक प्रणाली स्तर के दृष्टिकोण को अपनाया है, लामा 3 मॉडलों को एक व्यापक पारिस्थितिकी तंत्र के हिस्से के रूप में कल्पना की है जो डेवलपर्स को अपने विशिष्ट उपयोग के मामलों और सुरक्षा आवश्यकताओं के लिए मॉडल को डिज़ाइन और अनुकूलित करने की अनुमति देता है।

मेटा ने व्यापक रेड-टीमिंग अभ्यास किए, विरोधी मूल्यांकन किए और अपने निर्देश-ट्यून किए गए मॉडल में शेष जोखिमों को कम करने के लिए सुरक्षा मितIGATION तकनीकों को लागू किया। हालांकि, कंपनी स्वीकार करती है कि शेष जोखिम शायद बने रहेंगे और अनुशंसा करती है कि डेवलपर्स अपने विशिष्ट उपयोग के मामलों के संदर्भ में इन जोखिमों का मूल्यांकन करें।

जिम्मेदार तैनाती का समर्थन करने के लिए, मेटा ने अपने जिम्मेदार उपयोग गाइड को अपडेट किया है, जो डेवलपर्स के लिए अपने अनुप्रयोगों के लिए मॉडल और प्रणाली स्तर की सुरक्षा सर्वोत्तम प्रथाओं को लागू करने के लिए एक व्यापक संसाधन प्रदान करता है। गाइड में सामग्री मॉडरेशन, जोखिम मूल्यांकन और लामा गार्ड 2 और कोड शील्ड जैसे सुरक्षा उपकरणों का उपयोग शामिल है।

लामा गार्ड 2, एमएलकॉमन्स टैक्सोनॉमी पर निर्मित, एलएलएम इनपुट (प्रॉम्प्ट्स) और प्रतिक्रियाओं को वर्गीकृत करने के लिए डिज़ाइन किया गया है, जो असुरक्षित या हानिकारक माना जा सकता है। साइबरसेकएवल 2 अपने पूर्ववर्ती पर विस्तार करता है, मॉडल के कोड इंटरप्रेटर के दुरुपयोग, आक्रामक साइबर सुरक्षा क्षमताओं और प्रॉम्प्ट इंजेक्शन हमलों के प्रति संवेदनशीलता को रोकने के लिए उपाय जोड़कर।

कोड शील्ड, लामा 3 के साथ एक नई शुरुआत, एलएलएम द्वारा उत्पादित असुरक्षित कोड को अनुमान-टाइम फिल्टरिंग जोड़ता है, असुरक्षित कोड सुझावों, कोड इंटरप्रेटर दुरुपयोग और सुरक्षित कमांड निष्पादन से जुड़े जोखिमों को कम करता है।

लामा 3 तक पहुंच और उपयोग

मेटा एआई के लामा 3 के लॉन्च के बाद, विभिन्न ओपन-सोर्स टूल्स को मैक, विंडोज और लिनक्स जैसे विभिन्न ऑपरेटिंग सिस्टम पर स्थानीय रूप से तैनात करने के लिए उपलब्ध कराया गया है। इस अनुभाग में तीन उल्लेखनीय टूल्स का विवरण दिया गया है: ओलामा, ओपन वेबयूआई और एलएम स्टूडियो, प्रत्येक लामा 3 की क्षमताओं का लाभ उठाने के लिए विशिष्ट विशेषताएं प्रदान करता है।

ओलामा: मैक, लिनक्स और विंडोज के लिए उपलब्ध, ओलामा लामा 3 और अन्य बड़े भाषा मॉडलों को व्यक्तिगत कंप्यूटरों पर, यहां तक कि कम शक्तिशाली हार्डवेयर पर भी संचालित करना आसान बनाता है। इसमें मॉडल प्रबंधन के लिए एक पैकेज मैनेजर शामिल है और प्लेटफ़ॉर्म के पार मॉडल डाउनलोड और चलाने के लिए कमांड का समर्थन करता है।

ओपन वेबयूआई डॉकเกอร के साथ: यह टूल एक उपयोगकर्ता-मित्र डॉक्कर-आधारित इंटरफ़ेस प्रदान करता है जो मैक, लिनक्स और विंडोज के साथ संगत है। यह ओलामा रजिस्ट्री से मॉडल के साथ सहजता से एकीकृत करता है, उपयोगकर्ताओं को स्थानीय वेब इंटरफ़ेस के भीतर लामा 3 जैसे मॉडल को तैनात और इंटरैक्ट करने की अनुमति देता है।

एलएम स्टूडियो: मैक, लिनक्स और विंडोज पर उपयोगकर्ताओं को लक्षित करते हुए, एलएम स्टूडियो विभिन्न मॉडलों का समर्थन करता है और लामा .सीपीपी परियोजना पर निर्मित है। यह एक चैट इंटरफ़ेस प्रदान करता है और विभिन्न मॉडलों के साथ, लामा 3 के 8B इंस्ट्रक्ट मॉडल सहित, सीधे बातचीत करने की सुविधा देता है।

इन टूल्स के माध्यम से, उपयोगकर्ता अपने व्यक्तिगत उपकरणों पर लामा 3 का कुशलता से उपयोग कर सकते हैं, विभिन्न तकनीकी कौशल और आवश्यकताओं को समायोजित करते हुए। प्रत्येक प्लेटफ़ॉर्म सेटअप और मॉडल इंटरैक्शन के लिए चरण-दर-चरण प्रक्रिया प्रदान करता है, डेवलपर्स और उत्साही लोगों के लिए उन्नत एआई तक पहुंच को अधिक सुलभ बनाता है।

लामा 3 को बड़े पैमाने पर तैनात करना

मॉडल वजन तक सीधी पहुंच प्रदान करने के अलावा, मेटा ने लामा 3 को बड़े पैमाने पर तैनात करने की सुविधा के लिए विभिन्न क्लाउड प्रदाताओं, मॉडल एपीआई सेवाओं और हार्डवेयर प्लेटफ़ॉर्म के साथ साझेदारी की है।

लामा 3 के एक प्रमुख लाभों में से एक इसकी बेहतर टोकन कुशलता है, जो नए टोकनाइज़र के लिए धन्यवाद है। बेंचमार्क से पता चलता है कि लामा 3 लामा 2 की तुलना में 15% कम टोकन की आवश्यकता होती है, जिससे तेजी से और अधिक लागत प्रभावी अनुमान होता है।

लामा 3 के 8B संस्करण में ग्रुप्ड क्वेरी अटेंशन (जीक्यूए) का एकीकरण लामा 2 के 7B संस्करण के साथ तुलना में पैरामीटर गणना में वृद्धि के बावजूद अनुमान दक्षता को बनाए रखने में मदद करता है।

तैनाती प्रक्रिया को सरल बनाने के लिए, मेटा ने लामा रेसिपी रिपॉजिटरी प्रदान की है, जिसमें फ़ाइन-ट्यूनिंग, तैनाती, मॉडल मूल्यांकन और अधिक के लिए ओपन-सोर्स कोड और उदाहरण शामिल हैं। यह रिपॉजिटरी लामा 3 की क्षमताओं का लाभ उठाने के लिए अपने अनुप्रयोगों में डेवलपर्स के लिए एक मूल्यवान संसाधन के रूप में कार्य करता है।

लामा 3 के प्रदर्शन का अन्वेषण करने में रुचि रखने वालों के लिए, मेटा ने अपने नवीनतम मॉडलों को मेटा एआई में एकीकृत किया है, जो लामा 3 प्रौद्योगिकी के साथ निर्मित एक प्रमुख एआई सहायक है। उपयोगकर्ता फेसबुक, इंस्टाग्राम, व्हाट्सएप, मैसेंजर और वेब जैसे विभिन्न मेटा ऐप के माध्यम से मेटा एआई के साथ बातचीत कर सकते हैं, चीजों को पूरा करने, सीखने, बनाने और उन चीजों से जुड़ने के लिए जो उनके लिए मायने रखती हैं।

लामा 3 के लिए आगे क्या है?

जबकि 8B और 70B मॉडल लामा 3 रिलीज़ की शुरुआत का प्रतिनिधित्व करते हैं, मेटा के लिए इस ग्राउंडब्रेकिंग एलएलएम के भविष्य के लिए महत्वाकांक्षी योजनाएं हैं।

आगामी महीनों में, हम नई क्षमताओं की शुरुआत देख सकते हैं, जिनमें मल्टीमॉडलिटी (विभिन्न डेटा मॉडलिटी जैसे छवियों और वीडियोज़ को संसाधित और उत्पन्न करने की क्षमता), बहुभाषावाद (मल्टीपल भाषाओं का समर्थन) और विस्तारित संदर्भ विंडो शामिल हैं जो कार्यों के प्रदर्शन में सुधार के लिए व्यापक संदर्भ की आवश्यकता होती है।

इसके अलावा, मेटा 400 अरब पैरामीटर से अधिक के मॉडल जारी करने की योजना बना रहा है, जो वर्तमान में प्रशिक्षण में हैं और प्रदर्शन और क्षमता के मामले में आशाजनक रुझान दिखा रहे हैं।

क्षेत्र को आगे बढ़ाने के लिए, मेटा लामा 3 पर एक विस्तृत शोध पत्र प्रकाशित करेगा, जिसमें अपने निष्कर्षों और अंतर्दृष्टि को व्यापक एआई समुदाय के साथ साझा करेगा।

आगे की झलक के रूप में, मेटा ने अपने सबसे बड़े एलएलएम मॉडल के प्रदर्शन के कुछ प्रारंभिक स्नैपशॉट साझा किए हैं, विभिन्न बेंचमार्क पर। जबकि ये परिणाम एक प्रारंभिक चेकपॉइंट पर आधारित हैं और बदलने की संभावना है, वे लामा 3 की भविष्य की संभावनाओं में एक रोमांचक झलक प्रदान करते हैं।

निष्कर्ष

लामा 3 ओपन-सोर्स बड़े भाषा मॉडल के विकास में एक महत्वपूर्ण मील का पत्थर का प्रतिनिधित्व करता है, प्रदर्शन, क्षमताओं और जिम्मेदार विकास प्रथाओं की सीमाओं को आगे बढ़ाता है। अपनी नवाचारी वास्तुकला, विशाल प्रशिक्षण डेटासेट और कटिंग-एज फ़ाइन-ट्यूनिंग तकनीकों के साथ, लामा 3 8B और 70B पैरामीटर स्केल पर एलएलएम के लिए नए राज्य-ऑफ-द-आर्ट बेंचमार्क स्थापित करता है।

हालांकि, लामा 3 केवल एक शक्तिशाली भाषा मॉडल से अधिक है; यह मेटा की जिम्मेदार एआई पारिस्थितिकी तंत्र को बढ़ावा देने की प्रतिबद्धता का प्रमाण है। व्यापक संसाधनों, सुरक्षा उपकरणों और सर्वोत्तम प्रथाओं को प्रदान करके, मेटा डेवलपर्स को लामा 3 की पूरी क्षमता का लाभ उठाने और अपने विशिष्ट उपयोग के मामलों और दर्शकों के लिए जिम्मेदार तैनाती सुनिश्चित करने के लिए सशक्त बनाता है।

जैसा कि लामा 3 की यात्रा जारी है, नई क्षमताओं, मॉडल के आकार और शोध निष्कर्षों के साथ, एआई समुदाय निश्चित रूप से इस ग्राउंडब्रेकिंग एलएलएम से उत्पन्न होने वाले नवाचारों और सफलताओं की प्रतीक्षा कर रहा है।

चाहे आप प्राकृतिक भाषा प्रसंस्करण की सीमाओं को आगे बढ़ाने वाले शोधकर्ता हों, अगली पीढ़ी के बुद्धिमान अनुप्रयोगों का निर्माण करने वाले डेवलपर हों, या एआई की नवीनतम प्रगति के बारे में उत्सुक एआई उत्साही हों, लामा 3 आपके शस्त्रागार में एक शक्तिशाली उपकरण का वादा करता है, नई दरवाजे खोलता है और संभावनाओं की एक दुनिया को अनलॉक करता है।

Aayush Mittal, मित्तल

मैं पिछले पांच वर्षों से मशीन लर्निंग और डीप लर्निंग की दुनिया में खुद को डूबो रहा हूं। मेरा जुनून और विशेषज्ञता ने मुझे 50 से अधिक विविध सॉफ्टवेयर इंजीनियरिंग परियोजनाओं में योगदान देने के लिए प्रेरित किया है, जिनमें से अधिकांश में एआई/एमएल पर विशेष ध्यान केंद्रित किया गया है। मेरी जारी जिज्ञासा ने मुझे प्राकृतिक भाषा प्रसंस्करण की ओर आकर्षित किया है, जिस क्षेत्र को मैं आगे अन्वेषण करने के लिए उत्सुक हूं।

Unite.AI