рдХреГрддреНрд░рд┐рдо рдмреБрджреНрдзрд┐рдорддреНрддрд╛
рд▓рд╛рдорд╛ 2: рдПрдХ рдУрдкрди-рд╕реЛрд░реНрд╕ рдЪреИрд▓реЗрдВрдЬрд░ рдХреА рдЧрд╣рд░рд╛рдИ рд╕реЗ рдЬрд╛рдВрдЪ

बड़े भाषा मॉडल (LLM) जो जटिल तर्क कार्यों को करने में सक्षम हैं, विशेषज्ञता के क्षेत्रों जैसे कि प्रोग्रामिंग और रचनात्मक लेखन में आशाजनक परिणाम दिखाए हैं। हालांकि, LLM की दुनिया बस एक प्लग-एंड-प्ले स्वर्ग नहीं है; उपयोगिता, सुरक्षा और गणनात्मक मांगों में चुनौतियाँ हैं। इस लेख में, हम लामा 2 की क्षमताओं में गहराई से जाएंगे, जबकि हगिंग फेस और टी4 जीपीयू पर गूगल कोलाब में इस उच्च-प्रदर्शन वाले एलएलएम को सेट करने के लिए एक विस्तृत वॉकथ्रू प्रदान करेंगे।
मेटा द्वारा माइक्रोसॉफ्ट के साथ साझेदारी में, यह ओपन-सोर्स बड़ा भाषा मॉडल जनरेटिव एआई और प्राकृतिक भाषा समझने के क्षेत्रों को पुनर्परिभाषित करने का लक्ष्य रखता है। लामा 2 केवल टेराबाइट्स के डेटा पर प्रशिक्षित एक और सांख्यिकीय मॉडल नहीं है; यह एक दर्शन का प्रतीक है। जो खुले स्रोत दृष्टिकोण पर जोर देता है, विशेष रूप से जनरेटिव एआई स्पेस में एआई विकास के लिए।
लामा 2 और इसका संवाद-ऑप्टिमाइज्ड विकल्प, लामा 2-चैट, 70 अरब पैरामीटर तक के साथ सुसज्जित हैं। वे मानव प्राथमिकताओं के साथ जुड़ने के लिए डिज़ाइन की गई एक फाइन-ट्यूनिंग प्रक्रिया से गुजरते हैं, जिससे वे अन्य सार्वजनिक रूप से उपलब्ध मॉडलों की तुलना में सुरक्षित और प्रभावी हो जाते हैं। यह फाइन-ट्यूनिंग का स्तर अक्सर बंद “उत्पाद” एलएलएम के लिए आरक्षित होता है, जैसे कि चैटजीपीटी और बार्ड, जो सार्वजनिक निरीक्षण या अनुकूलन के लिए सामान्य रूप से उपलब्ध नहीं होते हैं।
लामा 2 की तकनीकी गहराई
लामा 2 मॉडल को प्रशिक्षित करने के लिए; इसके पूर्ववर्तियों की तरह, यह एक स्व-रिग्रेसिव ट्रांसफॉर्मर आर्किटेक्चर का उपयोग करता है, जो व्यापक स्व-पर्यवेक्षित डेटा पर पूर्व-प्रशिक्षित है। हालांकि, यह मानव व्यवहार और प्राथमिकताओं के साथ बेहतर ढंग से जुड़ने के लिए मानव प्रतिक्रिया के साथ पुनरावृत्ति सीखने (आरएलएचएफ) का उपयोग करके जटिलता की एक अतिरिक्त परत जोड़ता है। यह गणनात्मक रूप से महंगा है, लेकिन मॉडल की सुरक्षा और प्रभावशीलता में सुधार के लिए महत्वपूर्ण है।
पूर्व-प्रशिक्षण और डेटा दक्षता
लामा 2 की मूलभूत नवाचार इसके पूर्व-प्रशिक्षण शासन में निहित है। मॉडल अपने पूर्ववर्ती, लामा 1 से संकेत लेता है, लेकिन अपने प्रदर्शन को बढ़ाने के लिए कई महत्वपूर्ण सुधार पेश करता है। विशेष रूप से, प्रशिक्षित टोकन की कुल संख्या में 40% की वृद्धि और संदर्भ लंबाई में दोगुनी विस्तार उल्लेखनीय हैं। इसके अलावा, मॉडल संग्रहीत प्रश्न ध्यान (जीक्यूए) का लाभ उठाता है ताकि अनुमान की स्केलेबिलिटी को बढ़ाया जा सके।
पर्यवेक्षित फाइन-ट्यूनिंग (एसएफटी) और मानव प्रतिक्रिया के साथ पुनरावृत्ति सीखना (आरएलएचएफ)
लामा-2-चैट को एसएफटी और आरएलएचएफ दोनों का उपयोग करके कठोरता से फाइन-ट्यून किया गया है। इस संदर्भ में, एसएफटी आरएलएचएफ फ्रेमवर्क का एक अभिन्न घटक है, जो मॉडल की प्रतिक्रियाओं को मानव प्राथमिकताओं और अपेक्षाओं के साथ जोड़ने में मदद करता है।
ओपनएआई ने एक प्रेरक चित्रण प्रदान किया है जो सुपरवाइज्ड फाइन-ट्यूनिंग (एसएफटी) और मानव प्रतिक्रिया के साथ पुनरावृत्ति सीखने (आरएलएचएफ) के तरीकों की व्याख्या करता है। लामा 2 की तरह, इंस्ट्रक्टजीपीटी भी अपने मॉडल के प्रदर्शन को अनुकूलित करने के लिए इन उन्नत प्रशिक्षण तकनीकों का लाभ उठाता है।
नीचे दी गई छवि में चरण 1 पर्यवेक्षित फाइन-ट्यूनिंग (एसएफटी) पर केंद्रित है, जबकि बाद के चरण मानव प्रतिक्रिया से पुनरावृत्ति सीखने (आरएलएचएफ) प्रक्रिया को पूरा करते हैं।
पर्यवेक्षित फाइन-ट्यूनिंग (एसएफटी) एक विशेष प्रक्रिया है जो एक पूर्व-प्रशिक्षित बड़े भाषा मॉडल (एलएलएम) को एक विशिष्ट डाउनस्ट्रीम कार्य के लिए अनुकूलित करने के लिए है। असुपरवाइज्ड तरीकों के विपरीत, जिन्हें डेटा सत्यापन की आवश्यकता नहीं होती है, एसएफटी एक डेटासेट का उपयोग करता है जो पहले से ही मान्य और लेबल किया गया है।
आम तौर पर इन डेटासेट को बनाना महंगा और समय लेने वाला होता है। लामा 2 का दृष्टिकोण गुणवत्ता पर मात्रा को प्राथमिकता देना था। केवल 27,540 एनोटेशन के साथ, मेटा की टीम ने मानव एनोटेटरों के साथ प्रतिस्पर्धी प्रदर्शन स्तर हासिल किया। यह हाल के अध्ययनों के अनुरूप है जो दिखाते हैं कि सीमित लेकिन साफ डेटासेट भी उच्च गुणवत्ता वाले परिणामों को चला सकते हैं।
एसएफटी प्रक्रिया में, पूर्व-प्रशिक्षित एलएलएम को एक लेबल वाले डेटासेट के साथ प्रस्तुत किया जाता है, जहां पर्यवेक्षित लर्निंग एल्गोरिदम काम में आते हैं। मॉडल के आंतरिक वजनों को एक कार्य-विशिष्ट हानि फंक्शन से गणना किए गए ग्रेडिएंट के आधार पर पुनः संयोजित किया जाता है। यह हानि फंक्शन मॉडल के पूर्वानुमानित आउटपुट और वास्तविक ग्राउंड-ट्रुथ लेबल के बीच विसंगतियों को मापता है।
यह अनुकूलन एलएलएम को लेबल वाले डेटासेट में निहित जटिल पैटर्न और बारीकियों को समझने में सक्षम बनाता है। परिणामस्वरूप, मॉडल एक सामान्य उपकरण नहीं है, बल्कि एक विशेष संपत्ति बन जाता है जो लक्ष्य कार्य को उच्च स्तर की सटीकता के साथ करने में सक्षम होता है।
मानव प्रतिक्रिया से पुनरावृत्ति सीखना मॉडल के व्यवहार को मानव प्राथमिकताओं के साथ और अधिक बारीकी से जोड़ने के लिए अगला कदम है।
ट्यूनिंग चरण में मानव प्रतिक्रिया से पुनरावृत्ति सीखने (आरएलएचएफ) का लाभ उठाया गया, जिसमें महत्व नमूनाकरण और प्रॉक्सिमल पॉलिसी ऑप्टिमाइजेशन जैसी तकनीकों का उपयोग किया गया ताकि एल्गोरिदमिक शोर को पेश किया जा सके और स्थानीय ऑप्टिमा से बचा जा सके। इस पुनरावृत्ति फाइन-ट्यूनिंग ने न केवल मॉडल में सुधार किया, बल्कि इसके आउटपुट को मानव अपेक्षाओं के साथ भी जोड़ा।
लामा 2-चैट ने मानव प्राथमिकता डेटा एकत्र करने के लिए एक द्विआधारी तुलना प्रोटोकॉल का उपयोग किया, जो अधिक गुणात्मक दृष्टिकोण की ओर एक उल्लेखनीय प्रवृत्ति को दर्शाता है। यह तंत्र पुरस्कार मॉडल को सूचित करता है, जो बाद में संवादात्मक एआई मॉडल को फाइन-ट्यून करने के लिए उपयोग किया जाता है।
भूत ध्यान: बहु-मोड़ संवाद
मेटा ने एक नई सुविधा पेश की है, जिसे भूत ध्यान (जीएटी) कहा जाता है, जो लामा 2 के प्रदर्शन को बहु-मोड़ संवाद में बढ़ाने के लिए डिज़ाइन की गई है। यह प्रभावी रूप से चल रहे संवाद में संदर्भ हानि की समस्या का समाधान करता है। जीएटी एक एंकर की तरह काम करता है, जो प्रारंभिक निर्देशों को सभी बाद के उपयोगकर्ता संदेशों से जोड़ता है। पुनरावृत्ति सीखने की तकनीकों के साथ जोड़कर, यह लंबे संवाद में संगत, प्रासंगिक और उपयोगकर्ता-संरेखित प्रतिक्रियाओं का उत्पादन करने में मदद करता है।
मेटा गिट रिपॉजिटरी से डाउनलोड.श का उपयोग करके
- मेटा वेबसाइट पर जाएं: मेटा की आधिकारिक लामा 2 साइट पर नेविगेट करें और ‘मॉडल डाउनलोड करें’ पर क्लिक करें।
- विवरण भरें: आगे बढ़ने के लिए नियमों और शर्तों को पढ़ें और स्वीकार करें।
- ईमेल पुष्टिकरण: एक बार फॉर्म जमा हो जाने के बाद, मेटा से मॉडल को डाउनलोड करने के लिए एक लिंक के साथ एक ईमेल प्राप्त करें।
- डाउनलोड.श निष्पादित करें: गिट रिपॉजिटरी को क्लोन करें और
डाउनलोड.शस्क्रिप्ट को निष्पादित करें। यह स्क्रिप्ट आपको 24 घंटों में समाप्त होने वाले मेटा से एक यूआरएल का उपयोग करके प्रमाणीकरण करने के लिए प्रेरित करेगी। आप मॉडल का आकार – 7बी, 13बी या 70बी – भी चुनेंगे।
हगिंग फेस से
- स्वीकृति ईमेल प्राप्त करें: मेटा से एक्सेस प्राप्त करने के बाद, हगिंग फेस पर जाएं।
- एक्सेस अनुरोध करें: अपने वांछित मॉडल का चयन करें और एक्सेस प्राप्त करने के लिए अनुरोध भेजें।
- पुष्टिकरण: 1-2 दिनों के भीतर ‘एक्सेस ग्रांटेड’ ईमेल की अपेक्षा करें।
- एक्सेस टोकन बनाएं: अपने हगिंग फेस अकाउंट में ‘सेटिंग्स’ पर जाकर एक्सेस टोकन बनाएं।
ट्रांसफॉर्मर्स 4.31 रिलीज लामा 2 के साथ पूरी तरह से संगत है और हगिंग फेस इकोसिस्टम के भीतर कई उपकरण और कार्यक्षमताएं प्रदान करता है। प्रशिक्षण और अनुमान स्क्रिप्ट से लेकर बिट्सएंडबाइट्स और पैरामीटर एफिशिएंट फाइन-ट्यूनिंग (पीईएफटी) के साथ 4-बिट क्वांटाइजेशन तक, टूलकिट व्यापक है। शुरू करने के लिए, सुनिश्चित करें कि आप नवीनतम ट्रांसफॉर्मर रिलीज पर हैं और अपने हगिंग फेस अकाउंट में लॉग इन हैं।
लामा 2 मॉडल को गूगल कोलाब में चलाने के लिए एक सरल गाइड यहां दी गई है, जो जीपीयू रनटाइम का लाभ उठाती है:
पैकेज स्थापना
<p>!pip install transformers !huggingface-cli login
आवश्यक पाइथन लाइब्रेरी आयात करें.
from transformers import AutoTokenizer import transformers import torch
मॉडल और टोकनाइज़र को आरंभ करें
इस चरण में, आप कौन सा लामा 2 मॉडल उपयोग करेंगे, इसका उल्लेख करें। इस गाइड के लिए, हम मेटा-लामा/लामा -2-7बी-चैट-एचएफ का उपयोग करेंगे।
model = "meta-llama/Llama-2-7b-chat-hf" tokenizer = AutoTokenizer.from_pretrained(model)
पाइपलाइन सेट अप करें
विशिष्ट सेटिंग्स के साथ पाठ उत्पादन के लिए हगिंग फेस पाइपलाइन का उपयोग करें:
pipeline = transformers.pipeline( "text-generation", model=model, torch_dtype=torch.float16, device_map="auto")
पाठ अनुक्रम उत्पन्न करें
अंत में, पाइपलाइन चलाएं और अपने इनपुट के आधार पर पाठ अनुक्रम उत्पन्न करें:
sequences = pipeline(
'कृत्रिम बुद्धिमत्ता के क्षेत्र में मुख्य योगदानकर्ता कौन हैं?\n',
do_sample=True,
top_k=10,
num_return_sequences=1,
eos_token_id=tokenizer.eos_token_id,
max_length=200)
for seq in sequences:
print(f"परिणाम: {seq['generated_text']}")
ए16जेड का लामा 2 के लिए यूआई
अंद्रेसेन होरोविट्ज़ (ए16जेड) ने हाल ही में लामा 2 के लिए एक उन्नत स्ट्रीमलिट-आधारित चैटबॉट इंटरफेस लॉन्च किया है, जो गिटहब पर होस्ट किया गया है। यह यूआई सत्र चैट इतिहास को संरक्षित करता है और रिप्लिकेट पर होस्ट किए गए लामा 2 एपीआई एंडपॉइंट्स का चयन करने की लचीलापन प्रदान करता है। यह उपयोगकर्ता-केंद्रित डिज़ाइन लामा 2 के साथ बातचीत को सरल बनाने का लक्ष्य रखता है, जिससे यह दोनों विकासकर्ताओं और अंतिम उपयोगकर्ताओं के लिए एक आदर्श उपकरण बन जाता है। जो इसे अनुभव करने में रुचि रखते हैं, उनके लिए LLaMa2.ai पर एक लाइव डेमो उपलब्ध है।
लामा 2: जीपीटी मॉडल और इसके पूर्ववर्ती लामा 1 से यह क्या अलग बनाता है
स्केल में विविधता
अन्य भाषा मॉडलों के विपरीत जो सीमित स्केलेबिलिटी प्रदान करते हैं, लामा 2 आपको विभिन्न मॉडलों के लिए विभिन्न पैरामीटर विकल्प प्रदान करता है। मॉडल 7 अरब से 70 अरब पैरामीटर तक स्केल करता है, जिससे विभिन्न गणनात्मक आवश्यकताओं के लिए विभिन्न कॉन्फ़िगरेशन प्रदान किए जाते हैं।
संदर्भ लंबाई में वृद्धि
मॉडल में लामा 1 की तुलना में 4के टोकन की बढ़ी हुई संदर्भ लंबाई है। यह अधिक जटिल और व्यापक सामग्री को समझने और उत्पन्न करने में इसकी क्षमता को बढ़ाता है।
संग्रहीत प्रश्न ध्यान (जीक्यूए)
आर्किटेक्चर संग्रहीत प्रश्न ध्यान (जीक्यूए) की अवधारणा का उपयोग करता है, जो पिछले टोकन जोड़े को कैश करके ध्यान गणना प्रक्रिया को तेज करने के लिए डिज़ाइन किया गया है। यह प्रभावी रूप से मॉडल की अनुमान स्केलेबिलिटी में सुधार करता है, जिससे यह अधिक सुलभ हो जाता है।
प्रदर्शन बेंचमार्क
लामा 2 ने प्रदर्शन मेट्रिक्स में एक नया मानक स्थापित किया है। यह न केवल अपने पूर्ववर्ती लामा 1 को पीछे छोड़ता है, बल्कि फाल्कन और जीपीटी-3.5 जैसे अन्य मॉडलों के लिए भी महत्वपूर्ण प्रतिस्पर्धा प्रदान करता है।
लामा 2-चैट का सबसे बड़ा मॉडल, 70बी, 36% मामलों में चैटजीपीटी को पीछे छोड़ता है और 31.5% मामलों में प्रदर्शन में बराबरी करता है। स्रोत: पेपर
ओपन सोर्स: समुदाय की शक्ति
मेटा और माइक्रोसॉफ्ट लामा 2 को केवल एक उत्पाद के रूप में नहीं देखते हैं; वे इसे एक समुदाय-संचालित उपकरण के रूप में देखते हैं। लामा 2 शोध और गैर-व्यावसायिक उद्देश्यों के लिए नि:शुल्क पहुंच योग्य है। वे एआई क्षमताओं को लोकतांत्रिक बनाने का लक्ष्य रखते हैं, जिससे यह स्टार्टअप, शोधकर्ताओं और व्यवसायों के लिए सुलभ हो जाता है। एक ओपन-सोर्स दृष्टिकोण मॉडल की ‘भीड़-स्रोत ट्रoubleshooting’ की अनुमति देता है। डेवलपर और एआई नैतिकतावादी तेजी से कमजोरियों की पहचान कर सकते हैं और समाधान प्रदान कर सकते हैं।
जबकि लामा 2 के लाइसेंसिंग नियम सामान्य रूप से अनुमति देने वाले हैं, अपवाद मौजूद हैं। बड़े उद्यम, जैसे कि 700 मिलियन मासिक उपयोगकर्ताओं वाले गूगल, को इसके उपयोग के लिए मेटा से विशेष अनुमति की आवश्यकता होती है। इसके अलावा, लाइसेंस लामा 2 का उपयोग अन्य भाषा मॉडल में सुधार के लिए प्रतिबंधित करता है।
लामा 2 के साथ वर्तमान चुनौतियाँ
- डेटा सामान्यीकरण: लामा 2 और जीपीटी-4 कभी-कभी विभिन्न कार्यों में समान रूप से उच्च प्रदर्शन में विफल रहते हैं। डेटा की गुणवत्ता और विविधता इन स्थितियों में आयतन के रूप में महत्वपूर्ण हैं।
- मॉडल पारदर्शिता: पिछले मुद्दों को देखते हुए एआई को भ्रामक आउटपुट उत्पन्न करने के लिए, इन जटिल मॉडलों के पीछे के निर्णय लेने के तर्क की खोज करना महत्वपूर्ण है।
कोड लामा – मेटा का नवीनतम लॉन्च
मेटा ने हाल ही में कोड लामा की घोषणा की है, जो प्रोग्रामिंग में माहिर एक बड़ा भाषा मॉडल है, जिसमें 7बी से 34बी पैरामीटर के आकार हैं। चैटजीपीटी कोड इंटरप्रेटर के समान; कोड लामा डेवलपर कार्य प्रवाह को सुव्यवस्थित कर सकता है और प्रोग्रामिंग को अधिक सुलभ बना सकता है। यह विभिन्न प्रोग्रामिंग भाषाओं का समर्थन करता है और पायथन जैसे विशिष्ट कार्यों के लिए विशेष संस्करण प्रदान करता है। मॉडल विभिन्न विलंबता आवश्यकताओं को पूरा करने के लिए विभिन्न प्रदर्शन स्तर प्रदान करता है। खुले लाइसेंस के साथ, कोड लामा समुदाय के इनपुट के लिए खुला है ताकि इसकी निरंतर सुधार हो सके।
https://about.fb.com/news/2023/08/code-llama-ai-for-coding/
निष्कर्ष
इस लेख ने आपको हगिंग फेस और टी4 जीपीयू पर गूगल कोलाब में लामा 2 मॉडल को सेट करने के लिए एक विस्तृत वॉकथ्रू प्रदान किया है। लामा 2 का प्रदर्शन ऑटो-रिग्रेसिव ट्रांसफॉर्मर आर्किटेक्चर और मानव प्रतिक्रिया के साथ पुनरावृत्ति सीखने जैसी उन्नत तकनीकों के संयोजन से संचालित होता है। 70 अरब पैरामीटर और भूत ध्यान जैसी सुविधाओं के साथ, यह मॉडल कertain क्षेत्रों में वर्तमान उद्योग मानकों को पार करता है, और इसकी खुली प्रकृति के साथ, यह प्राकृतिक भाषा समझ और जनरेटिव एआई में एक नए युग का मार्ग प्रशस्त करता है।

















