Connect with us

рдмрдбрд╝реЗ рднрд╛рд╖рд╛ рдореЙрдбрд▓ рдФрд░ рд╡реНрдпрд╡рд╕рд╛рдп рдХреЗ рдмреАрдЪ рдкреБрд▓: рдПрд▓рдПрд▓рдПрдордУрдкреАрдПрд╕

рдХреГрддреНрд░рд┐рдо рдмреБрджреНрдзрд┐рдорддреНрддрд╛

рдмрдбрд╝реЗ рднрд╛рд╖рд╛ рдореЙрдбрд▓ рдФрд░ рд╡реНрдпрд╡рд╕рд╛рдп рдХреЗ рдмреАрдЪ рдкреБрд▓: рдПрд▓рдПрд▓рдПрдордУрдкреАрдПрд╕

mm
Generative AI and LLMOps

एलएलएम्स जैसे ओपनएआई के जीपीटी-3 या इसके उत्तराधिकारी जीपीटी-4 का आधार गहरे शिक्षण में है, जो कि एआई का एक उपसेट है, जो तीन या अधिक परतों के साथ न्यूरल नेटवर्क का लाभ उठाता है। इन मॉडलों को व्यापक स्पेक्ट्रम के इंटरनेट टेक्स्ट को शामिल करने वाले विशाल डेटासेट पर प्रशिक्षित किया जाता है। प्रशिक्षण के माध्यम से, एलएलएम्स अगले शब्द की भविष्यवाणी करना सीखते हैं, जो पहले से आया है। यह क्षमता, जो अपने सार में सरल है, एलएलएम्स को विस्तारित क्रम में सुसंगत, संदर्भ से संबंधित पाठ उत्पन्न करने की क्षमता को आधार बनाती है।

संभावित अनुप्रयोग असीमित हैं – ईमेल की ड्राफ्टिंग, कोड बनाने, प्रश्नों का उत्तर देने, से लेकर रचनात्मक रूप से लिखने तक। हालांकि, महान शक्ति के साथ महान जिम्मेदारी आती है, और उत्पादन सेटिंग में इन विशाल मॉडलों का प्रबंधन करना एक महत्वपूर्ण कार्य नहीं है। यहीं पर एलएलएमओपीएस आता है, जो एलएलएम्स के विश्वसनीय, सुरक्षित और कुशल संचालन के लिए सर्वोत्तम प्रथाओं, उपकरणों और प्रक्रियाओं का प्रतिनिधित्व करता है।

एलएलएम एकीकरण के लिए रोडमैप में तीन प्रमुख मार्ग हैं:

  1. सामान्य उद्देश्य एलएलएम्स को प्रेरित करना:
    • चैटजीपीटी और बर्ड जैसे मॉडल एक कम प्रवेश सीमा की पेशकश करते हैं और न्यूनतम अग्रिम लागत के साथ, हालांकि लंबे समय में एक संभावित मूल्य टैग के साथ।
    • हालांकि, डेटा गोपनीयता और सुरक्षा के छाया विशेष रूप से फिनटेक और स्वास्थ्य सेवा जैसे क्षेत्रों के लिए बड़े हैं, जो कठोर नियामक ढांचे के साथ हैं।
  2. सामान्य उद्देश्य एलएलएम्स को ठीक करना:
    • ल्लामा, फाल्कन और मिस्ट्रल जैसे ओपन-सोर्स मॉडल के साथ, संगठन अपने विशिष्ट उपयोग के मामलों के साथ इन एलएलएम्स को अनुकूलित कर सकते हैं, केवल मॉडल ट्यूनिंग संसाधन के रूप में व्यय के साथ।
    • यह मार्ग, जबकि गोपनीयता और सुरक्षा के संदेह को संबोधित करता है, मॉडल चयन, डेटा तैयारी, ठीक करने, तैनाती और निगरानी के लिए अधिक गहन आवश्यकता की मांग करता है।
    • इस मार्ग की चक्रीय प्रकृति एक सतत जुड़ाव के लिए कहती है, फिर भी हाल के नवाचारों जैसे लोरा (लो-रैंक अनुकूलन) और क्यू (क्वांटिज्ड)-लोरा ने ठीक करने की प्रक्रिया को सुव्यवस्थित किया है, इसे एक बढ़ती लोकप्रिय विकल्प बना दिया है।
  3. कस्टम एलएलएम प्रशिक्षण:
    • एक एलएलएम को शून्य से विकसित करने से एक असाधारण सटीकता का वादा होता है, जो कार्य के लिए तैयार किया जाता है। फिर भी, एआई विशेषज्ञता, गणना संसाधनों, व्यापक डेटा और समय निवेश में उच्च आवश्यकताएं महत्वपूर्ण बाधाएं प्रस्तुत करती हैं।

इनमें से तीन, सामान्य उद्देश्य एलएलएम्स को ठीक करना कंपनियों के लिए सबसे अनुकूल विकल्प है। एक नई फाउंडेशन मॉडल बनाने की लागत $100 मिलियन तक हो सकती है, जबकि मौजूदा लोगों को ठीक करने की लागत $100,000 से $1 मिलियन के बीच होती है। ये आंकड़े गणना व्यय, डेटा अधिग्रहण और लेबलिंग, साथ ही इंजीनियरिंग और अनुसंधान व्यय से उत्पन्न होते हैं।

एलएलएमओपीएस बनाम एमएलओपीएस

मशीन लर्निंग ऑपरेशन (एमएलओपीएस) को अच्छी तरह से समझा जाता है, जो मशीन लर्निंग (एमएल) मॉडल्स को विकास से उत्पादन तक संक्रमण के लिए एक संरचित मार्ग प्रदान करता है। हालांकि, बड़े भाषा मॉडल्स (एलएलएम्स) के उदय के साथ, एक नए ऑपरेशनल परिदृश्य, एलएलएमओपीएस नामक, एलएलएम्स को तैनात और प्रबंधित करने से जुड़े विशिष्ट चुनौतियों को संबोधित करने के लिए उभरा है। एलएलएमओपीएस और एमएलओपीएस के बीच अंतर कई कारकों पर है:

  1. गणना संसाधन:
    • एलएलएम्स को प्रशिक्षण और ठीक करने के लिए एक महत्वपूर्ण गणना पrowess की आवश्यकता होती है, अक्सर विशेष हार्डवेयर जैसे जीपीयू की आवश्यकता होती है ताकि डेटा-संबंधित ऑपरेशन को तेज किया जा सके।
    • अनुमान की लागत आगे गणना व्यय को कम करने के लिए मॉडल संपीड़न और विलोपन तकनीकों के महत्व को रेखांकित करती है।
  2. ट्रांसफर लर्निंग:
    • पारंपरिक एमएल मॉडल्स के विपरीत, जो अक्सर शून्य से प्रशिक्षित होते हैं, एलएलएम्स ट्रांसफर लर्निंग पर भारी रूप से निर्भर करते हैं, एक पूर्व-प्रशिक्षित मॉडल से शुरू करते हैं और इसे विशिष्ट डोमेन कार्यों के लिए ठीक करते हैं।
    • यह दृष्टिकोण डेटा और गणना संसाधनों पर बचत करता है, जबकि राज्य-ऑफ-द-आर्ट प्रदर्शन प्राप्त करता है।
  3. मानव प्रतिक्रिया लूप:
    • एलएलएम्स के पुनरावृत्ति सुधार को मानव प्रतिक्रिया (आरएलएचएफ) से सुदृढ़ लर्निंग द्वारा काफी हद तक संचालित किया जाता है।
    • एलएलएमओपीएस पाइपलाइनों में एक प्रतिक्रिया लूप को एकीकृत करना न केवल मूल्यांकन को सरल बनाता है, बल्कि ठीक करने की प्रक्रिया को भी ईंधन देता है।
  4. हाइपरपैरामीटर ट्यूनिंग:
    • जबकि शास्त्रीय एमएल सटीकता में सुधार के माध्यम से हाइपरपैरामीटर ट्यूनिंग पर जोर देता है, एलएलएम क्षेत्र में, फोकस कम्प्यूटेशनल मांगों को कम करने पर भी है।
    • पैरामीटर जैसे बैच आकार और सीखने की दर को समायोजित करने से प्रशिक्षण गति और लागत में काफी बदलाव आ सकता है।
  5. प्रदर्शन मेट्रिक्स:
    • पारंपरिक एमएल मॉडल्स सटीकता, एयूसी, या एफ1 स्कोर जैसे अच्छी तरह से परिभाषित प्रदर्शन मेट्रिक्स का पालन करते हैं, जबकि एलएलएम्स के पास ब्लू और रोग जैसे विभिन्न मेट्रिक सेट हैं।
    • ब्लू और रोग मेट्रिक्स मशीन-जनित अनुवाद और सारांश की गुणवत्ता का मूल्यांकन करने के लिए उपयोग किए जाते हैं। ब्लू मुख्य रूप से मशीन अनुवाद कार्यों के लिए उपयोग किया जाता है, जबकि रोग पाठ सारांश कार्यों के लिए उपयोग किया जाता है।
    • ब्लू सटीकता को मापता है, या मशीन-जनित सारांश में शब्दों की मात्रा जो मानव संदर्भ सारांश में दिखाई देती है। रोग रिकॉल को मापता है, या मानव संदर्भ सारांश में शब्दों की मात्रा जो मशीन-जनित सारांश में दिखाई देती है।
  6. प्रॉम्प्ट इंजीनियरिंग:
    • सटीक और विश्वसनीय प्रतिक्रिया प्राप्त करने के लिए एलएलएम्स से एलएलएम्स को प्रेरित करना महत्वपूर्ण है, मॉडल हॉलुसिनेशन और प्रॉम्प्ट हैकिंग जैसे जोखिमों को कम करता है।
  7. एलएलएम पाइपलाइन निर्माण:
    • लैंगचेन या ल्लामाインデックス जैसे उपकरण एलएलएम पाइपलाइनों के निर्माण की अनुमति देते हैं, जो ज्ञान आधार प्रश्नों जैसे जटिल कार्यों के लिए एकाधिक एलएलएम कॉल या बाहरी सिस्टम इंटरैक्शन को जोड़ते हैं।

एलएलएमओपीएस वर्कफ्लो को समझना: एक विस्तृत विश्लेषण

भाषा मॉडल ऑपरेशन, या एलएलएमओपीएस, बड़े भाषा मॉडल्स की संचालन रीढ़ की हड्डी के समान है, जो विभिन्न अनुप्रयोगों में निर्बाध कार्य सुनिश्चित करता है। जबकि यह एमएलओपीएस या डेवओपीएस का एक प्रतिवर्ती लगता है, एलएलएमओपीएस में बड़े भाषा मॉडल्स की मांगों को पूरा करने के लिए विशिष्ट न्यांस हैं। आइए एलएलएमओपीएस वर्कफ्लो में गहराई से उतरें, जो चित्रण में दिखाया गया है, और प्रत्येक चरण का विस्तार से अन्वेषण करें।

  1. प्रशिक्षण डेटा:
    • एक भाषा मॉडल का सार इसके प्रशिक्षण डेटा में निहित है। इस चरण में डेटासेट का संग्रह, सुनिश्चित करना शामिल है कि वे साफ, संतुलित और उपयुक्त रूप से एनोटेट हैं। डेटा की गुणवत्ता और विविधता मॉडल की सटीकता और बहुमुखी प्रतिभा पर काफी प्रभाव डालती है। एलएलएमओपीएस में, जोर न केवल मात्रा पर है, बल्कि मॉडल के इरादित उपयोग मामले के साथ संरेखण पर भी है।
  2. ओपन सोर्स फाउंडेशन मॉडल:
    • चित्रण में एक “ओपन सोर्स फाउंडेशन मॉडल” का उल्लेख किया गया है, जो अक्सर प्रमुख एआई संस्थाओं द्वारा जारी किया जाता है। ये मॉडल, जो बड़े डेटासेट पर प्रशिक्षित होते हैं, एक उत्कृष्ट प्रारंभिक बिंदु के रूप में कार्य करते हैं, समय और संसाधनों की बचत करते हुए, विशिष्ट कार्यों के लिए ठीक करने की अनुमति देते हैं।
  3. प्रशिक्षण / ट्यूनिंग:
    • एक फाउंडेशन मॉडल और विशिष्ट प्रशिक्षण डेटा के साथ, ट्यूनिंग शुरू होती है। इस चरण में मॉडल को विशिष्ट उद्देश्यों के लिए परिष्कृत किया जाता है, जैसे कि स्वास्थ्य सेवा अनुप्रयोगों के लिए चिकित्सा साहित्य के साथ एक सामान्य पाठ मॉडल को ठीक करना। एलएलएमओपीएस में, निरंतर जांच के साथ कठोर ट्यूनिंग ओवरफिटिंग को रोकने और अनदेखे डेटा पर अच्छी सामान्यता सुनिश्चित करने के लिए महत्वपूर्ण है।
  4. प्रशिक्षित मॉडल:
    • ट्यूनिंग के बाद, एक प्रशिक्षित मॉडल तैनाती के लिए तैयार हो जाता है। यह मॉडल, फाउंडेशन मॉडल का एक उन्नत संस्करण, अब एक विशिष्ट अनुप्रयोग के लिए विशेषज्ञ है। यह ओपन-सोर्स हो सकता है, जिसमें सार्वजनिक रूप से सुलभ वजन और वास्तुकला हों, या प्रोप्राइटरी, जो संगठन द्वारा निजी तौर पर रखा जाता है।
  5. तैनाती:
    • तैनाती में मॉडल को वास्तविक दुनिया के प्रश्नों के लिए लाइव वातावरण में एकीकृत करना शामिल है। इसमें होस्टिंग के बारे में निर्णय लेना शामिल है, जो ऑन-प्रिमाइसेस या क्लाउड प्लेटफ़ॉर्म पर हो सकता है। एलएलएमओपीएस में, विलंबता, गणना लागत, और पहुंच के बारे में विचार, साथ ही साथ यह सुनिश्चित करना कि मॉडल कई समकालिक अनुरोधों के लिए अच्छी तरह से स्केल करता है, महत्वपूर्ण हैं।
  6. प्रॉम्प्ट:
    • भाषा मॉडल्स में, एक प्रॉम्प्ट एक इनपुट प्रश्न या बयान है। प्रभावी प्रॉम्प्ट्स का निर्माण, जो अक्सर मॉडल व्यवहार की समझ की मांग करता है, वांछित आउटपुट प्राप्त करने के लिए जब मॉडल इन प्रॉम्प्ट्स को संसाधित करता है तो महत्वपूर्ण है।
  7. एम्बेडिंग स्टोर या वेक्टर डेटाबेस:
    • पोस्ट-प्रोसेसिंग, मॉडल्स सादे पाठ प्रतिक्रियाओं से अधिक वापस कर सकते हैं। उन्नत अनुप्रयोगों में सेमांटिक सामग्री का प्रतिनिधित्व करने वाले उच्च-आयामी वेक्टर, एम्बेडिंग की आवश्यकता हो सकती है। इन एम्बेडिंग्स को संग्रहीत किया जा सकता है या सेवा के रूप में पेश किया जा सकता है, सेमांटिक जानकारी की त्वरित पुनर्प्राप्ति या तुलना की अनुमति देता है, जो मॉडल की क्षमताओं का लाभ उठाने के तरीके को समृद्ध करता है।
  8. तैनात मॉडल (स्व-होस्टेड या एपीआई):
    • एक बार संसाधित होने के बाद, मॉडल का आउटपुट तैयार है। रणनीति के आधार पर, आउटपुट्स को स्व-होस्टेड इंटरफ़ेस या एपीआई के माध्यम से एक्सेस किया जा सकता है, जिसमें पूर्व में होस्ट संगठन को अधिक नियंत्रण प्रदान किया जाता है, और बाद वाला तीसरे पक्ष के विकासकर्ताओं के लिए स्केलेबिलिटी और आसान एकीकरण प्रदान करता है।
  9. आउटपुट:
    • यह चरण वर्कफ्लो का टैंजिबल परिणाम देता है। मॉडल एक प्रॉम्प्ट लेता है, इसे संसाधित करता है, और एक आउटपुट वापस देता है, जो अनुप्रयोग के आधार पर पाठ ब्लॉक, उत्तर, उत्पन्न कहानियां, या यहां तक कि एम्बेडिंग भी हो सकते हैं।

शीर्ष एलएलएम स्टार्टअप

एलएलएमओपीएस की भूमि में विशेषज्ञता वाले प्लेटफ़ॉर्म और स्टार्टअप्स का उदय हुआ है। एलएलएमओपीएस स्पेस से संबंधित दो स्टार्टअप/प्लेटफ़ॉर्म और उनके विवरण यहां दिए गए हैं:

कोमेटcomet llmops

कोमेट मशीन लर्निंग लाइफसाइकल को सुव्यवस्थित करता है, विशेष रूप से बड़े भाषा मॉडल विकास के लिए। यह प्रयोगों को ट्रैक करने और उत्पादन मॉडल्स का प्रबंधन करने के लिए सुविधाएं प्रदान करता है। प्लेटफ़ॉर्म बड़े उद्यम टीमों के लिए उपयुक्त है, जिसमें निजी क्लाउड, हाइब्रिड, और ऑन-प्रिमाइसेस सेटअप्स सहित विभिन्न तैनाती रणनीतियों की पेशकश की जाती है।

डिफ़ी

डिफ़ी एक ओपन-सोर्स एलएलएमओपीएस प्लेटफ़ॉर्म है जो जीपीटी-4 जैसे बड़े भाषा मॉडल्स का उपयोग करके एआई अनुप्रयोगों के विकास में सहायता करता है। इसमें एक उपयोगकर्ता-मित्र इंटरफ़ेस है और मॉडल एक्सेस, संदर्भ एम्बेडिंग, लागत नियंत्रण, और डेटा एनोटेशन क्षमताओं प्रदान करता है। उपयोगकर्ता अपने मॉडल्स को दृश्य रूप से प्रबंधित कर सकते हैं और दस्तावेज़, वेब सामग्री, या नोटियन नोट्स को एआई संदर्भ के रूप में उपयोग कर सकते हैं, जिसे डिफ़ी प्रोसेसिंग और अन्य ऑपरेशन के लिए संभालता है।

पोर्टकी

पोर्टकी एक भारतीय स्टार्टअप है जो एलएलएमओपीएस में विशेषज्ञता रखता है। लाइटस्पीड वेंचर पार्टनर्स द्वारा $3 मिलियन के सीड फंडिंग के साथ, पोर्टकी ओपनएआई और एंथ्रोपिक जैसे प्रमुख बड़े भाषा मॉडल्स के साथ एकीकरण प्रदान करता है। उनकी सेवाएं जेनरेटिव एआई कंपनियों को संबोधित करती हैं, जो अपने एलएलएम ऑपरेशन स्टैक में सुधार पर केंद्रित हैं, जिसमें रियल-टाइम कैनरी टेस्टिंग और मॉडल फाइन-ट्यूनिंग क्षमताएं शामिल हैं।

рдореИрдВ рдкрд┐рдЫрд▓реЗ рдкрд╛рдВрдЪ рд╡рд░реНрд╖реЛрдВ рд╕реЗ рдорд╢реАрди рд▓рд░реНрдирд┐рдВрдЧ рдФрд░ рдбреАрдк рд▓рд░реНрдирд┐рдВрдЧ рдХреА рдЖрдХрд░реНрд╖рдХ рджреБрдирд┐рдпрд╛ рдореЗрдВ рдЦреБрдж рдХреЛ рдбреВрдмрд╛ рд░рд╣рд╛ рд╣реВрдВред рдореЗрд░рд╛ рдЬреБрдиреВрди рдФрд░ рд╡рд┐рд╢реЗрд╖рдЬреНрдЮрддрд╛ рдиреЗ рдореБрдЭреЗ 50 рд╕реЗ рдЕрдзрд┐рдХ рд╡рд┐рд╡рд┐рдз рд╕реЙрдлреНрдЯрд╡реЗрдпрд░ рдЗрдВрдЬреАрдирд┐рдпрд░рд┐рдВрдЧ рдкрд░рд┐рдпреЛрдЬрдирд╛рдУрдВ рдореЗрдВ рдпреЛрдЧрджрд╛рди рджреЗрдиреЗ рдХреЗ рд▓рд┐рдП рдкреНрд░реЗрд░рд┐рдд рдХрд┐рдпрд╛ рд╣реИ, рдЬрд┐рд╕рдореЗрдВ рд╡рд┐рд╢реЗрд╖ рд░реВрдк рд╕реЗ рдПрдЖрдИ/рдПрдордПрд▓ рдкрд░ рдзреНрдпрд╛рди рдХреЗрдВрджреНрд░рд┐рдд рдХрд┐рдпрд╛ рдЧрдпрд╛ рд╣реИред рдореЗрд░реА рд▓рдЧрд╛рддрд╛рд░ рдЬрд┐рдЬреНрдЮрд╛рд╕рд╛ рдиреЗ рдореБрдЭреЗ рдкреНрд░рд╛рдХреГрддрд┐рдХ рднрд╛рд╖рд╛ рдкреНрд░рд╕рдВрд╕реНрдХрд░рдг рдХреА рдУрд░ рдЖрдХрд░реНрд╖рд┐рдд рдХрд┐рдпрд╛ рд╣реИ, рдЬреЛ рдПрдХ рдХреНрд╖реЗрддреНрд░ рд╣реИ рдЬрд┐рд╕реЗ рдореИрдВ рдЖрдЧреЗ рдЕрдиреНрд╡реЗрд╖рдг рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдЙрддреНрд╕реБрдХ рд╣реВрдВред