ठूंठ केविन ट्यूब्स, पीएचडी, पेंगुइन कंप्यूटिंग में एसवीपी स्ट्रैटेजिक सॉल्यूशंस ग्रुप - साक्षात्कार श्रृंखला - यूनाइट.एआई
हमसे जुडे

साक्षात्कार

केविन ट्यूब्स, पीएचडी, पेंगुइन कंप्यूटिंग में एसवीपी स्ट्रैटेजिक सॉल्यूशंस ग्रुप - साक्षात्कार श्रृंखला

mm

प्रकाशित

 on

केविन ट्यूब्स, पीएचडी, स्ट्रैटेजिक सॉल्यूशंस ग्रुप के वरिष्ठ उपाध्यक्ष हैं पेंगुइन कंप्यूटिंग. पेंगुइन कंप्यूटिंग कस्टम डिजाइन अज्ञेयवादी, एंड-टू-एंड (हार्डवेयर/सॉफ्टवेयर/क्लाउड/सर्विसेज) समाधान आज की फॉर्च्यून 500 कंपनियों, स्टार्टअप, शैक्षणिक संस्थानों और संघीय संगठनों के सामने आने वाली जटिल वैज्ञानिक, विश्लेषणात्मक और इंजीनियरिंग समस्याओं को हल करने के लिए

सबसे पहले आपको कंप्यूटर विज्ञान के क्षेत्र की ओर किस चीज़ ने आकर्षित किया?

जब मैं बहुत छोटा था तब मेरी माँ और पिताजी ने मेरे लिए एक कंप्यूटर खरीदा था, और मेरी हमेशा से ही कंप्यूटर और टिंकरिंग में रुचि और आदत रही है। अपनी शिक्षा के माध्यम से मैं लगातार एसटीईएम क्षेत्रों की ओर आकर्षित हुआ और इससे मुझे अधिक व्यावहारिक क्षेत्र में शामिल होने की इच्छा हुई। मेरी पृष्ठभूमि भौतिकी और उच्च प्रदर्शन कंप्यूटिंग (एचपीसी) है। शुरू से ही कंप्यूटर के प्रति प्रेम होने के कारण मुझे कंप्यूटर विज्ञान को किसी भी अन्य विज्ञान, गणित या इंजीनियरिंग रुचि में सबसे आगे रखने की अनुमति मिली, जिसने मुझे आज इस मुकाम तक पहुंचाया है।

पेंगुइन कंप्यूटिंग ओपन कंप्यूट प्रोजेक्ट (ओसीपी) के साथ मिलकर काम करता है - वह वास्तव में क्या है?

की शुरुआत के बाद से कम्प्यूट प्रोजेक्ट खोलें (ओसीपी) आंदोलन, पेंगुइन कंप्यूटिंग ओसीपी के लाभों को उच्च प्रदर्शन कंप्यूटिंग (एचपीसी) और कृत्रिम बुद्धिमत्ता (एआई) में लाने के प्रयास में एक प्रारंभिक अपनाने वाला, समर्थक और प्रमुख योगदानकर्ता रहा है।

ओसीपी का ध्यान डेवलपर्स के एक वैश्विक समुदाय को एक साथ लाने पर है ताकि बुनियादी ढांचा प्रौद्योगिकी का एक पूर्ण पारिस्थितिकी तंत्र तैयार किया जा सके, जिसे अधिक कुशल, लचीला और स्केलेबल बनाया जाए। ओपन प्रौद्योगिकियों और एक समुदाय के विचार के कारण पेंगुइन कंप्यूटिंग ओसीपी में शामिल हो गया। हमने समय के साथ यह सुनिश्चित किया है कि पारंपरिक एचपीसी की विरासत और प्रौद्योगिकियां तथा एआई और एनालिटिक्स में उभरते रुझान कुशलतापूर्वक बढ़ सकें - पेंगुइन कंप्यूटिंग उन चीजों को ओसीपी में चलाती है।

ओसीपी के लाभों में से एक यह है कि यह स्वामित्व की कुल लागत (टीसीओ) को कम करता है - कम पूंजी व्यय, सभी व्यर्थ तत्वों को हटाने के लिए धन्यवाद, और सामने से सेवा, साझा शक्ति और अन्य डिज़ाइन परिवर्तनों के कारण कम परिचालन व्यय - जो बनाता है ओसीपी-आधारित तकनीक स्केल आउट के लिए बिल्कुल उपयुक्त है।

पेंगुइन कंप्यूटिंग के पास पेंगुइन कंप्यूटिंग टुंड्रा एक्सट्रीम स्केल प्लेटफॉर्म और पेंगुइन कंप्यूटिंग टुंड्रा एपी सहित कई ओसीपी उत्पाद हैं। टुंड्रा प्लेटफ़ॉर्म एचपीसी और एआई वर्कलोड के साथ भी संगत हैं।

टुंड्रा एपी, हमारे अत्यधिक घने टुंड्रा सुपरकंप्यूटिंग प्लेटफ़ॉर्म की नवीनतम पीढ़ी, पेंगुइन कंप्यूटिंग के साथ Intel® Xeon® स्केलेबल 9200 श्रृंखला प्रोसेसर की प्रसंस्करण शक्ति को जोड़ती है रिलायन XO1122eAP सर्वर एक ओसीपी फॉर्म फैक्टर में जो प्रति रैक सीपीयू कोर का उच्च घनत्व प्रदान करता है।

जब बड़े डेटा की बात आती है, तो प्रदर्शन स्तर को अनुकूलित करने के लिए उपयोगकर्ताओं को उन बाधाओं को दूर करने की आवश्यकता होती है जो डेटा तक उनकी पहुंच को धीमा कर देती हैं। पेंगुइन कंप्यूटिंग इस समस्या से कैसे निपटता है?

पेंगुइन कंप्यूटिंग ने ओपन प्रौद्योगिकियों का उपयोग करने और वर्तमान रुझानों के साथ तेजी से आगे बढ़ने की हमारी क्षमता का लाभ उठाया है - जिनमें से एक बड़ा डेटा या डेटा और डेटा संचालित वर्कलोड की वृद्धि है। इसके जवाब में, हमने इस समस्या के समाधान के लिए अपना रणनीतिक समाधान समूह बनाया है।

समस्या का समाधान करने में, हमने पाया है कि अधिकांश कार्यभार, यहां तक ​​कि पारंपरिक तकनीकी गणना से भी, अधिक डेटा संचालित होने के लिए प्रेरित होते हैं। परिणामस्वरूप, पेंगुइन कंप्यूटिंग उपयोगकर्ताओं के कार्यभार को समझने की कोशिश करके संपूर्ण एंड-टू-एंड समाधान डिज़ाइन करता है। वर्कलोड अनुकूलित एंड-टू-एंड समाधान बनाने के लिए, हम वर्कलोड अनुकूलित सॉफ़्टवेयर परत पर ध्यान केंद्रित करते हैं जिसमें ऑर्केस्ट्रेशन और वर्कलोड डिलीवरी शामिल है। मूलतः, हमें यह समझने की आवश्यकता है कि उपयोगकर्ता बुनियादी ढांचे का उपयोग कैसे करेगा।

इसके बाद, हम कार्यभार अनुकूलित कंप्यूट बुनियादी ढांचे पर ध्यान केंद्रित करने का प्रयास करते हैं। डेटा और IO चुनौतियों के विभिन्न स्तर हैं जो गणना भाग पर बहुत अधिक दबाव डालते हैं। उदाहरण के लिए, अलग-अलग कार्यभार के लिए सीपीयू, जीपीयू, मेमोरी बैंडविड्थ और नेटवर्किंग से त्वरित गणना बुनियादी ढांचे के विभिन्न संयोजनों की आवश्यकता होती है जो उस डेटा को प्रवाहित करने और उस पर गणना करने की अनुमति देता है।

अंत में, हमें यह पता लगाने की आवश्यकता है कि किस प्रकार के समाधान हमें वह डेटा वितरित करने की अनुमति देंगे। हम यह समझने के लिए वर्कलोड अनुकूलित डेटा इन्फ्रास्ट्रक्चर को देखते हैं कि वर्कलोड डेटा के साथ कैसे इंटरैक्ट करता है, क्षमता की आवश्यकताएं और आईओ पैटर्न क्या हैं। एक बार जब हमें वह जानकारी मिल जाती है, तो यह हमें कार्यभार अनुकूलित प्रणाली डिज़ाइन करने में मदद करती है।

एक बार जब हमारे पास सारी जानकारी हो जाती है तो हम एक डिज़ाइन और संपूर्ण समाधान तैयार करने के लिए पेंगुइन कंप्यूटिंग में अपनी आंतरिक विशेषज्ञता का लाभ उठाते हैं। यह जानते हुए कि इसे प्रदर्शन के नजरिए से डिज़ाइन किया गया है, हमें यह समझने की ज़रूरत है कि इसे कहाँ तैनात किया गया है (परिसर, क्लाउड, किनारे, सभी के संयोजन आदि पर)। यह डेटा संचालित कार्यभार के लिए एक अनुकूलित समाधान प्रदान करने के लिए पेंगुइन कंप्यूटिंग का दृष्टिकोण है।

क्या आप गहन शिक्षण के लिए सीपीयू के बजाय जीपीयू का उपयोग करने के महत्व पर चर्चा कर सकते हैं?

डीप लर्निंग (डीएल) के लिए जीपीयू के महत्व के संबंध में मैंने जो सबसे बड़ा रुझान देखा है, वह हार्डवेयर के डेटा समानांतर टुकड़े के रूप में सामान्य प्रयोजन जीपीयू (जीपीजीपीयू) का उपयोग करना था जिसने हमें गणना की मात्रा में बड़े पैमाने पर तेजी लाने की अनुमति दी थी। कोर जिन्हें आप समानांतर कंप्यूटिंग समस्या को हल करने के लिए वितरित कर सकते हैं। पिछले दस सालों से यही चल रहा है.

जब मैं ग्रेजुएट स्कूल में था और अपने करियर की शुरुआत में मैंने जीपीजीपीयू प्रोग्रामिंग के शुरुआती चरणों में भाग लिया था। मेरा मानना ​​है कि कंप्यूट घनत्व में उछाल है, जहां एक जीपीयू एक डिवाइस पर बहुत सारे घने कंप्यूट और एनालिटिक्स कोर प्रदान करता है और आपको सर्वर स्पेस में और अधिक प्राप्त करने की अनुमति देता है और किसी ऐसी चीज को पुन: उपयोग करने में सक्षम बनाता है जो मूल रूप से एक कंप्यूट इंजन के लिए ग्राफिक्स के लिए थी। एचपीसी और अंततः एआई समुदायों में एक वास्तविक आंखें खोलने वाली प्रवृत्ति थी।

हालाँकि, उनमें से अधिकांश सीपीयू के बजाय जीपीयू पर चलने के लिए कोड को परिवर्तित और अनुकूलित करने पर निर्भर थे। जैसा कि हमने वह सब काम किया था, हम किलर ऐप की अवधारणा की प्रतीक्षा कर रहे थे - एप्लिकेशन या उपयोग का मामला जो वास्तव में जीपीयू द्वारा शुरू होता है या सक्षम होता है। जीपीजीपीयू समुदाय के लिए, डीएल वह किलर एप्लिकेशन था जिसने एचपीसी और एआई वर्कलोड को तेज करने में प्रयासों और विकास को प्रेरित किया।

समय के साथ, एआई और मशीन लर्निंग (एमएल) का पुनरुत्थान हुआ और डीएल चलन में आया। हमने महसूस किया कि डीएल का उपयोग करके एक तंत्रिका नेटवर्क का प्रशिक्षण वास्तव में एक जीपीयू के अंतर्निहित डिजाइन को बहुत अच्छी तरह से मैप करता है। मेरा मानना ​​​​है कि एक बार जब ये दो चीजें एक साथ आ जाती हैं तो आपके पास उस प्रकार के डीएल को करने की क्षमता होती है जो पहले सीपीयू प्रोसेसर द्वारा संभव नहीं बनाया गया था और अंततः बड़े पैमाने पर और व्यवहार में एआई करने की हमारी क्षमता सीमित हो गई थी।

एक बार जब जीपीयू अस्तित्व में आया तो इसने वास्तव में एआई और डीएल के आसपास अनुसंधान और विकास समुदाय को फिर से सक्रिय कर दिया क्योंकि आपके पास इसे कुशलतापूर्वक करने के लिए गणना का स्तर नहीं था और यह लोकतांत्रिक नहीं था। जीपीयू वास्तव में आपको एक सघन गणना प्रदान करने की अनुमति देता है जो इसके मूल में डीएल के लिए अच्छी तरह से डिज़ाइन किया गया है और इसे हार्डवेयर आर्किटेक्चर समाधानों के स्तर पर लाया गया है जिससे अधिक शोधकर्ताओं और वैज्ञानिकों तक पहुंचना आसान हो गया है। मेरा मानना ​​है कि यह एक बड़ा कारण है कि डीएल के अध्ययन के लिए जीपीयू बेहतर हैं।

पेंगुइन कंप्यूटिंग द्वारा पेश किए गए कुछ जीपीयू-त्वरित कंप्यूटिंग समाधान क्या हैं?

पेंगुइन कंप्यूटिंग वर्तमान में हमारे रणनीतिक समाधान समूह द्वारा विशेष रूप से पेंगुइन कंप्यूटिंग के एआई और एनालिटिक्स प्रैक्टिस के साथ अंतिम समाधानों पर काम कर रहा है। इस अभ्यास के अंतर्गत हम GPU-त्वरित समाधानों के लिए तीन उच्च स्तरीय दृष्टिकोणों पर ध्यान केंद्रित कर रहे हैं।

सबसे पहले, हम एज एनालिटिक्स के लिए एक संदर्भ आर्किटेक्चर की पेशकश करते हैं, जहां हम ऐसे समाधान डिजाइन करना चाहते हैं जो गैर-पारंपरिक डेटा केंद्रों (किनारे पर या किनारे के पास) में फिट हों। इसमें टेलीकॉम एज डेटासेंटर, खुदरा सुविधाएं, गैस स्टेशन और बहुत कुछ शामिल हो सकते हैं। ये सभी अनुमान आधारित AI समाधान हैं। कुछ समाधान संपर्क अनुरेखण और हावभाव पहचान के लिए वीडियो विश्लेषण की दिशा में तैयार किए गए हैं ताकि यह निर्धारित किया जा सके कि कोई व्यक्ति अपने हाथ धो रहा है या मास्क पहन रहा है। ये संपूर्ण समाधानों के अनुप्रयोग हैं जिनमें जीपीयू-त्वरित हार्डवेयर शामिल है जो गैर-पारंपरिक या किनारे की तैनाती के साथ-साथ शोधकर्ताओं और अंतिम-उपयोगकर्ताओं को प्रभावी ढंग से उपयोग करने में सक्षम करने के लिए सॉफ़्टवेयर स्टैक के लिए ठीक से ट्यून किया गया है।

पेंगुइन कंप्यूटिंग समाधानों की अगली श्रेणी डेटा सेंटर और कोर एआई प्रशिक्षण और अनुमान संदर्भ आर्किटेक्चर के लिए बनाई गई है। आप बड़े पैमाने के डेटा सेंटर के अंदर या क्लाउड (पेंगुइन कंप्यूटिंग क्लाउड) में बैठने के बारे में सोच सकते हैं, जहां हमारे कुछ ग्राहक डीएल को गति देने के लिए हजारों जीपीयू का उपयोग करने पर बड़े पैमाने पर प्रशिक्षण ले रहे हैं। हम देखते हैं कि हम संपूर्ण समाधान और संदर्भ आर्किटेक्चर कैसे प्रदान करते हैं जो इन सभी सॉफ़्टवेयर वर्कलोड और GPU डिज़ाइन और लेआउट के माध्यम से कंटेनरीकरण का समर्थन करते हैं, सभी तरह से डेटा बुनियादी ढांचे की आवश्यकताओं के माध्यम से जो इसका समर्थन करते हैं।

इस अभ्यास में संदर्भ आर्किटेक्चर का तीसरा वर्ग पिछले दो का संयोजन है। हम अपने तीसरे संदर्भ आर्किटेक्चर परिवार में जो खोज रहे हैं वह यह है कि हम निरंतर सीखने को सक्षम करने के लिए डेटा फैब्रिक और रास्ते और वर्कफ़्लो कैसे बनाते हैं ताकि आप हमारे एज जीपीयू-त्वरित समाधानों का उपयोग करके अनुमान लगा सकें, उस डेटा को निजी या सार्वजनिक क्लाउड पर भेज सकें , इस पर प्रशिक्षण जारी रखें, और जैसे ही नए प्रशिक्षण मॉडल अपडेट किए जाते हैं, उसे अनुमान लगाने के लिए वापस धकेलें। इस तरह हमारे पास निरंतर सीखने और एआई मॉडल का एक पुनरावृत्त चक्र है।

पेंगुइन कंप्यूटिंग ने हाल ही में इंटेल और कूलआईटी के साथ साझेदारी में एलएलएनएल के लिए एक नया सुपर कंप्यूटर तैनात किया है। क्या आप हमें इस सुपरकंप्यूटर के बारे में बता सकते हैं और इसे किस लिए डिज़ाइन किया गया था?

एलएलएनएल में तैनात मैग्मा सुपरकंप्यूटर को राष्ट्रीय परमाणु सुरक्षा प्रशासन (एनएनएसए) के साथ कमोडिटी टेक्नोलॉजी सिस्टम्स (सीटीएस-1) अनुबंध के माध्यम से खरीदा गया था और यह कूलआईटी सिस्टम्स के समर्थन के साथ इंटेल ज़ीऑन प्लैटिनम 9200 श्रृंखला प्रोसेसर की पहली तैनाती में से एक है। तरल शीतलन और ओमनी-पथ इंटरकनेक्ट।

एनएनएसए के उन्नत सिमुलेशन और कंप्यूटिंग (एएससी) कार्यक्रम के माध्यम से वित्त पोषित, मैग्मा एनएनएसए के जीवन विस्तार कार्यक्रम और भूमिगत परीक्षण के अभाव में देश के परमाणु हथियारों की सुरक्षा, सुरक्षा और विश्वसनीयता सुनिश्चित करने के लिए महत्वपूर्ण प्रयासों का समर्थन करेगा।

मैग्मा सुपरकंप्यूटर एक एचपीसी प्रणाली है जो कृत्रिम बुद्धिमत्ता द्वारा संवर्धित है और एक अभिसरण मंच है जो एआई को एचपीसी मॉडलिंग में तेजी लाने की अनुमति देता है। मैग्मा को जून 2020 की टॉप500 सूची में स्थान दिया गया, जो शीर्ष 100 में शामिल होकर #80 पर आ गया।

सीटीएस-1 अनुबंध के तहत, पेंगुइन कंप्यूटिंग ने लॉरेंस लिवरमोर, लॉस एलामोस और सैंडिया नेशनल लेबोरेटरीज के एनएनएसए ट्राई-लैब्स में एएससी कार्यक्रम का समर्थन करने के लिए कंप्यूटिंग क्षमता के 22 से अधिक पेटाफ्लॉप वितरित किए हैं।

पेंगुइन कंप्यूटिंग किन विभिन्न तरीकों से COVID-19 के खिलाफ लड़ाई का समर्थन कर रहा है?

जून 2020 में, पेंगुइन कंप्यूटिंग ने अमेरिका के तीन शीर्ष विश्वविद्यालयों - न्यूयॉर्क यूनिवर्सिटी (एनवाईयू), मैसाचुसेट्स इंस्टीट्यूट ऑफ टेक्नोलॉजी (एमआईटी) और राइस यूनिवर्सिटी - के शोधकर्ताओं को एचपीसी क्षमताएं प्रदान करने के लिए आधिकारिक तौर पर एएमडी के साथ साझेदारी की, ताकि सीओवीआईडी ​​​​के खिलाफ लड़ाई में मदद मिल सके। 19.

पेंगुइन कंप्यूटिंग ने अनुसंधान संस्थानों को COVID-19 और अन्य बीमारियों पर चिकित्सा अनुसंधान में तेजी लाने के लिए महत्वपूर्ण कंप्यूटिंग संसाधन प्रदान करने के लिए AMD के COVID-19 HPC फंड के साथ सीधे भागीदारी की है। पेंगुइन कंप्यूटिंग और एएमडी सैकड़ों वैज्ञानिकों की अनुसंधान क्षमताओं को बढ़ाने में मदद करने के लिए एनवाईयू, एमआईटी और राइस यूनिवर्सिटी को ऑन-प्रिमाइसेस और क्लाउड-आधारित एचपीसी समाधान प्रदान करने के लिए सहयोग कर रहे हैं, जो अंततः उपन्यास कोरोनवायरस की अधिक समझ में योगदान देंगे।

नवीनतम दूसरी पीढ़ी के AMD EPYC प्रोसेसर और Radeon Instinct MI2 GPU एक्सेलेरेटर द्वारा संचालित, विश्वविद्यालयों को दान किए गए प्रत्येक सिस्टम से एक से अधिक पेटाफ्लॉप कंप्यूट प्रदर्शन प्रदान करने की उम्मीद है। हमारी एचपीसी क्लाउड सेवा, पेंगुइन कंप्यूटिंग® ऑन-डिमांड™ (पीओडी) के माध्यम से शोधकर्ताओं को गणना क्षमता के अतिरिक्त चार पेटाफ्लॉप उपलब्ध कराए जाएंगे। संयुक्त रूप से, दान की गई प्रणालियाँ शोधकर्ताओं को सात से अधिक पेटाफ्लॉप्स जीपीयू त्वरित गणना शक्ति प्रदान करेंगी जिन्हें सीओवीआईडी-50 से लड़ने के लिए लागू किया जा सकता है।

प्राप्तकर्ता विश्वविद्यालयों से जीनोमिक्स, वैक्सीन विकास, ट्रांसमिशन विज्ञान और मॉडलिंग सहित महामारी से संबंधित कार्यभार की एक श्रृंखला में नई गणना क्षमता का उपयोग करने की उम्मीद की जाती है।

पेंगुइन कंप्यूटिंग के बारे में आप और कुछ साझा करना चाहेंगे?

दो दशकों से अधिक समय से, पेंगुइन कंप्यूटिंग उच्च प्रदर्शन और तकनीकी कंप्यूटिंग दुनिया के लिए कस्टम, अभिनव और खुले समाधान प्रदान कर रहा है। पेंगुइन कंप्यूटिंग समाधान संगठनों को अपने कंप्यूटिंग वातावरण में नवीनतम प्रौद्योगिकियों का लाभ उठाने के लिए आवश्यक चपलता और स्वतंत्रता प्रदान करते हैं। संगठन अपने संसाधनों को अंतर्निहित प्रौद्योगिकियों के बजाय रिकॉर्ड समय में उत्पादों और विचारों को बाजार में पहुंचाने पर ध्यान केंद्रित कर सकते हैं। एआई/एमएल/एनालिटिक्स, एचपीसी, डेटाऑप्स और क्लाउड नेटिव प्रौद्योगिकियों के लिए पेंगुइन कंप्यूटिंग के समाधानों की विस्तृत श्रृंखला को न केवल वर्तमान जरूरतों को पूरा करने के लिए अनुकूलित और संयोजित किया जा सकता है, बल्कि भविष्य की जरूरतों और प्रौद्योगिकी परिवर्तनों के लिए तेजी से अनुकूलित किया जा सकता है। पेंगुइन कंप्यूटिंग प्रोफेशनल और प्रबंधित सेवाएँ समाधानों को एकीकृत करने, लागू करने और प्रबंधित करने में मदद करती हैं। पेंगुइन कंप्यूटिंग होस्टिंग सेवाएँ संगठनों को स्वामित्व विकल्प और ऑन-प्रिमाइसेस, सार्वजनिक या समर्पित क्लाउड, होस्टेड या सेवा के रूप में चलाने की लचीलापन देकर गणना वातावरण के "कहां" में मदद कर सकती हैं।

बेहतरीन साक्षात्कार के लिए धन्यवाद, जो पाठक अधिक जानना चाहते हैं उन्हें अवश्य आना चाहिए पेंगुइन कंप्यूटिंग.

Unity.AI का संस्थापक भागीदार और सदस्य फोर्ब्स प्रौद्योगिकी परिषद, एंटोनी एक है भविष्यवादी जो एआई और रोबोटिक्स के भविष्य को लेकर उत्साहित हैं।

के संस्थापक भी हैं सिक्योरिटीज.io, एक वेबसाइट जो विघटनकारी प्रौद्योगिकी में निवेश पर केंद्रित है।