कृत्रिम बुद्धिमत्ता

डीपमाइंड जैविक विज्ञान को प्रोटीन फोल्डिंग समस्या का समाधान करके बदलने के लिए तैयार है

प्रकाशित 2 दिसंबर 2020

अपडेट किया गया 25 मई 2026

Daniel Nelson

गूगल के एआई डिवीजन डीपमाइंड ने हाल ही में जैविकी की सबसे पुरानी चुनौतियों में से एक का समाधान करने की दिशा में महत्वपूर्ण प्रगति की है, जो एक प्रोटीन के आकार की गणना करना है जो एक अमीनो-अम्ल अनुक्रम से आता है। नेचर के अनुसार, इस सफलता से जीव विज्ञान और रसायन विज्ञान के क्षेत्रों को बदलने की क्षमता है, जिससे वैज्ञानिकों को कई प्रोटीनों के कार्य का पता लगाने में मदद मिलेगी जो वर्तमान में रहस्यमय हैं।

एक प्रोटीन का आकार उसके कार्य को परिभाषित करता है, और अधिकांश जैविक कार्य प्रोटीन पर निर्भर करते हैं। “प्रोटीन फोल्डिंग” उस प्रक्रिया को कहा जाता है जो अमीनो अम्ल की श्रृंखला को तीन-आयामी संरचना में परिवर्तित करती है जो प्रोटीन को अपने कार्य करने के लिए आवश्यक होती है। यदि वैज्ञानिक अमीनो अम्ल अनुक्रम और प्रोटीन के आकार के बीच संबंध का पता लगा सकते हैं, तो वे यह निर्धारित कर सकते हैं कि कौन से प्रोटीन विभिन्न जैविक प्रक्रियाओं को प्रभावित करते हैं।

वैज्ञानिकों का अनुमान है कि मानव प्रोटीनम में कम से कम 80,000 प्रोटीन हैं, लेकिन इनमें से केवल एक छोटा सा हिस्सा ही ज्ञात संरचना वाले हैं। प्रोटीन के आकार को निर्धारित करने की पारंपरिक विधि में प्रयोगशाला प्रयोगों के वर्षों की आवश्यकता होती है, यहां तक कि कंप्यूटर विज्ञान एल्गोरिदम और मॉडल की शक्ति का लाभ उठाने के बाद भी। डीपमाइंड द्वारा किया गया काम प्रोटीन संरचनाओं की खोज की प्रक्रिया को तेजी से बढ़ा सकता है, प्रोटीन की संरचना को सामान्य समय के एक अंश में सटीक रूप से निर्धारित कर सकता है।

डीपमाइंड के शोधकर्ताओं ने अपने एल्गोरिदम को लगभग 170,0000 प्रोटीन अनुक्रम और उनके साथ जुड़ी संरचनाओं के डेटाबेस पर प्रशिक्षित किया। शोधकर्ताओं द्वारा विकसित एल्गोरिदम को 100 से 200 जीपीयू पर प्रशिक्षित किया गया था, और प्रशिक्षण प्रक्रिया को पूरा होने में कुछ सप्ताह लगे। शोधकर्ताओं द्वारा विकसित मॉडल को “अल्फाफोल्ड” नाम दिया गया था।

अल्फाफोल्ड एक “टेंशन एल्गोरिदम” के माध्यम से काम करता है, जो छोटे प्रोटीन के टुकड़ों को जोड़कर शुरू होता है और फिर बड़े और बड़े खंडों को जोड़ता है। पहले छोटे अमीनो अम्ल समूह जुड़े हुए थे, और फिर एल्गोरिदम ने इन समूहों को जोड़ने के तरीकों की तलाश की।

अल्फाफोल्ड शोधकर्ताओं ने पहले जेनेटिक और संरचनात्मक डेटा पर आधारित पारंपरिक गहरे शिक्षण एल्गोरिदम का उपयोग करके अमीनो अम्ल और प्रोटीन के बीच संबंध की भविष्यवाणी करने का प्रयास किया। अल्फाफोल्ड ने तब प्रोटीन की शैली के लिए सर्वसम्मति मॉडल बनाए। जब यह तकनीक बहुत सारी सीमाओं को दिखाई दी, तो शोधकर्ताओं ने एक नई रणनीति की कोशिश की। अल्फाफोल्ड अनुसंधान टीम ने अधिक विशेषताओं पर प्रशिक्षित मॉडल बनाए, और इस बार उन्होंने मॉडल को प्रोटीन अनुक्रम की अंतिम संरचना की भविष्यवाणी करने के लिए कहा।

इंजीनियरिंग टीम ने अल्फाफोल्ड को एक प्रतियोगिता में परीक्षण किया जहां कंप्यूटर एल्गोरिदम प्रोटीन की संरचना का आकलन करने के लिए अमीनो अम्ल अनुक्रम के साथ प्रतिस्पर्धा करते हैं। प्रतियोगिता “क्रिटिकल असेसमेंट ऑफ प्रोटीन स्ट्रक्चर प्रेडिक्शन” या कास्प थी। प्रतियोगिता में भाग लेने वालों को 100 अमीनो अम्ल अनुक्रम प्रदान किए जाते हैं और उनके मॉडल को प्रोटीन की संरचना का पता लगाना होता है। न केवल अल्फाफोल्ड ने सटीकता के मामले में अन्य कंप्यूटर मॉडल को पीछे छोड़ दिया, बल्कि यह पारंपरिक, प्रयोगशाला-आधारित मॉडलिंग तकनीकों के समान प्रदर्शन किया। अल्फाफोल्ड का अंतिम, मध्य स्कोर लगभग 92 out of 100 था, जबकि प्रयोगशाला-आधारित प्रयोगात्मक विधियों को 90 का स्कोर दिया गया था। अल्फाफोल्ड का मध्य स्कोर सबसे कठिन प्रोटीन पर 87 प्रतिशत तक गिर गया।

डीपमाइंड के मुख्य कार्यकारी और सह-संस्थापक डेमिस हसाबिस के अनुसार, कंपनी पहले से ही शोधकर्ताओं को अल्फाफोल्ड तक पहुंच प्रदान करने की योजना बना रही है, और मैक्स प्लैंक इंस्टीट्यूट फॉर डेवलपमेंट बायोलॉजी के वैज्ञानिक पहले से ही एक दशक से अधिक समय से जिन प्रोटीन संरचनाओं की खोज कर रहे थे, उन्हें खोजने के लिए मॉडल का उपयोग कर रहे हैं।

यूरोपीय बायोइन्फॉर्मेटिक्स इंस्टीट्यूट के निदेशक एमेरिटस जेनेट थॉर्नटन ने साइंसमैग के माध्यम से कहा कि डीपमाइंड की उपलब्धियां “संरचनात्मक जीव विज्ञान और प्रोटीन शोध के भविष्य को बदल देंगी”। इस बीच, मैरीलैंड विश्वविद्यालय, शेडी ग्रोव के जीवविज्ञानी जॉन मौल्ट कहते हैं कि उन्हें लगता है कि प्रोटीन-फोल्डिंग समस्या का समाधान इस जीवनकाल में नहीं होगा।

जबकि अल्फाफोल्ड पारंपरिक, प्रयोगात्मक प्रोटीन संरचना खोज विधियों को पूरी तरह से बदलने की संभावना नहीं है, यह प्रोटीन संरचनाओं की खोज की गति को नाटकीय रूप से बढ़ा सकता है। शोधकर्ताओं को प्रोटीन संरचना का निर्धारण करने के लिए कम उच्च-गुणवत्ता वाले प्रयोगात्मक डेटा की आवश्यकता हो सकती है, और शोधकर्ताओं के पास पहले से ही जीनोमिक डेटा की एक बड़ी मात्रा है जिसे अल्फाफोल्ड के समाधानों का उपयोग करके संरचनाओं में अनुवादित किया जा सकता है।

Daniel Nelson

ब्लॉगर और प्रोग्रामर जिनकी विशेषज्ञता मैशीन लर्निंग और डीप लर्निंग विषयों में है। डैनियल दूसरों को सामाजिक कल्याण के लिए एआई की शक्ति का उपयोग करने में मदद करना चाहता है।

Unite.AI

डीपमाइंड जैविक विज्ञान को प्रोटीन फोल्डिंग समस्या का समाधान करके बदलने के लिए तैयार है

You may like