рдХреГрддреНрд░рд┐рдо рдмреБрджреНрдзрд┐рдорддреНрддрд╛

рдбреАрдкрдорд╛рдЗрдВрдб рдЬреИрд╡рд┐рдХ рд╡рд┐рдЬреНрдЮрд╛рди рдХреЛ рдкреНрд░реЛрдЯреАрди рдлреЛрд▓реНрдбрд┐рдВрдЧ рд╕рдорд╕реНрдпрд╛ рдХрд╛ рд╕рдорд╛рдзрд╛рди рдХрд░рдХреЗ рдмрджрд▓рдиреЗ рдХреЗ рд▓рд┐рдП рддреИрдпрд╛рд░ рд╣реИ

mm

गूगल के एआई डिवीजन डीपमाइंड ने हाल ही में जैविकी की सबसे पुरानी चुनौतियों में से एक का समाधान करने की दिशा में महत्वपूर्ण प्रगति की है, जो एक प्रोटीन के आकार की गणना करना है जो एक अमीनो-अम्ल अनुक्रम से आता है। नेचर के अनुसार, इस सफलता से जीव विज्ञान और रसायन विज्ञान के क्षेत्रों को बदलने की क्षमता है, जिससे वैज्ञानिकों को कई प्रोटीनों के कार्य का पता लगाने में मदद मिलेगी जो वर्तमान में रहस्यमय हैं।

एक प्रोटीन का आकार उसके कार्य को परिभाषित करता है, और अधिकांश जैविक कार्य प्रोटीन पर निर्भर करते हैं। “प्रोटीन फोल्डिंग” उस प्रक्रिया को कहा जाता है जो अमीनो अम्ल की श्रृंखला को तीन-आयामी संरचना में परिवर्तित करती है जो प्रोटीन को अपने कार्य करने के लिए आवश्यक होती है। यदि वैज्ञानिक अमीनो अम्ल अनुक्रम और प्रोटीन के आकार के बीच संबंध का पता लगा सकते हैं, तो वे यह निर्धारित कर सकते हैं कि कौन से प्रोटीन विभिन्न जैविक प्रक्रियाओं को प्रभावित करते हैं।

वैज्ञानिकों का अनुमान है कि मानव प्रोटीनम में कम से कम 80,000 प्रोटीन हैं, लेकिन इनमें से केवल एक छोटा सा हिस्सा ही ज्ञात संरचना वाले हैं। प्रोटीन के आकार को निर्धारित करने की पारंपरिक विधि में प्रयोगशाला प्रयोगों के वर्षों की आवश्यकता होती है, यहां तक कि कंप्यूटर विज्ञान एल्गोरिदम और मॉडल की शक्ति का लाभ उठाने के बाद भी। डीपमाइंड द्वारा किया गया काम प्रोटीन संरचनाओं की खोज की प्रक्रिया को तेजी से बढ़ा सकता है, प्रोटीन की संरचना को सामान्य समय के एक अंश में सटीक रूप से निर्धारित कर सकता है।

डीपमाइंड के शोधकर्ताओं ने अपने एल्गोरिदम को लगभग 170,0000 प्रोटीन अनुक्रम और उनके साथ जुड़ी संरचनाओं के डेटाबेस पर प्रशिक्षित किया। शोधकर्ताओं द्वारा विकसित एल्गोरिदम को 100 से 200 जीपीयू पर प्रशिक्षित किया गया था, और प्रशिक्षण प्रक्रिया को पूरा होने में कुछ सप्ताह लगे। शोधकर्ताओं द्वारा विकसित मॉडल को “अल्फाफोल्ड” नाम दिया गया था।

अल्फाफोल्ड एक “टेंशन एल्गोरिदम” के माध्यम से काम करता है, जो छोटे प्रोटीन के टुकड़ों को जोड़कर शुरू होता है और फिर बड़े और बड़े खंडों को जोड़ता है। पहले छोटे अमीनो अम्ल समूह जुड़े हुए थे, और फिर एल्गोरिदम ने इन समूहों को जोड़ने के तरीकों की तलाश की।

अल्फाफोल्ड शोधकर्ताओं ने पहले जेनेटिक और संरचनात्मक डेटा पर आधारित पारंपरिक गहरे शिक्षण एल्गोरिदम का उपयोग करके अमीनो अम्ल और प्रोटीन के बीच संबंध की भविष्यवाणी करने का प्रयास किया। अल्फाफोल्ड ने तब प्रोटीन की शैली के लिए सर्वसम्मति मॉडल बनाए। जब यह तकनीक बहुत सारी सीमाओं को दिखाई दी, तो शोधकर्ताओं ने एक नई रणनीति की कोशिश की। अल्फाफोल्ड अनुसंधान टीम ने अधिक विशेषताओं पर प्रशिक्षित मॉडल बनाए, और इस बार उन्होंने मॉडल को प्रोटीन अनुक्रम की अंतिम संरचना की भविष्यवाणी करने के लिए कहा।

इंजीनियरिंग टीम ने अल्फाफोल्ड को एक प्रतियोगिता में परीक्षण किया जहां कंप्यूटर एल्गोरिदम प्रोटीन की संरचना का आकलन करने के लिए अमीनो अम्ल अनुक्रम के साथ प्रतिस्पर्धा करते हैं। प्रतियोगिता “क्रिटिकल असेसमेंट ऑफ प्रोटीन स्ट्रक्चर प्रेडिक्शन” या कास्प थी। प्रतियोगिता में भाग लेने वालों को 100 अमीनो अम्ल अनुक्रम प्रदान किए जाते हैं और उनके मॉडल को प्रोटीन की संरचना का पता लगाना होता है। न केवल अल्फाफोल्ड ने सटीकता के मामले में अन्य कंप्यूटर मॉडल को पीछे छोड़ दिया, बल्कि यह पारंपरिक, प्रयोगशाला-आधारित मॉडलिंग तकनीकों के समान प्रदर्शन किया। अल्फाफोल्ड का अंतिम, मध्य स्कोर लगभग 92 out of 100 था, जबकि प्रयोगशाला-आधारित प्रयोगात्मक विधियों को 90 का स्कोर दिया गया था। अल्फाफोल्ड का मध्य स्कोर सबसे कठिन प्रोटीन पर 87 प्रतिशत तक गिर गया।

डीपमाइंड के मुख्य कार्यकारी और सह-संस्थापक डेमिस हसाबिस के अनुसार, कंपनी पहले से ही शोधकर्ताओं को अल्फाफोल्ड तक पहुंच प्रदान करने की योजना बना रही है, और मैक्स प्लैंक इंस्टीट्यूट फॉर डेवलपमेंट बायोलॉजी के वैज्ञानिक पहले से ही एक दशक से अधिक समय से जिन प्रोटीन संरचनाओं की खोज कर रहे थे, उन्हें खोजने के लिए मॉडल का उपयोग कर रहे हैं।

यूरोपीय बायोइन्फॉर्मेटिक्स इंस्टीट्यूट के निदेशक एमेरिटस जेनेट थॉर्नटन ने साइंसमैग के माध्यम से कहा कि डीपमाइंड की उपलब्धियां “संरचनात्मक जीव विज्ञान और प्रोटीन शोध के भविष्य को बदल देंगी”। इस बीच, मैरीलैंड विश्वविद्यालय, शेडी ग्रोव के जीवविज्ञानी जॉन मौल्ट कहते हैं कि उन्हें लगता है कि प्रोटीन-फोल्डिंग समस्या का समाधान इस जीवनकाल में नहीं होगा।

जबकि अल्फाफोल्ड पारंपरिक, प्रयोगात्मक प्रोटीन संरचना खोज विधियों को पूरी तरह से बदलने की संभावना नहीं है, यह प्रोटीन संरचनाओं की खोज की गति को नाटकीय रूप से बढ़ा सकता है। शोधकर्ताओं को प्रोटीन संरचना का निर्धारण करने के लिए कम उच्च-गुणवत्ता वाले प्रयोगात्मक डेटा की आवश्यकता हो सकती है, और शोधकर्ताओं के पास पहले से ही जीनोमिक डेटा की एक बड़ी मात्रा है जिसे अल्फाफोल्ड के समाधानों का उपयोग करके संरचनाओं में अनुवादित किया जा सकता है।

рдмреНрд▓реЙрдЧрд░ рдФрд░ рдкреНрд░реЛрдЧреНрд░рд╛рдорд░ рдЬрд┐рдирдХреА рд╡рд┐рд╢реЗрд╖рдЬреНрдЮрддрд╛ рдореИрд╢реАрди рд▓рд░реНрдирд┐рдВрдЧ рдФрд░ рдбреАрдк рд▓рд░реНрдирд┐рдВрдЧ рд╡рд┐рд╖рдпреЛрдВ рдореЗрдВ рд╣реИред рдбреИрдирд┐рдпрд▓ рджреВрд╕рд░реЛрдВ рдХреЛ рд╕рд╛рдорд╛рдЬрд┐рдХ рдХрд▓реНрдпрд╛рдг рдХреЗ рд▓рд┐рдП рдПрдЖрдИ рдХреА рд╢рдХреНрддрд┐ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдиреЗ рдореЗрдВ рдорджрдж рдХрд░рдирд╛ рдЪрд╛рд╣рддрд╛ рд╣реИред