الذكاء الاصطناعي
DeepMind تستعد لتحويل العلوم البيولوجية من خلال حل مشكلة طي البروتين

قام قسم الذكاء الاصطناعي في Google DeepMind مؤخرًا حققت تقدما كبيرا نحو حل أحد أقدم التحديات في علم الأحياء، حساب شكل البروتين من تسلسل الأحماض الأمينية. وفقًا لـ Nature ، فإن هذا الاختراق لديه القدرة على تحويل مجالات البيولوجيا والكيمياء ، مما يمكّن العلماء من تحديد وظيفة العديد من البروتينات الغامضة حاليًا.
يحدد شكل البروتين وظيفته ، وتعتمد معظم الوظائف البيولوجية على البروتينات. "البروتين للطي" هو الاسم الذي يطلق على العملية التي تحول سلاسل الأحماض الأمينية إلى الهياكل ثلاثية الأبعاد التي تتطلبها البروتيونات للقيام بوظائفها. إذا تمكن العلماء من تحديد العلاقة بين تسلسل الأحماض الأمينية وشكل البروتينات التي يولدونها ، فيمكنهم تحديد البروتينات التي تؤثر على العمليات البيولوجية المختلفة.
يفترض العلماء أن هناك ما لا يقل عن 80,000 بروتين داخل البروتين البشري ، لكن جزءًا صغيرًا فقط من هذه البروتينات له هياكل معروفة. يمكن أن تستغرق الطريقة التقليدية لتحديد شكل البروتين سنوات من التجارب المعملية ، وحتى الاستفادة من قوة خوارزميات ونماذج علوم الكمبيوتر. يمكن للعمل الذي تقوم به DeepMind تسريع عملية اكتشاف هياكل البروتين بشكل كبير ، وتحديد بنية البروتينات بشكل موثوق في جزء صغير من الوقت العادي.
قام الباحثون في DeepMind بتدريب خوارزمياتهم على قاعدة بيانات تتكون من حوالي 170,0000 تسلسل بروتين والأشكال المقابلة لتلك التسلسلات. تم تدريب الخوارزميات التي طورها الباحثون على ما بين 100 إلى 200 وحدة معالجة رسومات ، واستغرقت عملية التدريب بضعة أسابيع حتى تكتمل. أطلق على النموذج الذي طوره الباحثون اسم "AlphaFold".
يعمل AlphaFold من خلال "خوارزمية التوتر" ، بدءًا من توصيل قطع صغيرة من البروتين معًا ثم توسيع نطاقها لتوصيل أقسام أكبر وأكبر. تم ربط مجموعات الأحماض الأمينية الصغيرة معًا في البداية ، ثم سعت الخوارزمية لإيجاد طرق لربط هذه المجموعات.
حاول باحثو AlphaFold في البداية استخدام خوارزميات التعلم العميق التقليدية على البيانات الجينية والهيكلية للتنبؤ بالعلاقة بين الأحماض الأمينية والبروتينات. ثم أنشأ AlphaFold نماذج إجماع لأسلوب البروتينات. عندما ثبت أن هذه التقنية بها الكثير من القيود ، جرب الباحثون استراتيجية جديدة. قام فريق البحث AlphaFold بإنشاء نماذج مدربة على المزيد من الميزات ، وهذه المرة لديهم توقعات عودة النموذج للهيكل النهائي لتسلسل البروتين.
اختبر فريق الهندسة AlphaFold عن طريق الدخول في مسابقة حيث تتنافس خوارزميات الكمبيوتر لتقييم بنية البروتين من تسلسل الأحماض الأمينية. كانت المسابقة هي "التقييم النقدي لتوقع بنية البروتين" أو CASP. يتم تزويد المشاركين في المسابقة بـ 100 تسلسل من الأحماض الأمينية ويجب أن تعمل نماذجهم على تكوين بنية البروتينات. لم يقتصر الأمر على تفوق AlphaFold على نماذج الكمبيوتر الأخرى من حيث الدقة ، بل كان أداؤها أيضًا مشابهًا لتقنيات النمذجة التقليدية القائمة على المختبر. كانت النتيجة النهائية لمتوسط AlphaFold تقريبًا 92 من أصل 100 ، مع تخصيص درجة 90 للطرق التجريبية المعتمدة على المعمل. انخفض متوسط درجة AlphaFold إلى 87 بالمائة على البروتينات الأكثر صعوبة.
وفقًا للرئيس التنفيذي لشركة DeepMind والمؤسس المشارك ديميس هاسابيس، تضع الشركة بالفعل خططًا لمنح الباحثين إمكانية الوصول إلى AlphaFold ، حيث يستخدم علماء من معهد ماكس بلانك لبيولوجيا التنمية النموذج بالفعل لاكتشاف هياكل البروتين التي كانوا يعملون عليها لأكثر من عقد.
جانيت ثورنتون ، المديرة الفخرية للمعهد الأوروبي للمعلومات الحيوية ، نقلت عبر ScienceMag كما قال إن إنجازات DeepMind "ستغير مستقبل البيولوجيا الهيكلية وأبحاث البروتين". وفي الوقت نفسه ، عالم الأحياء في جامعة ميريلاند ، شادي جروف ، يقول جون مولت أنه لم يعتقد أبدًا أن مشكلة طي البروتين لن يتم حلها أبدًا في هذا العمر.
في حين أنه من المستبعد جدًا أن تحل AlphaFold محل الطرق التجريبية التقليدية لاكتشاف هياكل البروتين ، إلا أنها قد تزيد بشكل كبير من سرعة اكتشاف هياكل البروتين. قد يطلب الباحثون بيانات تجريبية أقل جودة لتحديد بنية البروتين ، ويمكن للباحثين بالفعل الوصول إلى حجم كبير من البيانات الجينومية التي يمكن ترجمتها إلى هياكل باستخدام حلول AlphaFold.








