부본 단백질 접힘 문제를 해결하여 생물학을 혁신할 DeepMind - Unite.AI
Rescale 미팅 예약

인공 지능

DeepMind는 단백질 접힘 문제를 해결하여 생물학을 변화시킬 준비가 되어 있습니다.

mm
업데이트 on

구글의 AI 사업부 딥마인드는 최근 중요한 진전을 이뤘다. 생물학에서 가장 오래된 문제 중 하나를 해결하기 위해, 아미노산 서열에서 단백질의 모양을 계산합니다. 네이처(Nature)에 따르면, 이 돌파구는 생물학과 화학 분야를 변화시킬 잠재력이 있어 과학자들이 현재 불가사의한 많은 단백질의 기능을 결정할 수 있게 합니다.

단백질의 모양은 기능을 정의하며 대부분의 생물학적 기능은 단백질에 의존합니다. "단백질 폴딩" 아미노산 사슬을 기능을 수행하는 데 필요한 XNUMX차원 구조로 변환하는 과정에 주어진 이름입니다. 과학자들이 아미노산 서열과 그들이 생성하는 단백질의 모양 사이의 관계를 결정할 수 있다면 어떤 단백질이 다른 생물학적 과정에 영향을 미치는지 결정할 수 있습니다.

과학자들은 인간 프로테옴 내에 최소 80,000개의 단백질이 있지만 이러한 단백질 중 극히 일부만이 알려진 구조를 가지고 있다고 가정합니다. 단백질의 모양을 결정하는 전통적인 방법은 컴퓨터 과학 알고리즘과 모델의 힘을 활용하기까지 수년간의 실험실 실험이 필요할 수 있습니다. DeepMind가 수행한 작업은 단백질 구조를 발견하는 과정을 획기적으로 가속화하여 정상적인 시간보다 훨씬 짧은 시간에 단백질 구조를 안정적으로 결정할 수 있습니다.

DeepMind의 연구원들은 약 170,0000개의 단백질 서열과 해당 서열에 해당하는 모양으로 구성된 데이터베이스에서 알고리즘을 훈련했습니다. 연구원들이 개발한 알고리즘은 100~200개의 GPU에서 훈련되었으며 훈련 프로세스를 완료하는 데 몇 주가 걸렸습니다. 연구원들이 개발한 모델은 "알파폴드(AlphaFold)"라고 불렸습니다.

AlphaFold는 "긴장 알고리즘"을 통해 작동하며, 작은 단백질 조각을 함께 연결한 다음 확장하여 점점 더 큰 부분을 연결합니다. 처음에는 작은 아미노산 클러스터가 함께 연결되었고 알고리즘은 이러한 클러스터를 연결하는 방법을 찾으려고 했습니다.

AlphaFold 연구원들은 처음에 아미노산과 단백질 간의 관계를 예측하기 위해 유전 및 구조 데이터에 대한 기존 딥 러닝 알고리즘을 사용하려고 시도했습니다. 그런 다음 AlphaFold는 단백질 스타일에 대한 합의 모델을 만들었습니다. 이 기술에 너무 많은 한계가 있음이 입증되자 연구자들은 새로운 전략을 시도했습니다. AlphaFold 연구팀은 더 많은 기능에 대해 훈련된 모델을 만들었고 이번에는 단백질 서열의 최종 구조에 대한 모델 반환 예측을 받았습니다.

엔지니어링 팀은 컴퓨터 알고리즘이 아미노산 서열에서 단백질 구조를 평가하기 위해 경쟁하는 경쟁에 AlphaFold를 입력하여 스트레스 테스트를 수행했습니다. 경쟁은 "단백질 구조 예측의 중요한 평가" 또는 CASP였습니다. 대회 참가자에게는 100개의 아미노산 서열이 제공되며 그들의 모델은 단백질의 구조를 해결해야 합니다. AlphaFold는 정확성 측면에서 다른 컴퓨터 모델을 능가했을 뿐만 아니라 기존의 실험실 기반 모델링 기술과도 비슷한 성능을 보였습니다. AlphaFold의 최종 중간 점수는 92점 만점에 약 100점이었고 실험실 기반 실험 방법에는 90점이 할당되었습니다. AlphaFold의 중간 점수는 가장 어려운 단백질에서 87%로 떨어졌습니다.

DeepMind CEO 겸 공동 설립자 Demis Hassabis에 따르면, 회사는 이미 연구자들에게 AlphaFold에 대한 액세스 권한을 제공할 계획을 세우고 있으며 Max Planck Institute for Development Biology의 과학자들은 이미 XNUMX년 이상 연구해 온 단백질 구조를 발견하기 위해 이 모델을 활용하고 있습니다.

유럽생물정보학연구소(European Bioinformatics Institute) 명예 소장 재닛 손튼(Janet Thornton)은 ScienceMag를 통해 인용됨 DeepMind의 성과는 "구조 생물학과 단백질 연구의 미래를 바꿀 것"이라고 말했습니다. 한편, Shady Grove에 있는 메릴랜드 대학의 생물학자는 존 몰트 라고 그는 단백질 접힘 문제가 이번 생애에서 결코 해결되지 않을 것이라고 생각하지 않았습니다.

AlphaFold가 단백질 구조를 발견하는 기존의 실험적 방법을 완전히 대체할 가능성은 거의 없지만 단백질 구조가 발견되는 속도를 극적으로 높일 수 있습니다. 연구원들은 단백질 구조를 결정하기 위해 덜 고품질의 실험 데이터를 요구할 수 있으며 연구원들은 이미 AlphaFold의 솔루션을 사용하여 구조로 변환할 수 있는 대량의 게놈 데이터에 액세스할 수 있습니다.