인공지능
AI 시스템, 인공 단백질의 청사진 발견

시카고 대학교의 프리츠커 분자 공학 학교(Pritzker School of Molecular Engineering, PME)의 연구자 팀은 최근에 완전히 새로운 인공 단백질을 생성할 수 있는 AI 시스템을 만들었다. 이 시스템은 빅데이터를 분석하여 인공 단백질을 생성한다.
단백질은 생물체의 조직을 구성하는 데 필수적인 거대 분자이며, 일반적으로 세포의 생명에 중요한 역할을 한다. 세포는 다양한 화학 반응을 일으키고 복잡한 작업을 수행하기 위해 단백질을 화학 촉매로 사용한다. 과학자들이 신뢰할 수 있는 인공 단백질을 설계하는 방법을 발견할 수 있다면, 이는 새로운 탄소 포집 방법, 새로운 에너지 수확 방법, 새로운 질병 치료법으로 이어질 수 있다. 인공 단백질은 우리가 사는 세계를劇적으로改变할 수 있는 잠재력을 가지고 있다. EurekaAlert에 따르면, PME의 시카고 대학교 연구자들의 최근 연구는 과학자들이 이러한 목표에 더 가까이 다가갈 수 있도록 했다. PME 연구자들은 기계 학습 알고리즘을 사용하여 새로운 형태의 단백질을 생성할 수 있는 시스템을 개발했다.
연구 팀은 다양한 게놈 데이터베이스에서 데이터를 추출하여 기계 학습 모델을 훈련시켰다. 모델이 학습을 진행하면서, 인공 단백질을 생성할 수 있는 공통된 기본 패턴과 디자인 규칙을 구별하기 시작했다. 이러한 패턴을 취하고 실험실에서 해당 단백질을 합성한 연구자들은 인공 단백질이 생성한 화학 반응이 자연적으로 발생하는 단백질에 의해 구동되는 것과 거의 동일한 효율성을 가지고 있음을 발견했다.
PME의 조셉 레겐스타인 교수인 라마 랑가나탄(Rama Ranganathan)에 따르면, 연구 팀은 게놈 데이터가 단백질의 기본적인 기능과 구조에 대한大量의 정보를 포함하고 있음을 발견했다. 기계 학습을 사용하여 이러한 공통 구조를 인식함으로써, 연구자들은 “자연의 규칙을 사용하여 단백질을 직접 만들 수 있었다”고 말했다.
연구자들은 특히 식물, 곰팡이, 세균에서 필수적인 단백질家族인 코리즘산 무타제(chorismate mutase)에 초점을 맞췄다.
랑가나탄과 그의 동료 연구자들은 게놈 데이터베이스가 과학자들이 발견하기를 기다리는 통찰력을 포함하고 있지만, 전통적인 단백질 구조와 기능에 대한 규칙을 결정하는 방법은 제한된 성공을 거두었다는 것을 깨달았다. 연구 팀은 이러한 디자인 규칙을 공개할 수 있는 기계 학습 모델을 설계하기 위해 노력했다. 모델의 발견은 새로운 인공 시퀀스를 생성하기 위해 아미노산 위치와 아미노산 쌍의 진화에서 상관관계를 보존할 수 있음을 시사한다.
연구 팀은 이러한 단백질을 생성하는 아미노산 시퀀스를 암호화하는 합성 유전자를 만들었다. 그들은 이러한 합성 유전자와 클론된 세균을 만들었고, 세균이 세포 기계에서 합성 단백질을 사용함을 발견했다. 이는 정상 단백질과 거의 동일하게 작동했다.
랑가나탄에 따르면, AI가 구별한 단순한 규칙을 사용하여令人驚嘆한 복잡성과 다양성의 인공 단백질을 생성할 수 있다. 랑가나탄은 EurekaAlert에 다음과 같이 설명했다.
“제약은 우리가 상상했던 것보다 훨씬 작다. 자연의 디자인 규칙에는 단순함이 있다. 우리는 이러한 접근 방식이 생물학의 다른 복잡한 시스템에서 디자인 모델을 찾는 데 도움이 될 수 있다고 믿는다. 예를 들어, 생태계 또는 뇌와 같은 시스템에서”
랑가나탄과 그의 동료 연구자들은 모델을 일반화하고, 과학자들이 단백질이 어떻게 구성되고 어떤 영향을 미치는지 더 잘 이해할 수 있는 플랫폼을 만들고자 한다. 그들은 기후 변화와 같은 중요한 문제를 해결할 수 있는 단백질을 발견하기 위해 AI 시스템을 사용하고자 한다. 랑가나탄과 앤드류 퍼거슨(Andrew Ferguson) 부교수는 에보진(Evozyne)이라는 회사를 설립했으며, 이 회사는 기술을 상업화하고 농업, 에너지, 환경과 같은 분야에서 사용을 촉진하기 위해 노력하고 있다.
단백질 사이의 공통점과 구조와 기능 사이의 관계를 이해하는 것은 또한 새로운 약물과 치료법을 생성하는 데 도움이 될 수 있다. 단백질 접힘은 컴퓨터가 해결하기 위해 매우 어려운 문제로 간주되어 왔지만, 랑가나탄 팀이 생성한 모델과 같은 모델에서 얻은 통찰력은 이러한 단백질을 기반으로 하는 새로운 약물의 생성을 촉진할 수 있다. 바이러스 내에서 단백질 생성을 차단하는 약물이 개발될 수 있으며, 이는 잠재적으로 코로나19와 같은 새로운 바이러스에 대한 치료를 지원할 수 있다.
랑가나탄과 연구 팀은 여전히 모델이 어떻게 작동하고 왜 신뢰할 수 있는 단백질 청사진을 생성하는지 이해해야 한다. 연구 팀의 다음 목표는 모델이 어떤 속성을 고려하여 결론에 도달하는지 더 잘 이해하는 것이다.










