Connect with us

AIが500万年分の進化をシミュレートし – 新しいタンパク質を作成した!

人工知能

AIが500万年分の進化をシミュレートし – 新しいタンパク質を作成した!

mm

進化は、分子レベルで数十億年間にわたって生命を微調整してきた。タンパク質は、生命の基本的な構成要素であり、感染症の闘争から食物の消化まで、さまざまな生物学的機能を実行するために、このプロセスを通じて進化してきた。これらの複雑な分子は、精密なシーケンスで配列されたアミノ酸の長い鎖で構成されており、その構造と機能を決定する。自然は、驚くほど多様なタンパク質を生み出してきたが、タンパク質の構造を理解し、完全に新しいタンパク質を設計することは、長年、科学者にとって複雑な課題であった。

最近の人工知能の進歩は、生物学の最も重要な課題に対処する能力を変革している。以前は、人工知能は、与えられたタンパク質シーケンスがどのように折りたたまれて行動するかを予測するために使用されていた – これは、構成の数が膨大であるため、複雑な課題であった。最近、人工知能は、前例のない規模で完全に新しいタンパク質を生成する能力に到達した。このマイルストーンは、EvolutionaryScaleによって設計された、ESM3というマルチモーダル生成言語モデルで達成された。従来のテキスト処理用に設計された人工知能システムとは異なり、ESM3はタンパク質シーケンス、構造、機能を理解するためにトレーニングされた。本当に注目すべきは、500万年分の進化をシミュレートする能力であり、これは、自然界では見られない完全に新しい蛍光タンパク質の作成につながった。

このブレークスルーは、生物学をよりプログラム可能にする大きなステップであり、医療、材料科学、さらなる分野でのカスタムタンパク質の設計の新しい可能性を解放する。この記事では、ESM3のしくみ、達成した内容、そしてなぜこの進歩が生物学と進化の理解を再定義するのかを探る。

ESM3を紹介:進化をシミュレートするAI

ESM3は、タンパク質のシーケンス、構造、機能を分析することで、タンパク質を理解し、生成するためにトレーニングされたマルチモーダル言語モデルである。AlphaFoldとは異なり、既存のタンパク質の構造を予測できるが、ESM3は本質的にタンパク質エンジニアリングモデルであり、研究者が機能的および構造的要件を指定して完全に新しいタンパク質を設計できる。

モデルは、タンパク質シーケンス、構造、機能に関する深い知識を持ち、ユーザーとのやり取りを通じてタンパク質を生成する能力を持つ。これにより、モデルは自然界には存在しないが生物学的に有効なタンパク質を生成できる。新しい緑色蛍光タンパク質(esmGFP)の作成は、この能力の印象的なデモンストレーションである。蛍光タンパク質は、初期にはメダカやサンゴで発見され、広く医療研究や生物技術で使用されている。esmGFPを開発するために、研究者は既知の蛍光タンパク質の重要な構造的および機能的特性をESM3に提供した。モデルは、思考連鎖的推論アプローチを適用して、シーケンスを最適化することで設計を反復的に精製した。自然界では、同等のタンパク質を生成するために数百万年かかるかもしれないが、ESM3はこのプロセスを加速して数日または数週間で達成する。

AI駆動のタンパク質設計プロセス

研究者がESM3を使用してesmGFPを開発する方法は以下のとおりである:

  1. AIのプロンプト – 最初に、研究者は蛍光関連の機能をESM3に導くシーケンスおよび構造的ヒントを入力した。
  2. 新しいタンパク質の生成 – ESM3は、候補となるタンパク質を数千個生成するために、潜在的なシーケンスの広い空間を探索した。
  3. フィルタリングと精製 – 最も有望な設計は、実験室テストのためにフィルタリングおよび合成された。
  4. 生体内での検証 – 選択されたAI設計タンパク質は、蛍光性および機能性を確認するために細菌に発現された。

このプロセスは、自然界には見られない蛍光タンパク質(esmGFP)をもたらした。

esmGFPと自然タンパク質の比較

esmGFPが特筆すべき理由は、既知の蛍光タンパク質からどれほど遠い距離にあるかである。ほとんどの新しく発見されたGFPは既存のものからのわずかな変異を持っているが、esmGFPは最も近い自然の親と58%のシーケンス同一性しか持たない。進化的に見ると、このような違いは500万年以上の分岐時間に相当する。

これを視覚化するために、同等の進化的距離を持つタンパク質が最後に現れたとき、恐竜はまだ現れず、多細胞生命はまだ初期段階にあった。つまり、AIは進化を単に加速させただけでなく、完全に新しい進化経路をシミュレートし、自然界では決して生み出されなかったタンパク質を生成した。

この発見の重要性

この開発は、タンパク質エンジニアリングにおける大きな前進であり、進化の理解を深める。数百万年分の進化をわずか数日でシミュレートすることで、AIは、次のような新しい可能性の扉を開いている:

  • 薬剤発見の高速化: 多くの薬剤は、特定のタンパク質を標的とすることで作用するが、適切なタンパク質を見つけるのは遅くて高価である。AI設計タンパク質は、このプロセスを高速化し、研究者が新しい治療法をより効率的に発見できるようにすることができる。
  • 新しいバイオエンジニアリングの解決策: タンパク質は、プラスチック廃棄物の分解から疾患の検出まで、すべての分野で使用されている。AI駆動の設計により、科学者はヘルスケア、環境保護、さらには新しい材料のためのカスタムタンパク質を作成できる。
  • AIとしての進化シミュレーター: この研究の最も興味深い側面の1つは、AIを分析ツールではなく進化のシミュレーターとして位置付けていることである。従来の進化シミュレーションには、遺伝的変異を繰り返し適用することが含まれるが、これは有効な候補を生成するために数か月または数年かかることが多い。ESM3は、これらの遅い制約を回避することで、機能的なタンパク質を直接予測する。アプローチのこの変化は、AIが自然を模倣するのではなく、自然を超えた進化的可能性を活用できることを意味する。十分な計算能力があれば、AI駆動の進化は、自然界には存在しない新しい生化学的特性を発見することができる。

倫理的考慮と責任あるAI開発

AI駆動のタンパク質エンジニアリングの潜在的な利点は巨大であるが、この技術も倫理的および安全性の懸念を引き起こす。AIが人間の理解を超えたタンパク質を設計し始めたときに何が起こるのか?これらのタンパク質が医療や環境での使用に安全であることを如何に保証するのか?

これらの懸念に対処するために、責任あるAI開発と徹底的なテストに焦点を当てる必要がある。AI生成タンパク質、例えばesmGFPは、現実世界のアプリケーションを検討する前に、広範な実験室テストを受けるべきである。さらに、AI駆動の生物学のための倫理的枠組みが、透明性、安全性、公衆の信頼を確保するために開発されている。

まとめ

ESM3の導入は、バイオテクノロジー分野における重要な開発である。ESM3は、進化が遅くて試行錯誤のプロセスである必要はないことを示している。500万年分のタンパク質進化をわずか数日で圧縮することは、科学者が新しいタンパク質を驚くほどの速度と精度で設計できる未来を開く。ESM3の開発は、生物学を理解するためにAIを使用するだけでなく、生物学を再定義することもできることを意味する。このブレークスルーは、生物学をプログラムする能力を向上させ、ソフトウェアをプログラムするのと同様に、想像を超えた可能性を解放する。

Dr. Tehseen ZiaはCOMSATS University Islamabadの正教授であり、オーストリアのVienna University of TechnologyでAIのPh.D.を取得しています。人工知能、機械学習、データサイエンス、コンピュータビジョンを専門とし、信頼性の高い科学雑誌に掲載された出版物で著しい貢献をしています。Dr. Tehseenは、主な調査員としてさまざまな産業プロジェクトを率い、AIコンサルタントとしても務めています。