私達と接続

AI が 500 億年の進化をシミュレートし、新しいタンパク質を作成しました。

Artificial Intelligence

AI が 500 億年の進化をシミュレートし、新しいタンパク質を作成しました。

mm

公開済み

 on

進化は数十億年にわたって分子レベルで生命を微調整してきました。生命の基本的な構成要素であるタンパク質は、このプロセスを通じて進化し、感染症との戦いから食物の消化まで、さまざまな生物学的機能を果たしています。これらの複雑な分子は、構造と機能を決定する正確な配列で配列された長いアミノ酸鎖で構成されています。自然は驚くほど多様なタンパク質を生み出してきましたが、その構造を理解し、まったく新しいタンパク質を設計することは、科学者にとって長い間複雑な課題でした。

最近の人工知能の進歩は、生物学の最も重要な課題のいくつかに取り組む能力を変えつつあります。これまで、AIは特定のタンパク質配列がどのように折り畳まれ、どのように動作するかを予測するために使用されていましたが、これは膨大な数の構成があるため複雑な課題でした。最近、AIは前例のない規模でまったく新しいタンパク質を生成するまでに進歩しました。このマイルストーンは、ESM3によって設計されたマルチモーダル生成言語モデルによって達成されました。 進化のスケールテキスト処理用に設計された従来の AI システムとは異なり、ESM3 はタンパク質の配列、構造、機能を理解するようにトレーニングされています。ESM500 の真に注目すべき点は、XNUMX 億年の進化をシミュレートする能力です。この偉業により、自然界ではこれまで見られなかったまったく新しい蛍光タンパク質が誕生しました。

この画期的な進歩は、生物学をよりプログラム可能にするための重要な一歩であり、医学、材料科学などの分野で応用できるカスタムタンパク質の設計に新たな可能性をもたらします。この記事では、ESM3 の仕組み、ESMXNUMX が達成した成果、そしてこの進歩が生物学と進化に対する私たちの理解をなぜ変えているのかを探ります。

ESM3 のご紹介: 進化をシミュレートする AI

ESM3は、タンパク質の配列、構造、機能を分析して理解し、生成するように訓練されたマルチモーダル言語モデルです。 アルファフォールド既存のタンパク質の構造を予測できる は、本質的にはタンパク質工学モデルであり、研究者が機能的および構造的要件を指定してまったく新しいタンパク質を設計できるようにします。

このモデルは、タンパク質の配列、構造、機能に関する深い知識と、ユーザーとのインタラクションを通じてタンパク質を生成する能力を持っています。この機能により、モデルは自然界には存在しないが生物学的に生存可能なタンパク質を生成することができます。新しい緑色蛍光タンパク質(esmGFP)は、この能力の顕著な実証である。クラゲやサンゴで最初に発見された蛍光タンパク質は、医療研究やバイオテクノロジーで広く使用されている。esmGFPを開発するために、研究者はESM3に既知の蛍光タンパク質の主要な構造的および機能的特性を与えた。その後、モデルは設計を反復的に改良し、 思考連鎖推論 配列を最適化するアプローチ。自然進化では同様のタンパク質を生成するのに数百万年かかることもありますが、ESM3 はこのプロセスを加速し、数日または数週間で実現します。

AI 駆動型タンパク質設計プロセス

研究者が ESM3 を使用して esmGFP を開発した方法は次のとおりです。

  1. AIを促す – 最初に、ESM3 を蛍光関連の特徴に導くために、配列と構造の手がかりを入力します。
  2. 新しいタンパク質の生成 – ESM3 は、潜在的な配列の広大な空間を探索し、何千もの候補タンパク質を生成しました。
  3. フィルタリングと精製 – 最も有望な設計が選別され、実験室でのテスト用に合成されました。
  4. 生きた細胞での検証 – 選択された AI 設計タンパク質を細菌で発現させ、その蛍光と機能性を確認しました。

このプロセスにより、自然界に存在しない蛍光タンパク質 (esmGFP) が生成されました。

esmGFPと天然タンパク質の比較

esmGFP が特別なのは、既知の蛍光タンパク質からどれだけ離れているかです。新しく発見された GFP のほとんどは既存のものとわずかに異なりますが、esmGFP は最も近い自然界の同族体との配列同一性がわずか 58% です。進化論的に、このような違いは 500 億年以上の分岐時間に相当します。

これを大局的に見ると、同様の進化距離を持つタンパク質が最後に出現したとき、恐竜はまだ出現しておらず、多細胞生物はまだ初期段階にあった。これは、AI が進化を加速させただけでなく、まったく新しい進化の経路をシミュレートし、自然が決して作り出さなかったかもしれないタンパク質を生み出したことを意味する。

この発見がなぜ重要なのか

この開発はタンパク質工学における大きな前進であり、進化に対する理解を深めます。AI はわずか数日間で数百万年分の進化をシミュレートすることで、刺激的な新しい可能性への扉を開きます。

  • より迅速な新薬発見: 多くの医薬品は特定のタンパク質を標的として作用しますが、適切なタンパク質を見つけるのは時間がかかり、費用もかかります。AI 設計のタンパク質はこのプロセスをスピードアップし、研究者がより効率的に新しい治療法を発見するのに役立つ可能性があります。
  • バイオエンジニアリングにおける新しいソリューション: タンパク質は、プラスチック廃棄物の分解から病気の検出まで、あらゆる用途に使用されています。AI 主導の設計により、科学者はヘルスケア、環境保護、さらには新素材用のカスタム タンパク質を作成できます。
  • 進化シミュレータとしてのAIこの研究の最も興味深い点の 3 つは、AI を単なる分析ツールではなく、進化のシミュレーターとして位置付けていることです。従来の進化シミュレーションでは、遺伝子変異を反復処理し、実行可能な候補を生成するのに数か月から数年かかることがよくあります。しかし、ESMXNUMX は、機能タンパク質を直接予測することで、こうした時間のかかる制約を回避します。このアプローチの転換は、AI が進化を模倣するだけでなく、自然を超えた進化の可能性を積極的に探ることができることを意味します。十分な計算能力があれば、AI 主導の進化により、自然界に存在したことのない新しい生化学的特性を発見できる可能性があります。

倫理的配慮と責任ある AI 開発

AI 主導のタンパク質工学の潜在的なメリットは計り知れないものの、この技術は倫理的および安全性の問題も引き起こします。AI が人間の理解を超えたタンパク質の設計を始めたらどうなるでしょうか? これらのタンパク質が医療や環境用途で安全であることをどのように保証するのでしょうか?

これらの懸念に対処するには、責任ある AI 開発と徹底したテストに重点を置く必要があります。esmGFP のような AI 生成タンパク質は、実際のアプリケーションでの使用を検討する前に、広範な実験室テストを受ける必要があります。さらに、透明性、安全性、および公衆の信頼を確保するために、AI 主導の生物学に関する倫理的枠組みが開発されています。

ボトムライン

ESM3 の発売は、バイオテクノロジーの分野における重要な進歩です。ESM3 は、進化がゆっくりとした試行錯誤のプロセスであってはならないことを示しています。500 億年にわたるタンパク質の進化をわずか数日間に圧縮することで、科学者が信じられないほどのスピードと精度でまったく新しいタンパク質を設計できる未来が開かれます。ESM3 の開発は、AI を使用して生物学を理解できるだけでなく、生物学を再構築できることを意味します。この画期的な進歩により、ソフトウェアをプログラムするのと同じように生物学をプログラムする能力が向上し、私たちが想像し始めたばかりの可能性が解き放たれます。

Tehseen Zia 博士は、COMSATS イスラマバード大学の終身准教授であり、オーストリアのウィーン工科大学で AI の博士号を取得しています。 人工知能、機械学習、データ サイエンス、コンピューター ビジョンを専門とし、評判の高い科学雑誌での出版で多大な貢献をしてきました。 Tehseen 博士は、主任研究者としてさまざまな産業プロジェクトを主導し、AI コンサルタントも務めてきました。