人工知能

AI 研究者がゲノム規則の発見のために説明可能なニューラルネットワークを開発

Published February 22, 2021

Updated April 5, 2026

Daniel Nelson

研究者チームは最近、説明可能なニューラルネットワークを作成し、生物学者が人間のゲノムのコードを支配する謎の規則を明らかにするのを支援することを目的としています。研究チームは、タンパク質-DNA 相互作用のマップでニューラルネットワークをトレーニングし、AI が特定の DNA シーケンスが特定の遺伝子をどのように調節するかを発見できるようにしました。研究者はまた、モデルを説明可能なものにし、モデルの結論を分析し、シーケンスモチーフが遺伝子をどのように調節するかを判断できるようにしました。

生物学における大きな謎の 1 つは、ゲノムの規制コードです。DNA は 4 つの核酸塩基 – アデニン、グアニン、チミン、シトシン – で構成されていることがわかっているですが、これらの塩基対がどのように活性を調節するかはわかっていません。これらの 4 つの核酸塩基は、タンパク質を構築するための指示を符号化しますが、遺伝子がどのように表現されるか (生物でタンパク質を生成する方法) も制御します。特定の塩基の組み合わせと配置は、DNA に結合する規制コードのセクションを作成し、これらの組み合わせが何であるかはわかっていません。

コンピュータ科学者と生物学者の間の学際的なチームは、この謎を解決するために説明可能なニューラルネットワークを作成することを目指しました。研究チームは、「ベースペアネットワーク」または「BPNet」と呼ばれるニューラルネットワークを作成しました。BPNet で予測を生成するために使用されるモデルは、規制コードを識別するために解釈できます。これは、転写因子と呼ばれるタンパク質が DNA シーケンスにどのように結合するかを予測することによって達成されました。

研究者は、転写因子と DNA がどのように結合しているかを決定するために、さまざまな実験と包括的なコンピュータモデリングを実行し、個々の核酸塩基のレベルまで詳細なマップを作成しました。詳細な転写因子-DNA 表現により、研究者は、重要な DNA シーケンスパターンと規制コードとして機能する規則の両方を解釈できるツールを作成できるようになりました。

スタンフォード大学の生物学者および計算機科学者であるジュリア・ツァイトリンガー (Julia Zeitlinger) 博士は、説明可能なニューラルネットワークから得られた結果が既存の実験結果と一致するだけでなく、ゲノムの規制コードに関する驚くべき洞察も含んでいたと説明しています。たとえば、AI モデルにより、研究チームは Nanog と呼ばれる転写因子がどのように作用するかを規制する規則を発見できました。DNA 二重螺旋の同じ側に Nanog モチーフの複数のインスタンスがある場合、それらは DNA に協調的に結合します。ツァイトリンガーは、ScienceDaily を通じて説明しています。

「モチーフの周期性が規制コードに存在することがあるという実験的証拠の長い歴史があります。しかし、正確な状況は不明であり、Nanog はそのようなパターンを持つ疑いがありませんでした。Nanog がそのようなパターンを持っていること、およびその相互作用の詳細を発見することは、驚くべきことでした。私たちは特にそのパターンを探していなかったからです。」

最近の研究論文は、AI を使用して DNA を分析する最初の研究ではありませんが、ゲノムで遺伝子を調節する DNA シーケンスを判断するために「ブラックボックス」の AI を開く最初の研究である可能性があります。ニューラルネットワークはデータ内でパターンを見つけることに優れていますが、そのモデルから得られた洞察は抽出するのが難しいです。モデルが予測のために重要であると考える機能を分析する方法を作成することで、研究者はより繊細なモデルをトレーニングし、新しい発見につながる可能性があります。

BPNet のアーキテクチャは、画像内の顔を認識するために使用されるネットワークと似ています。コンピュータビジョンシステムが画像内の顔を認識する場合、ネットワークは最初にエッジを検出し、それらを組み合わせます。違いは、BPNet が DNA シーケンスから学習し、シーケンスモチーフを検出し、それらを結合して、データの結合を予測するために使用できる高次の規則を作成することです。

モデルが高い精度のしきい値に達した後、モデルによって学習されたパターンは、元の入力シーケンスに戻され、シーケンスモチーフが明らかになります。最後に、モデルは体系的な DNA シーケンスのクエリを提供され、研究者はシーケンスモチーフがどのように組み合わさって機能する規則を理解できます。ツァイトリンガーによると、モデルは、研究者が従来の実験的な方法でテストすることができるよりもはるかに多くのシーケンスを予測できます。また、実験的異常の結果を予測することは、研究者がモデルを検証するためにどの実験が最も情報量が豊かであるかを特定するのを可能にします。

Related Topics:Biology black box dna explainable neural networks

Daniel Nelson

ブログ作家およびプログラマーで、 Machine Learning と Deep Learning のトピックを専門としています。Danielは、AIの力を社会のために利用する手助けを他者に与えることを希望しています。

Unite.AI

AI 研究者がゲノム規則の発見のために説明可能なニューラルネットワークを開発

You may like