Dr. Jure Leskovec, Chief Scientist and Co-Founder of Kumo

ソートリーダー August 29, 2025

データサイエンティストがグラフトランスフォーマーと構造化データへの影響について知っておくべきこと

スタンフォード在籍中に、私はグラフニューラルネットワークを共同で創出した。私は早期に、このテクノロジーが非常に強力であることを認識した。すべてのデータポイント、すべての観察、すべての知識は孤立して存在しない。重要なのは、最も貴重なビジネスデータは、通常、データベースとデータウェアハウスにテーブルとして保存され、自然にグラフとして表現できることである。この関係構造を利用することが、正確で妄想がないAIモデルを構築するための鍵である。グラフニューラルネットワーク（GNN）は、知識間の接続を捉えることができるメッセージパッシングアーキテクチャを導入した。しかし、Transformerが言語理解を変革したように、グラフトランスフォーマーという新しいモデルクラスは、グラフベースのデータに同様の利点をもたらしている。これらのモデルは、複雑な関係をより効果的にモデル化するために、注意メカニズムの柔軟性とグラフ構造の先入観を組み合わせる。グラフがメッセージパッシングだけで十分ではない理由伝統的なグラフニューラルネットワーク（GNN）は、メッセージパッシングに依存している。これは、各ノードが近隣ノードからの情報を集約して内部状態を更新するプロセスである。各ノードが近隣ノードと要約を交換し、それらの要約を使用して自身の理解を改良することを考える。複数の層を経て、これにより、グラフ全体に情報が伝播する。メッセージパッシングは、ローカルなパターンを学習するには強力であるが、重要な制限がある。オーバースカッシュ: 情報が多くのホップにわたって集約されると、有用な詳細が失われる可能性がある。これは、深いGNNでは特に問題となる。コンテキストの制限: 標準的なメッセージパッシングでは、多くの層なしに長距離の依存関係を捉えることが難しい。これにより、複雑さとノイズが増加する。表現力: 多くのグラフ構造は、ローカルな近傍情報のみを使用して区別できないため、モデル性能が制限される。ここで、グラフトランスフォーマーが登場する。メッセージパッシングを注意メカニズムで置き換えるか補足することで、各ノードが直接、他のノード（近隣のものだけでなく、遠隔のものも）に基づいて学習した重要性に基づいて注目できるようにする。結果として、豊かで表現力のある表現、スケーラビリティの向上、および複雑な構造をより柔軟に推論する能力が得られる。GNNからグラフトランスフォーマーへオリジナルのTransformerモデルは、Attention Is All You Needというアイコニックな論文で導入され、シーケンス内のトークン間の関係をモデル化するために設計された。その成功は、自己注意メカニズムに基づいており、各入力が他の入力すべてを考慮し、学習された関連性に基づいて重み付けされる。グラフトランスフォーマーは、このパラダイムを採用し、ノードが近隣ノードのみに注目するのではなく、グラフ内の任意のノードに注目できるようにする。完全に接続された注意またはグローバルシグナルとローカルシグナルのバランスをとるハイブリッドアプローチを使用する。課題は、シーケンスの構造のないモデルに構造の概念を導入することである。グラフ固有の位置エンコーディングテキストと異なり、グラフには固有の順序がないため、位置エンコーディングは、テクニックをモデルに注入するために使用される技術であり、構造または位置ベースの情報をモデルに注入する非自明な問題となる。グラフトランスフォーマーは、次の方法でこれに取り組む。ラプラシアン固有ベクトル: グラフラプラシアン行列から導出されるこれらは、グローバル構造を捉えたスペクトル埋め込みを提供する。ランダムウォーク: ノード間の複数のホップでの移動確率を捉える。構造エンコーディング: 距離メトリック、ノード次数、またはエッジタイプを含む。これらの位置エンコーディングは、スペクトル、確率、構造のいずれであっても、グラフトランスフォーマーにノードがグラフ全体の中でどのように位置するかを理解する方法を提供する。構造的な認識は、注意メカニズムが不規則で順序のないデータ全体で有意義に機能することを可能にするため、関係を捉えるために不可欠である。現実世界での実装とユースケースグラフトランスフォーマーを本番環境に導入するには、現実世界のデータサイズにスケールできるインフラストラクチャが必要である。PyTorch Geometric (PyG)などのライブラリがこれを可能にしている。PyTorchに基づいて構築されたPyGは、分子モデリングからレコメンデーションシステムまで、幅広いアプリケーションでGNNとグラフトランスフォーマーを実装するためのモジュラーなフレームワークを提供する。小さなグラフや大きなグラフのミニバッチトレーニングをサポートし、多くのGPUとtorch.compileのサポートにより、研究とエンタープライズのワークフローに適している。これらのツールは、すでに幅広い実世界のアプリケーションを推進している。薬剤発見では、グラフトランスフォーマーは原子間の相互作用をグラフとしてモデル化することで、分子特性を予測するのに役立つ。物流とサプライチェーンの最適化では、出荷、倉庫、ルートのダイナミックネットワークを表現して推論できる。電子商取引企業は、関係グラフとして製品の共同購入と閲覧動作を理解することで、レコメンデーションを改善するためにこれらを使用する。サイバーセキュリティでは、グラフベースのモデルはアクセスパターン、ネットワークトポロジー、イベントシーケンスを分析することで異常を検出するために使用される。これらの設定では、手作業で特徴を抽出することなく、複雑で相互接続された構造から学習する能力が大きな利点をもたらしている。技術的な考慮グラフトランスフォーマーには、実際のエンジニアリングトレードオフがある。完全な自己注意はノードの数に比例して二乗的にスケールするため、特に大規模または密なグラフの場合、メモリとコンピューティングの効率が第一の懸念事項となる。多くの実世界のグラフには方向付きエッジがあり、構造情報がどのようにエンコードされるかを複雑にする非対称性が導入される。実用的には、入力はほとんどの場合一貫性がないため、グラフ構造化データをテキスト、時系列、画像と組み合わせるには、慎重なアーキテクチャの選択と堅牢なデータ前処理が必要である。これらの課題は克服可能ではないが、特に研究プロトタイプから本番環境に移行する場合には、思慮深いシステム設計を必要とする。次に来ること: LLMとグラフの出会い主要な研究方向は、大規模言語モデル（LLM）とグラフ構造の統合である。これらのハイブリッドシステムは、LLMを使用してテキストコンテキストをエンコードしたりエンティティを抽出したりし、グラフで推論と意思決定を行う。生物学では、これはAlphaFoldなどのツールを可能にした。エンタープライズAIでは、ドキュメントと動作グラフを組み合わせたカスタマーサポートシステムを有効にした。グラフトランスフォーマーは、AIエージェントが構造化された状態表現を推論し、ダイナミックに相互作用を優先することを可能にすることで、より賢く、より実行可能な決定を下すことを可能にしている。これらの関係を理解し、依存関係を追跡し、複雑な環境で動作を適応させることができる。この分野はまだ新しいが、潜在的な利点は大きい。結論グラフトランスフォーマーは、GNNの次のイテレーションではなく、注意、構造、スケーラビリティの融合を表す。金融、生命科学、レコメンデーションシステムで働いているかに関係なく、メッセージは明確である: あなたのデータはグラフを形成するため、あなたのモデルもグラフを形成する必要がある。

Unite.AI

Dr. Jure Leskovec, Chief Scientist and Co-Founder of Kumo

データサイエンティストがグラフトランスフォーマーと構造化データへの影響について知っておくべきこと