사상 리더

데이터 과학자가 그래프 트랜스포머와 구조화된 데이터에 미치는 영향에 대해 알아야 할 모든 것

Published August 29, 2025

Updated April 26, 2026

Dr. Jure Leskovec, Chief Scientist and Co-Founder of Kumo

스탠퍼드에서 그래프 신경망을 공동으로 개발했습니다. 초기에 이 기술이 매우 강력하다는 것을 인식했습니다. 모든 데이터 포인트, 모든 관찰, 모든 지식은 고립되어 있지 않습니다. 다른 지식의 조각과 연결된 그래프의 일부입니다. 중요하게는 대부분의贵重한 비즈니스 데이터는 데이터베이스와 데이터 웨어하우스에 테이블로 저장되며 자연스럽게 그래프로 표현될 수 있습니다. 이 관계 구조를 활용하는 것이 정확하고 현혹되지 않은 AI 모델을 구축하는 데 핵심입니다.

그래프 신경망(GNN)은 그래프에서 지식의 조각 사이의 연결을 캡처할 수 있는 메시지 전달 아키텍처를 도입했습니다. 그러나 언어 이해를 변환한 것처럼 트랜스포머가 언어 이해를 변환한 것처럼, 그래프 기반 데이터에 유사한 이점을 제공하는 새로운 모델 클래스인 그래프 트랜스포머가 등장했습니다. 이러한 모델은 주의 메커니즘의 유연성과 구조 그래프 先验을 결합하여 이전 GNN보다 복잡한 관계를 더 효과적으로 모델링합니다.

메시지 전달만으로는 충분하지 않기 때문에

전통적인 그래프 신경망(GNN)은 메시지 전달에 의존합니다. 여기서 각 노드는 근처 노드에서 정보를 집계하여 내부 상태를 업데이트합니다. 각 노드가 근처 노드와 요약을 교환한 다음 이러한 요약을 사용하여 자신의 이해를 정제하는 것으로 생각할 수 있습니다. 여러 계층에서 이것은 정보가 그래프를 통해 전파되도록 허용합니다.

로컬 패턴을 학습하는 데 강력하지만 메시지 전달에는 중요한 제한이 있습니다:

오버 스퀘싱: 정보가 많은 홉에서 집계됨에 따라 의미 있는 세부 정보를 잃을 수 있습니다. 이는 깊은 GNN에서 특히 문제가 됩니다.
제한된 컨텍스트: 표준 메시지 전달은 많은 계층 없이 장거리 종속성을 쉽게 캡처할 수 없습니다. 이는 복잡성과 노이즈를 증가시킵니다.
표현력: 많은 그래프 구조는 로컬 이웃 정보만으로 구별할 수 없습니다. 이는 미세한 구조적 구별이 필요한 작업에서 모델 성능을 제한합니다.

여기서 그래프 트랜스포머가 등장합니다. 메시지 전달을 대체하거나 보완하여 주의 메커니즘을 사용하여 각 노드가 다른 노드( 即使 먼 노드라도 )에 직접 주의를 기울일 수 있습니다. 결과는 더 풍부한 표현, 더 나은 확장성 및 복잡한 구조에 대해 더 유연하게 추론할 수 있는 능력입니다.

GNN에서 그래프 트랜스포머로

원래 트랜스포머 모델은 시퀀스에서 토큰 사이의 관계를 모델링하도록 설계되었습니다. 그 성공은 각 입력이 다른 입력을 고려할 수 있는 자기 주의 메커니즘에 있습니다.
그래프 트랜스포머는 노드가 근처 노드뿐만 아니라 그래프의 모든 노드에 주의를 기울일 수 있도록 이 패러다임을 적용합니다. 전적으로 연결된 주의 또는 글로벌 및 로컬 신호를 균형 있게 조절하는 하이브리드 접근 방식을 통해 노드가 다른 노드에 주의를 기울일 수 있습니다. 구조를 순서가 없는 시퀀스로 설계된 모델에 도입하는 것이 도전입니다.

그래프 특정 위치 인코딩

텍스트와 달리 그래프에는 내재된 순서가 없으므로 위치 인코딩은 비중요합니다. 위치 인코딩은 구조적 또는 위치 기반 정보를 모델에 주입하는 기술을 참조합니다. 그래프 트랜스포머는 다양한 방법으로 이를 해결합니다:

라플라시안 고유 벡터: 그래프 라플라시안 행렬에서 파생된 이러한 벡터는 글로벌 구조를 캡처하는 스펙트럴 임베딩을 제공합니다.
랜덤 워크: 한 노드에서 다른 노드로 여러 홉에 걸쳐 이동할 수 있는 확률을 캡처합니다.
구조 인코딩: 거리 측정, 노드 度, 또는 에지 유형을 포함합니다.

이 위치 인코딩, 즉 스펙트럴, 확률적 또는 구조적 인코딩은 그래프 트랜스포머가 더 넓은 그래프에서 각 노드가 위치하는 곳을 이해할 수 있는 방법을 제공합니다. 이 구조적 인식은 주의 메커니즘이 불규칙하고 순서가 없는 데이터에서 의미 있게 작동할 수 있도록 하는 데 필수적입니다. 궁극적으로 모델이 더 단순한 순수 로컬 방법으로는 보이지 않는 관계를 캡처할 수 있도록 합니다.

실제 구현 및 사용 사례

그래프 트랜스포머를 프로덕션으로 가져오기 위해서는 실제 데이터 크기에 맞게 확장할 수 있는 인프라가 필요합니다. PyTorch Geometric (PyG)와 같은 라이브러리는 이를 가능하게 합니다. PyTorch에 구축된 PyG는 분자 모델링에서 추천 시스템까지 다양한 응용 분야에서 GNN 및 그래프 트랜스포머를 구현하기 위한 모듈식 프레임워크를 제공합니다. 여러 작은 그래프와 단일 큰 그래프에서 미니 배치 트레이닝을 지원하며 다중 GPU와 torch.compile 지원으로 연구 및 엔터프라이즈 워크플로우 모두에 적합합니다.

이러한 도구는 이미 다양한 실제 응용 분야에서 사용되고 있습니다. 약물 발견에서 그래프 트랜스포머는 원자 상호 작용을 그래프로 모델링하여 분자 특성을 예측합니다. 물류 및 공급망 최적화에서 동적 네트워크를 나타내고 상호 작용을 이유로 합니다. 전자 상거래 회사는 그래프 트랜스포머를 사용하여 제품 공동 구매 및 브라우징 동작을 관계 그래프로 이해하여 추천을 개선합니다. 사이버 보안에서 그래프 기반 모델은 액세스 패턴, 네트워크 토폴로지 및 이벤트 시퀀스를 분석하여 비정상성을 감지하는 데 사용됩니다.

각 설정에서 복잡하고 상호 연결된 구조에서 학습하는 능력은 수동으로 만든 기능만으로頼하지 않는 주요优势을 입증하고 있습니다.

기술적 고려 사항

그라프 트랜스포머는 잠재력이 있지만 실제 엔지니어링 트레이드 오프가 있습니다. 전적으로 자기 주의는 노드 수에 비례하여 크기가 증가하므로 특히 큰 그래프 또는 밀집 그래프의 경우 메모리 및 컴퓨팅 효율성이 주요 문제입니다. 실제 그래프는 방향이 있는 에지를 가지고 있으며 구조 정보가 인코딩되는 방식을 복잡하게 만듭니다. 실제 배포에서 입력은 거의 균일하지 않습니다. 그래프 구조화된 데이터를 텍스트, 시계열 또는 이미지와 결합하려면 주의 깊은 아키텍처 선택과 강력한 데이터 전처리가 필요합니다.

이러한 도전은 극복할 수 있지만 특히 연구 프로토 타입에서 프로덕션 준비 모델로 전환할 때 주의 깊은 시스템 설계가 필요합니다.

다음은 LLM이 그래프를 만나는 곳

주요 연구 방향은 대규모 언어 모델(LLM)을 그래프 구조와 통합하는 것입니다. 이러한 하이브리드 시스템은 LLM을 사용하여 텍스트 컨텍스트를 인코딩하거나 엔티티를 추출한 다음 그래프에서 이유와 의사 결정에 대한 정보를 제공합니다.

생물학에서 이것은 AlphaFold와 같은 도구를 강화했습니다. 엔터프라이즈 AI에서 고객 지원 시스템을 문서화하고 행동 그래프로 결합할 수 있습니다. 그래프 트랜스포머는 또한 구조화된 상태 표현에 대해 이유를 걸고 동적으로 상호 작용을 우선순위 지정할 수 있는 더智能한 에이전트를 구축하는 데 중요합니다. 이러한 융합은 에이전트가 계층적 관계를 더 잘 이해하고 종속성을 추적하고 복잡한 환경에서 행동을 적응시키는 데 도움이 됩니다.

이 분야는まだ 새로운 발전이 진행 중이지만 잠재적은 상당합니다.

결론

그래프 트랜스포머는 단순히 GNN의 다음 버전이 아닙니다. 주의, 구조 및 확장성의 융합을 나타냅니다. 금융, 생명 과학 또는 추천 시스템에서 일하는지 여부에 관계없이 메시지는 명확합니다. 데이터는 그래프로 구성되므로 모델도 그래프로 구성되어야 합니다.

Dr. Jure Leskovec, Chief Scientist and Co-Founder of Kumo

Dr. Jure Leskovec은 Kumo의 최고 과학자이자 공동 창립자입니다. 그는 스탠퍼드에서 15년 이상 컴퓨터 과학 교수로 재직했습니다. Jure는 그래프 신경망을 공동 개발했으며 연결된 정보에서 AI가 학습하는 방식을 발전시키는 데 경력을 바쳤습니다. 그는 이전에 Pinterest의 최고 과학자로 재직했으며 Yahoo와 Microsoft에서 수상 경력에 빛나는 연구를 수행했습니다.