AGI

Med-Gemini: 의료 AI를 다음 세대의 멀티모달 모델로 변革하다

Published June 10, 2024

Updated April 27, 2026

Dr. Tehseen Zia

인공지능(AI)은 지난 몇 년 동안 의료 분야에서 큰 파장을 일으켰습니다. 의료 이미지 진단의 정확도를 높이고, 유전체 데이터 분석을 통해 개인화된 치료를 개발하며, 생물학적 데이터를 분석하여 신약 개발을 가속화하고 있습니다. 그러나 이러한 발전에도 불구하고, 현재의 대부분의 AI 응용 프로그램은 단일 작업에만 국한되어 있으며, 단일 유형의 데이터(예: CT 스캔 또는 유전 정보)를 사용합니다. 이러한 단일 모달 접근 방식은 의사가 다양한 소스에서 데이터를 통합하여 상태를 진단하고 결과를 예측하며 종합적인 치료 계획을 수립하는 방식과는 다릅니다.

의사, 연구자, 환자를 포함한 임상 작업에서 의료 이미지 분석, 질병 예측, 유전체 데이터 분석 등을 지원하려면 AI는 텍스트, 이미지, 비디오, 전자 건강 기록(EHR) 등을 포함한 복잡한 멀티모달 데이터를 처리할 수 있어야 합니다. 그러나 이러한 멀티모달 의료 AI 시스템을 구축하는 것은 AI가 다양한 데이터 유형을 관리하는 능力的 제한과 포괄적인 생물의학 데이터셋의 부족으로 인해 어려웠습니다.

멀티모달 의료 AI의 필요성

의료는 의료 이미지, 유전 정보 등 다양한 데이터 소스를 포함하는 복잡한 네트워크입니다. 그러나 전통적인 AI 시스템은 단일 작업에만 집중하며 단일 데이터 유형으로 제한되어 있습니다. 이러한 유니모달 AI 시스템은大量의 레이블이 지정된 데이터가 필요하며, 이는 얻기 어렵고, 제한된 기능을 제공하며, 다양한 소스에서 정보를 통합하는 데 어려움을 겪습니다.

멀티모달 AI는 기존의 의료 AI 시스템의 한계를 극복하여 다양한 소스에서 정보를 통합하여 환자의 건강에 대한 더 정확하고 완전한 이해를 제공할 수 있습니다. 이러한 통합 접근 방식은 각 모달리티를 개별적으로 분석할 때 놓칠 수 있는 패턴과 상관관계를 식별함으로써 진단 정확도를 향상시킵니다. 또한, 멀티모달 AI는 데이터 통합을 촉진하여 의료 전문가가 환자 정보에 대한 통일된 뷰를 액세스할 수 있도록 하여 협력과 정보에 기반한 의사 결정이 가능합니다. 그들의 적응성과 유연성은 다양한 데이터 유형에서 학습하고 새로운 도전에 적응하며 의료 발전에 따라 발전할 수 있도록 합니다.

Med-Gemini 소개

대규모 멀티모달 AI 모델의 최근 발전은 의료 AI 시스템의 발전에 큰 영향을 미쳤습니다. 이 움직임을 주도하는 것은 Google과 DeepMind이며, 그들은 고급 모델인 Med-Gemini를紹介했습니다. 이 멀티모달 의료 AI 모델은 14개의 산업 벤치마크에서 우수한 성능을 보여주었으며, OpenAI의 GPT-4를 포함한 경쟁자들을 능가했습니다. Med-Gemini는 Google DeepMind의 Gemini 계열의 대규모 멀티모달 모델(LMM)을 기반으로 합니다. 이는 텍스트, 오디오, 이미지, 비디오를 포함한 다양한 형식의 콘텐츠를 이해하고 생성할 수 있습니다. 전통적인 멀티모달 모델과는 달리, Gemini는 고유한 Mixture-of-Experts (MoE) 아키텍처를 보유하고 있으며, 특정 데이터 세그먼트 또는 작업에熟練한 전문가인 트랜스포머 모델을 갖추고 있습니다. 의료 분야에서는 Gemini가 동적으로 들어오는 데이터 유형에 따라 가장 적합한 전문가를 동적으로 참여시킬 수 있습니다. 이는 의사가 사용하는 다학제적 접근 방식을 반영하며, 모델의 학습 및 처리 능력을 향상시킵니다.

Gemini를 멀티모달 의료 AI용으로 미세 조정

Med-Gemini를 생성하기 위해 연구자들은 Gemini를匿名化된 의료 데이터셋으로 미세 조정했습니다. 이는 Med-Gemini가 Gemini의 원래 기능을 물려받을 수 있도록 하며, 언어 대화, 멀티모달 데이터 처리, 의료 작업을 위한 더 긴 컨텍스트 관리 등이 포함됩니다. 연구자들은 2D 모달리티, 3D 모달리티, 유전학을 위한 Gemini 비전 인코더의 세 가지 사용자 지정 버전을 훈련했습니다. 이는 다양한 의료 분야의 전문가를 훈련하는 것과 같습니다. 훈련은 세 가지 특정한 Med-Gemini 변형체인 Med-Gemini-2D, Med-Gemini-3D, Med-Gemini-Polygenic의 개발로 이어졌습니다.

Med-Gemini-2D

Med-Gemini-2D는 가슴 엑스레이, CT 슬라이스, 병리학 패치, 카메라 사진과 같은 전통적인 의료 이미지를 처리하도록 훈련되었습니다. 이 모델은 분류, 시각적 질문 답변, 텍스트 생성과 같은 작업에서 우수한 성능을 보입니다. 예를 들어, 가슴 엑스레이와 “엑스레이에서 암성 종양의 징후가 있는지 나타내는 것이 있는가?”라는 지시가 주어지면 Med-Gemini-2D는 정확한 답변을 제공할 수 있습니다. 연구자들은 Med-Gemini-2D의 정교한 모델이 가슴 엑스레이 보고서 생성을 1%에서 12%까지 개선하여, 의사와 동등하거나 더 나은 보고서를 생성할 수 있다고 밝혔습니다.

Med-Gemini-3D

Med-Gemini-3D는 Med-Gemini-2D의 능력을 확장하여 3D 의료 데이터인 CT와 MRI 스캔을 해석하도록 훈련되었습니다. 이러한 스캔은 해부학적 구조에 대한 포괄적인 뷰를 제공하며, 더 깊은 수준의 이해와 더 발전된 분석 기술이 필요합니다. 텍스트 지시와 함께 3D 스캔을 분석하는 능력은 의료 이미지 진단에서 큰 발전입니다. 평가 결과, Med-Gemini-3D가 생성한 보고서 중 절반이 의사와 동일한 치료 추천으로 이어졌습니다.

Med-Gemini-Polygenic

다른 Med-Gemini 변형과는 달리 의료 이미징에 중점을 둔 Med-Gemini-Polygenic은 유전체 데이터에서 질병과 건강 결과를 예측하도록 설계되었습니다. 연구자들은 Med-Gemini-Polygenic이 텍스트 지시를 사용하여 유전체 데이터를 분석하는 최초의 모델이라고 주장합니다. 실험 결과, 모델은 우울증, 뇌졸중, 녹내장과 같은 8개의 건강 결과를 예측하는 이전의 선형 다형성 점수보다 우수한 성능을 보였습니다. 또한, 명시적인 훈련 없이 추가적인 건강 결과를 예측하는 제로샷 능력을 демонстри합니다. 이는 동맥경화증, COPD, 2형 당뇨병과 같은 질병을 진단하는 데 중요합니다.

신뢰 구축 및 투명성 보장

Med-Gemini의 상상할 수 없는 발전 외에도, 그들의 상호 작용 능력은 의료 분야에서 AI를 채택하는 데 근본적인 도전을 해결할 수 있습니다. 예를 들어, AI의 블랙박스 특성과 일자리 대체에 대한 우려입니다. 일반적인 AI 시스템과는 달리, Med-Gemini는 의료 전문가의 보조 도구로 작동합니다. 의사의 분석 능력을 강화함으로써, Med-Gemini는 일자리 대체에 대한 두려움을 완화합니다. 분석과 추천에 대한 자세한 설명을 제공함으로써, 의사가 AI의 결정과 이해 및 검증할 수 있도록 투명성을 제공합니다. 이러한 투명성은 의료 전문가 사이에 신뢰를 구축합니다. 또한, Med-Gemini는 인간의 감시를 지원하여 AI 생성된 통찰력이 전문가에 의해 검토되고 검증되도록 하여, 의료 전문가와 함께 협력하여 환자 치료를 개선하는 환경을 조성합니다.

실제 적용을 위한 경로

Med-Gemini는 놀라운 발전을 보여주고 있지만,仍在 연구 단계에 있으며, 실제 적용 전에 철저한 의료 검증이 필요합니다. 엄격한 임상 시험과 광범위한 테스트는 모델의 신뢰성, 안전성, 다양한 임상 환경에서의 효과를 보장하기 위해 필수적입니다. 연구자들은 Med-Gemini의 성능을 다양한 의료 조건과 환자 인구 통계에 걸쳐 검증하여 그들의 강건성과 일반성을 보장해야 합니다. 규제 승인은 의료 표준 및 윤리 지침을 준수하는 것을 보장하기 위해 필요합니다. AI 개발자, 의료 전문가, 규제 기관 간의 협력은 Med-Gemini를 정제하고, 그들의 제한을 해결하며, 그들의 임상 유용성에 대한 신뢰를 구축하는 데 중요합니다.

요약

Med-Gemini는 텍스트, 이미지, 유전체 정보를 포함한 멀티모달 데이터를 통합하여 포괄적인 진단과 치료 추천을 제공함으로써 의료 AI의 상당한 발전을 나타냅니다. 전통적인 AI 모델과는 달리, Med-Gemini의 고급 아키텍처는 의료 전문가의 다학제적 접근 방식을 반영하며, 진단 정확도를 향상시키고 협력을 촉진합니다. 그들의 आश망 있는 잠재력에도 불구하고, Med-Gemini는 실제 적용 전에 철저한 검증과 규제 승인이 필요합니다. 그들의 개발은 의료 전문가의 보조 도구로서 AI가 환자 치료를 개선하는 미래를 예상합니다.