인터뷰

Bobby Samuels, Protege의 공동 창립자 및 CEO – 인터뷰 시리즈

Published December 15, 2025

Updated April 25, 2026

Antoine Tardif, CEO & Founder of Unite.AI

Bobby Samuels는 Protege의 전략 및 실행을 제품, 시장 진출, 자본 조달 전반에 걸쳐 이끌고 있습니다. 그는 2024년에 Protege를 공동 창립하여 설립 이후부터 CEO를 맡고 있습니다. 그의 리더십 아래, Protege는 3,500만 달러의 자금을 조달하고 첫 해에 3,000만 달러의 GMV에 도달했습니다. 이전에는 Datavant의 Privacy Hub의 총괄 매니저로 재직하며, 회사 성장의 주도적인 역할을 수행하였고, 이후 Ciox Health와의 70억 달러의 합병을 통해 미국에서 가장 큰 중립적인 건강 데이터 에코시스템을 구축하였습니다. 이전에는 LiveRamp에서 파트너십을 이끌며 중립적인 데이터 네트워크 구축에 대한 전문성을 개발했습니다. Bobby는 스탠퍼드 대학 경영대학원에서 MBA를, 하버드 대학에서 AB를 취득하였으며, 하버드 크림슨의 사장으로 재직했습니다. 그는 규제된 데이터 교환 및 기업 파트너를 위한 신뢰할 수 있는 AI 활성화로의 복잡한 인프라를 번역하는 데 대한 깊은 전문성을 가지고 있습니다.

Protege는 고가의 독점 데이터 세트 소유자와 AI 모델을 구축하는 개발자들을 연결하는 데이터 인프라 회사로, 규제되고 개인 정보가 우선하는 방식으로 대규모로 교육 데이터에 라이선스하고 액세스할 수 있는 방법을 제공합니다. 2024년에 설립된 이 플랫폼은 전통적으로 AI 팀이 소싱하기 어려운 의료 기록, 이미지, 비디오, 오디오와 같은 멀티모달 데이터를 해제하는 데 중점을 두고 있으며, 데이터 제공자는 개인 정보, 규정 준수, 수익화에 대한 전체적인 제어를 제공합니다. AI 빌더를 위해 Protege는 데이터 세트의 큐레이션된 카탈로그와 데이터 세트를 필터링하고 결합하는 도구를 통해 발견과 인수를 간소화하여 의료, 미디어 및 기타 부문의 개발을 가속화합니다. 본질적으로, 회사는 AI를 위한 신뢰할 수 있는 데이터 계층이 되기를 목표로 하며, 이는 현대적인 모델 개발에서 가장 큰 병목 현상 중 하나입니다.

당신은 Protege를 설립하도록 무엇이 영감을 주었으며, Datavant에서 데이터, 개인 정보, 조직 변환과 같은 이니셔티브를领导한 경험과 LiveRamp에서의 이전 역할은 Protege를 구축하는你的 비전을 어떻게 형성했나요?

Datavant에서의 경험은 대규모로 책임감 있게 데이터를 연결하는 것의 힘과 복잡성을 보여주었습니다. Datavant는 환자 개인 정보를 유지하면서 민감한 건강 정보를 연결하는 플랫폼을 구축했으며, 잘 관리된 데이터는巨大的 사회적 진보를驱動할 수 있다는 것을 알게 되었습니다. 그러나 그것이 아닐 때, 실제로 피해를 끼칠 수 있습니다.

AI가 가속화됨에 따라, 동일한 패턴을 반복하는 것을 보았습니다. 컴퓨팅 및 AI 아키텍처에 대한 집중은 모델 자체를驱動하는 데이터에 대한 것이 아닙니다. 우리의 가설은 다음巨大的 병목 현상은 올바른 데이터에 대한 액세스입니다.私はデータ 홀더와 AI 빌더 모두에게 안전하고 투명하며 상호ประโยชน적인 데이터 공유를 허용하는 데이터 인프라 계층을 구축하고 싶었습니다. 그것이 Protege를 구축하는 데 영감을 주었습니다.

Protege는 “AI 데이터 경제의 백본”을 구축한다고 설명합니다. 이 계층을 어떻게 정의하시나요? 그리고 실제로 AI를 위한 진정한 데이터 인프라는 무엇입니까?

Protege는 데이터 소유자와 AI 개발자가 안전하게 협력할 수 있는 연결 고리입니다. AI를 위한 진정한 데이터 인프라는 단순히 데이터를 저장하거나 이동하는 것을 넘어, 출처를 확인하고, 권한을 관리하며, 모든 데이터 세트가 윤리적으로 그리고 동의에 따라 사용되도록 합니다. 실제로, 이는 콘텐츠 홀더가 데이터를 자신감 있게 라이선스하고 적절하게 보상을 받을 수 있는 단일 플랫폼이며, AI 빌더는 산업, 도메인, 모달리티 및 형식에 걸쳐 필요한 데이터 세트에 액세스하여 모델을 책임감 있게 교육하고 평가할 수 있습니다.

당신의 핵심 임무 중 하나는 모델이 라이선스된, 대표적이며 동의 기반의 데이터 세트에서 훈련되도록 보장하는 것입니다. Protege는 대규모로 윤리적인 소싱을 어떻게 운영합니까?

우리는 슬로건이 아닌 시스템을 통해 윤리를 운영합니다. 우리가 집계하고 전달하는 모든 데이터 및 콘텐츠 소스와 함께, 우리는 권한 소유자가 명확한 라이선스 조건 및 개인 정보 보호와 함께 소유권을 유지하고 있음을 보장합니다.

우리의 플랫폼은 인간, 연구 중심의 전문성을 데이터 파이프라인 및 시스템과 결합하여 권한이 보호된 데이터를 전달합니다. 또한, 우리는 데이터 구매 고객과 협력하여 데이터가 실제 세계 인구와 실제 사용 사례를 대표하는지 확인합니다. 데이터 공급자와 데이터 구매자를 모두 일관성과 명확성으로 다루는ことで, 우리는 규정 준수, 공정성 및 신뢰를 유지할 수 있습니다.

AI 산업은 오랫동안 “스크레이핑 후 물어보기”라는 마음가짐으로 주도되어 왔습니다. 투명한 데이터 라이선싱이 데이터 제공자와 AI 개발자 간의 관계를 어떻게 재정의할까요?

투명성은 추출을 협력으로 전환합니다. AI 회사들은 더 이상 스크레이핑을 하지 않고, 검증된 데이터 제공자로부터 데이터를 윤리적으로 라이선스할 수 있습니다. 이는 양쪽 모두에게 더好的 인센티브를 생성합니다. 데이터 제공자는 수익과 제어를 얻으며, AI 개발자는 법적 및 지적 재산 문제 없이 깨끗하고 높은 품질의 데이터 세트를 얻습니다.

이 변화는 신뢰를 구축하며, 이는 AI 개발의 속도를 가속화합니다. 조직이 AI가 책임감 있게 구축될 수 있으며, 데이터 권한 소유자의 동의와 보상이 명확하다는 것을 볼 때, 이는 더 많은 사용 사례와 데이터 요구를 잠금으로 만듭니다. 이는 더 높은 품질의 데이터 세트에 대한 수요를 생성하며, 이는 자연스러운 플라이휠을 시작합니다. 최고의 데이터 소스는 구매자를 끌어들이며, 구매자는 더 높은 신뢰성의 데이터 소스를 끌어들이는 것입니다. 모든 사람이 혜택을 받습니다.

합성 데이터는 개인 정보 및 편향 문제에 대한 해결책으로 종종 간주됩니다. 특히 의료와 같은 규제 분야에서 합성 데이터와 실제 세계 데이터 세트 간의 올바른 균형은 어디에 있나요?

합성 데이터는 테스트 및 보강에 유용하지만, 실제 세계 활동이 생성하는 교육 및 평가 데이터의 전체적인 복잡성을 완전히 대체할 수 없습니다. 특히 의료 분야에서, 장기적인 환자 치료 기록 및 치료 접근 방식의 결과가 중요합니다.

우리는 기본적으로 AI가 실제 세계의 전체적인 복잡성을 훈련하지 않은 경우, 실제 세계를 대표하는 합성 데이터를 생성할 수 없다고 믿습니다. 아마도 올바른 균형은 합성 데이터를 특정 사용 사례에 대한 보충으로 사용하는 하이브리드 접근 방식일 것입니다. 현재 고립되어 있고 해제되어야 하는 더 많은 유용한 고품질 데이터 소스가 필요하며, 이를 합성 데이터와 결합하여 실제 세계 사용 사례를 위한 특정 사용 사례에 사용할 것입니다.

Protege는 조직이 실제 세계 데이터를 안전하게 공유할 수 있도록 어떻게 허용합니까? 기밀 정보, 환자 데이터 또는 지적 재산을 노출하지 않고?

보안 및 개인 정보 보호는 여행의 모든 단계에 통합됩니다. 내부 시스템 또는 데이터 전송의 개인 정보 보호를 확인하는 내부 파트너를 통해, 우리는 데이터가 의도된 경계 내에 머물도록 보장합니다.

의료 분야에서는 모든 데이터 전송에 대한 개인 정보 보호 및 규정 준수 프레임워크를 준수하는 것을 의미합니다. 미디어 분야에서는 미디어 콘텐츠가 의도된 사용을 위해 사전 동의된 라이선스 조건 및 기간에 따라 라이선스되는 것을 의미합니다.

기초 모델이 계속 진화함에 따라, 다음 세대의 고품질 교육 데이터 파이프라인을 정의하는 것은 무엇입니까?

세 가지 원칙이 이를 주도할 것입니다. 출처, 정밀도, 목적입니다.

출처는 출처 및 조건에 대한 전체 추적 가능성을 의미합니다. 정밀도는 일반적인 데이터 집합이 아닌 특정 모달리티 또는 사용 사례를 위한 큐레이션을 의미합니다. 목적은 실제 결과와의 일치에 대한 데이터 선택을 의미합니다. 이러한 원칙은 함께 더 나은 모델을 구축하기 위한 고품질 데이터를 사용하는 경로를 만듭니다.

EU AI 법 및 미국의 향후 프레임워크와 같은 새로운 규제는 Protege의 규정 준수 및 국경 간 데이터 협력 접근 방식에 어떤 영향을 미치나요?

이러한 규제는 우리가 회사를 기반으로 한 접근 방식을 검증합니다. 투명성, 출처, 위험 관리를 강조하며, 이는 우리의 제품 및 플랫폼에 기본적으로 내장되어 있습니다.

우리는 미래의 AI 기회는 권한 소유자를 보호하고 엄격한 개인 정보 보호 제어를 유지해야 한다고 믿습니다. 이러한 것을 비협상적인 것으로 다루는ことで, 우리는 데이터 파트너와 클라이언트가 신뢰와 확신으로 AI 풍경을 앞으로 나아갈 수 있도록 도와줍니다. 우리의 목표는 책임감 있는 AI 개발을 올바른 일로 만드는 것이 아니라, 더 쉬운 일로 만드는 것입니다.

데이터 투명성 및 출처는 AI 시스템에 대한 공공 신뢰를 재건하는 데 어떤 역할을 할까요?

신뢰는 추적 가능성에서 시작됩니다. 사람들이 데이터가 어디에서 왔으며 어떻게 사용되는지 이해할 때, 그들은 AI 결과를 더 신뢰할 가능성이 있습니다.

투명성 및 출처는 데이터 소유자, 모델 개발자 및 최종 사용자 간에 책임을 생성합니다. 이는 AI를 더 이해할 수 있고 설명할 수 있는 것으로부터 블랙 박스로 전환합니다.

20배의 성장과 2,500만 달러의 시리즈 A를 거친 후, 어떻게 Protege의 윤리 및 보안 약속을 유지하면서 빠른 확장을 균형 있게 유지합니까? 그리고 Protege는 책임감 있는 AI 모델 훈련을 형성하는 데 어떻게 앞으로 나아갈까요?

윤리 및 보안은 우리가 확장할 수 있는 기반이며, 모든 새로운 프로세스, 파트너십 및 제품은 다른 사람이看着 우리가 운영하는 방식과 우리가 내리는 결정에 대해 자랑스러워할 수 있는지에 대해 측정됩니다. 2026년을 향해, 우리는 의료 및 미디어를 넘어 새로운 도메인 영역으로 확장하고, 벤치마크를 위한 평가 데이터와 같은 새로운 데이터 제품을 만들고 있으며, AI 조직이 실제 세계 사용 사례에 대한 AI 성능을 더 잘 측정하도록 노력하고 있습니다. 우리의 목표는 실제 세계 AI 데이터 및 전문 지식을 위한 단일 신뢰할 수 있는 플랫폼이 되는 것입니다. 이는 장기적으로 AI의 진행을 구동하기 위한 것입니다.

위대한 인터뷰에 감사드립니다. 더 많은 정보를 원하는 독자는 Protege를 방문할 수 있습니다.

Unite.AI

Bobby Samuels, Protege의 공동 창립자 및 CEO – 인터뷰 시리즈

You may like