์ธํฐ๋ทฐ
ํ๋กํ ์ง์ ๊ณต๋ ์ฐฝ๋ฆฝ์์ด์ CEO์ธ Bobby Samuels – ์ธํฐ๋ทฐ ์๋ฆฌ์ฆ

Bobby Samuels는 프로테지의 전략 및 실행을 제품, 시장 진출, 자본 조달에 걸쳐 리드합니다. 그는 2024년에 프로테지를 공동 창립하여 창립 이후부터 CEO를 맡고 있습니다. 그의 리더십 아래 프로테지는 3,500만 달러의 자금을 조달하고 첫 해에 3,000만 달러의 매출을 달성했습니다. 이전에 그는 Datavant의 Privacy Hub의 일반 매니저로 재직하며 회사 성장에 기여하였고, 이후 Ciox Health와의 70억 달러의 합병을 통해 미국에서 가장大的 중립적인 헬스케어 데이터 에코시스템을 구축했습니다. 이전에 그는 LiveRamp에서 파트너십을 담당하며 중립적인 데이터 네트워크 구축에 대한 전문知识를积累했습니다. 그는 스탠퍼드 대학 경영대학원에서 MBA를, 하버드 대학에서 AB를 취득하였으며, 하버드 크림슨의 사장으로 재직했습니다. 그는 규제된 데이터 교환 및 기업 파트너를 위한 신뢰할 수 있는 AI 활성화에 대한 전문知识를 가지고 있습니다.
프로테지는 고가의 데이터 소유자와 AI 모델을 개발하는 개발자들을 연결하는 데이터 인프라 회사입니다. 2024년에 설립된 이 플랫폼은 의료 기록, 이미지, 비디오, 오디오 등 AI 팀이 Difficulty를 겪는 데이터를解鎖하는 것을 중점으로 하며, 데이터 제공업체는 개인 정보, 규제, 수익화를 완전히 제어할 수 있습니다. AI 개발자를 위한 프로테지는 데이터의 발견과 취득을 위한 커리케이티드 카탈로그와 데이터셋 필터링 및 결합을 위한 도구를 제공하여 헬스케어, 미디어 등 다양한 분야에서 개발을 가속화합니다. 본질적으로 이 회사는 AI를 위한 신뢰할 수 있는 데이터 계층이 되고자 하며, 이는 현대적인 모델 개발에서 가장 큰 병목 현상을 줄이는 것을 목표로 합니다.
프로테지를 창립한 계기는 무엇이며, Datavant에서 데이터, 개인 정보, 조직 변화를 이끄는 경험은 프로테지 구축에 어떻게 영향을 주었나요?
Datavant에서 일한 경험은 데이터를 책임감 있게 연결하는 힘과 복잡성을 보여주었습니다. Datavant는 환자 개인 정보를 유지하며 민감한 건강 정보를 연결하는 플랫폼을 구축하였으며, 잘 관리되는 데이터는巨大的 사회적 진보를 가져올 수 있음을 깨달았습니다. 그러나 잘 관리되지 않는다면 실제로 피해를 줄 수 있습니다.
AI가 가속화됨에 따라 같은 패턴이 반복되는 것을 보았습니다. 컴퓨팅과 AI 아키텍처에 대한 초점은 있지만, 모델을 구동하는 데이터에 대한 초점은 상대적으로 적었습니다. 우리의 가설은 다음巨大的 병목 현상은 올바른 데이터에 대한 접근입니다. 저는 데이터 공유를 안전하게, 투명하게, 데이터 소유자와 AI 개발자 모두에게 유익하게 하는 데이터 인프라 계층을 구축하고자 하였습니다. 또한 AI 데이터 전문 지식을 통해 연구 기반의 AI 발전에 지원하는 것이 프로테지의 목표입니다.
프로테지는 “AI 데이터 경제의 백본”을 구축한다고 설명합니다. 이 계층을 어떻게 정의하시나요? 그리고 실제로 AI를 위한 진정한 데이터 인프라는 무엇입니까?
프로테지는 데이터 소유자와 AI 개발자가 안전하게 협력할 수 있는 연결 고리입니다. AI를 위한 진정한 데이터 인프라는 단순히 데이터를 저장하거나 이동시키는 것을 넘어서 데이터의 출처를 확인하고, 권한을 관리하며, 모든 데이터셋이 윤리적으로 사용되고 동의를 얻은 것을 보장합니다. 실제로는 데이터 제공업체가 데이터를 자신 있게 라이선스할 수 있고, 적절하게 보상받을 수 있는 단일 플랫폼이며, AI 개발자는 산업, 도메인, 모달리티, 형식에 걸쳐 필요한 데이터셋에 접근할 수 있습니다.
라이선스된, 대표적인, 동의 기반의 데이터셋으로 모델을 훈련시키는 것을 보장하는 것이 프로테지의 핵심 임무입니다. 프로테지는 어떻게 대규모에서 윤리적인 데이터 소싱을 구현하나요?
우리는 시스템을 통해 윤리를 구현합니다. 우리가 집계하고 제공하는 모든 데이터 및 콘텐츠 소스와 함께, 우리는 권리 소유자가 명확한 라이선스 조건과 개인 정보 보호를 유지하는 것을 보장합니다.
우리의 플랫폼은 우리의 인간 중심 연구 전문 지식과 데이터 파이프라인 및 시스템을 결합하여 규모에 맞게 권리 보호된 데이터를 제공합니다. 또한 우리는 데이터 구매 고객과 협력하여 데이터가 실제 세계 인구와 실제 사용 사례를 반영하는 것을 보장합니다. 데이터 공급업체와 데이터 구매자를 명확성과 일관성으로 대처함으로써, 우리는 규정 준수, 공정성, 신뢰를 유지할 수 있습니다.
AI 산업은 오래전부터 “스크레이핑 후 물어보는” 마음가짐으로 움직여왔습니다. 데이터 라이선싱의 투명성이 데이터 제공업체와 AI 개발자 간의 관계를 어떻게 바꿀까요?
투명성은 추출을 협력으로 바꿉니다. AI 회사들은 더 이상 데이터를 스크레이핑할 필요가 없으며, 대신에 데이터 제공업체로부터 데이터를 윤리적으로 라이선스할 수 있습니다. 이는 데이터 제공업체가 수익과 제어를 얻을 수 있으며, AI 개발자는 법적 및 지적 재산권 문제 없이 깨끗하고 높은 품질의 데이터셋을 얻을 수 있습니다.
이 변화는 신뢰를 구축하며, 이는 AI 개발의 속도를 높입니다. 조직이 AI가 책임감 있게 구축될 수 있으며, 데이터 권리 소유자에게 명확한 동의와 보상을 제공할 수 있다면, 더 많은 사용 사례와 데이터需求이 해금됩니다. 이는 자연스러운 플라이휠을 생성합니다. 최고의 데이터 소스는 구매자를 끌어들이며, 구매자는 더 높은忠實度의 데이터 소스를 끌어들입니다. 모든 사람이 이익을 얻습니다.
합성 데이터는 개인 정보와 편향 문제를 해결하는 방법으로 종종 볼 수 있습니다. 실제 데이터셋과 합성 데이터셋 간의 올바른 균형은 어디에 있는지 생각하시나요? 특히 헬스케어와 같은 규제 분야에서는 어떻게 생각하시나요?
합성 데이터는 테스트와 보강에 유용하지만, 실제 세계의 복잡성을 완전히 대체할 수는 없습니다. 특히 헬스케어에서 장기적인 환자 치료 기록과 결과는 치료 접근 방식의 contexto에서 중요합니다.
우리는 기본적으로 실제 세계의 복잡성을 완전히 반영하지 못한 AI는 실제 세계를 대표하는 합성 데이터를 생성할 수 없다고 믿습니다. 아마도 올바른 균형은 실제 데이터 소스와 합성 데이터를 결합하는 하이브리드 접근 방식일 것입니다. 현재 실로된 데이터 소스를 해금하고, AI 생성 합성 데이터를 특정 사용 사례에 사용하는 것입니다.
프로테지는 어떻게 조직이 귀중한 실제 데이터를 안전하게 공유할 수 있도록 지원하며, 동시에 기밀 정보, 환자 데이터, 지적 재산권을 노출하지 않나요?
보안과 개인 정보 보호는 모든 단계에서 구축됩니다. 내부 시스템이나 데이터 전송을 확인하는 개인 정보 보호 파트너를 통해, 우리는 데이터가 의도된 경계를 넘지 않는다는 것을 보장합니다.
헬스케어에서 이는 모든 데이터 전송에 대한 개인 정보 보호 및 규정 준수 프레임워크를 준수하는 것을 의미합니다. 미디어에서는 라이선스된 콘텐츠가 의도된 용도에 따라 라이선스 조건과 기간에 따라 라이선스되는 것을 보장합니다.
기초 모델이 계속 진화함에 따라, 높은 품질의 훈련 데이터 파이프라인의 다음 세대는 무엇으로 정의될까요?
세 가지 원칙이 주도할 것입니다. 출처, 정밀도, 목적입니다.
출처는 출처와 조건에 대한 완전한 추적 가능성을 의미합니다. 정밀도는 특정 모달리티 또는 사용 사례를 위한 데이터의 큐레이션을 의미하며, 이는 일반적인 데이터 코퍼스나 실제 상황을 반영하지 않는 데이터와 다릅니다. 목적은 데이터 선택을 실제 결과와 일치시키는 것을 의미하며, 단지 허구의 벤치마크가 아닙니다.
이러한 원칙은 함께 높은 품질의 데이터를 사용하여 더好的 모델을 구축하는 경로를 제공합니다.
EU AI법과 即将 도입되는 미국 프레임워크와 같은 새로운 규제는 프로테지의 규정 준수와 국경 간 데이터 협력 접근 방식에 어떻게 영향을 미치나요?
이러한 규제는 우리가 회사에 기반을 둔 접근 방식을 검증합니다. 투명성, 출처, 위험 관리를 강조하며, 이는 우리의 제품과 플랫폼에 기본적으로 내장되어 있습니다.
우리는 미래의 AI 기회는 권리 소유자를 보호하고 엄격한 개인 정보 보호 제어를 유지해야 함을 믿습니다. 이러한 사항을 불가결한 것으로 다루면, 데이터 파트너와 고객이 신뢰와 확신을 가지고 빠르게 변화하는 AI 풍경에서 앞으로 나아갈 수 있도록 도와줄 수 있습니다. 우리의 목표는 책임감 있는 AI 개발을 올바른 일로 만드는 것이 아니라, 더 쉬운 일로 만드는 것입니다.
데이터 투명성과 출처는 AI 시스템에 대한 대중의 신뢰를 재건하는 데 어떤 역할을 할까요?
신뢰는 추적 가능성에서 시작됩니다. 사람들이 데이터가 어디서 왔으며 어떻게 사용되는지 이해할 수 있다면, 그들은 AI 결과를 더 신뢰할 가능성이 높습니다.
투명성과 출처는 데이터 소유자, 모델 개발자, 최종 사용자 간의 책임을 생성합니다. 이는 AI를 더 이해할 수 있고 설명할 수 있는 것으로 만듭니다.
20배의 성장과 2,500만 달러의 시리즈 A 투자를 받은 후, 프로테지는 어떻게 빠른 성장과 동시에 윤리적 및 보안 의무를 유지하고 있나요? 또한 프로테지는 어떻게 책임감 있는 AI 모델 훈련을 형성하는 데 앞으로 나아갈 계획입니까?
윤리와 보안은 우리가 성장할 수 있는 기반이며, 모든 새로운 프로세스, 파트너십, 제품은 다른 사람들이看着 우리가 운영하고 결정하는 방식을 보았을 때 자랑스러워할 수 있는지에 따라 측정됩니다. 만약 모든 사람이 우리가 운영하는 방식과 우리가 내린 결정들을 볼 수 있다면, 나는 그들이 자랑스러워할 것이라고 생각합니다.
2026년을 향해, 우리는 헬스케어와 미디어를 넘어 새로운 도메인에 대한 확장과 새로운 데이터 제품을 생성할 계획입니다. 벤치마크를 위한 평가 데이터를 포함하여, 실제 세계의 사용 사례를 위한 AI 성능을 더 잘 측정하기 위한 것입니다. 우리의 목표는 실제 세계의 AI 데이터와 전문 지식을 위한 단일 신뢰할 수 있는 플랫폼이 되는 것입니다. 이는 오랜 기간 동안 AI의 발전을 지원하기 위한 것입니다.
이번 인터뷰에 감사드립니다. 더 많은 정보를 원하시는 독자는 프로테지를 방문하십시오.












