์ธํฐ๋ทฐ
์๋ฆฌ์๋ฒ ์ค ๋จ๋ฌด๋ฅด, Teleskope์ CEO & ์ค๋ฆฝ์ – ์ธํฐ๋ทฐ ์๋ฆฌ์ฆ

엘리자베스 남무르, Teleskope의 CEO이자 설립자는 데이터 보안 엔지니어 출신으로 세계 최대의 기술 기업에서 데이터 보안, 소프트웨어 엔지니어링, 혁신 분야에서 경력을 쌓아왔다. 에어비앤비에서 데이터 보안에 중점을 둔 선임 소프트웨어 엔지니어로 일하면서 수십 개의 시스템에 걸쳐 급속히 성장하는 거대한 데이터 에스테이트를 이해하고 제어하는 운영적인 도전을 직면했다. 이 경험과 아마존 및 부즈 앨런 해밀턴에서 이전에 수행한 기술 및 전략적 역할은 현대 조직이 대규모에서 민감한 데이터를 관리하는 어려움에 대한 그녀의 관점을 형성했으며 결국 그 격차를 해결하는 회사인 Teleskope를 설립하게 되었다.
Teleskope는 조직이 데이터가 어디에 존재하는지, 어떻게 사용되는지, 환경이 더 복잡해짐에 따라 어떤 위험을 초래하는지 지속적으로 이해하는 데 도움을 주는 현대적인 데이터 보안 플랫폼이다. 개발자와 보안 팀을 고려하여 설계된 이 플랫폼은 클라우드, SaaS, 하이브리드 환경 전반에 걸쳐 정교한 데이터 가시성, 자동화된 수정, 정책 기반 제어를 강조한다. 정적 감사와 수동 프로세스를 넘어서서 Teleskope는 조직에 데이터 확산을 관리하는 실용적인 기초를 제공하는 동시에 책임 있는 AI 채택을 가능하게 한다.
에어비앤비에서 대규모 데이터를 카탈로그화하고 분류하는 내부 데이터 보안 도구를 구축한 후 Teleskope를 설립했습니다. 어떤 순간이 이 프로젝트를 회사로 전환해야 하는지 확신시켰는지, 그리고 초기 교훈이 제품 논제를 어떻게 형성했는지 설명해 주십시오.
에어비앤비에서 이 제품을 완성했을 때, “대규모 데이터 보호 자동화”라는 제목의 블로그 게시물 작성 기회를 얻었다. 실제로 아무런 반응도 기대하지 않았지만, 보안 커뮤니티가 매우 호의적으로 반응했으며 전 세계의 실무자들이 나에게 연락하기 시작했다. 많은 사람들이 내가 직면했던 동일한 도전을 공유한다는 것을 깨달은 순간이 있었고, 이 제품이真正로 시장에서 요구하는 것이라는 것을 알게 되었다. 초기에는 피드백에서 बहुत 많이 배웠고, 심지어 Teleskope v1.0은 에어비앤비에서 처음 구축한 것보다 훨씬 좋았다. 오늘날我们的 제품은 당시보다 훨씬 더 크고 영향력이 있다.
您的 다중 모델 분류 파이프라인은 전통적인 ML, 형식 특정 모델, GenAI 검증을 결합합니다. 결정 논리와 대규모에서 거짓 양성/음성을 어떻게 줄이는지 설명해 주십시오.
저는 데이터 분류에 대한 우리의 블로그를 읽을 것을 권장합니다. 이 블로그는 저와 데이터 과학 책임자 이반과 함께 작성했습니다. 먼저 이것이 예술이기도 하다는 것을 말하고 싶습니다. 민감한 데이터 엔티티를 발견할 때마다 컨텍스트는 고유할 것입니다. 한편, 데이터의 규모는 이 문제를 무한히 더 어렵게 만들었습니다. 왜냐하면 생산 데이터의 페타바이트를 스캔하는 데 많은 컴퓨팅 자원과 시간이 필요하기 때문입니다. 본질적으로, 이것이 여전히 크게 해결되지 않은 문제로 남아 있는 이유가 있습니다.
예술이 들어가는 곳은 모든 트레이드오프를 어떻게 균형을 잡을 것인지 결정하는 것입니다. 속도, 지연, 정확도, 비용, 데이터 저장소, 파일 형식, 언어 등에서 균형을 잡는 것입니다. 우리는 항상 창의적인 해결책이 필요하다고 믿었습니다. 이것이 우리가 접근한 방식입니다. 여러 분류 방법을 결합하여 동적이고 세련된 접근 방식을 제공합니다. 요약하자면, 정확성을 크게 희생하지 않으면서 가능한 한 가장 경량화된 방법을 사용하도록 설계되었습니다. 이 동적 접근 방식은 하나만 맞는 방식에 의존하는 도구보다 데이터를 10~20배 더 빠르게 스캔할 수 있으며, REGEX 또는 전통적인 컨텍스트 기반 접근 방식보다 훨씬 더 정확한 결과를 제공합니다.
최근에 Prism을 도입했는데, 비즈니스 수준의 데이터 이해와 GenAI 기반 수정에 중점을 두었습니다. 요소 수준의 PII 감지와 비교하여 새로운 사용 사례는 무엇이며, 수정 조치에서 환각을 방지하는 방법은 무엇입니까?
처음에 데이터 분류 및 보호의 도전을 해결하려고 했을 때, 실제로 거짓 양성 결과를 줄이는 것에 초점을 맞췄습니다. 예를 들어, 사회 보장 번호를 플래그할 때 실제로 95%의 경우真正로 사회 보장 번호인지 확인하는 방법입니다. 몇 년 전, 다양한 데이터 요소 유형에서 80%의 정확도는 이미 개선된 것이었습니다.
그러나 지난 1년 동안 고객과密接하게 협력하면서 팀이 압도되는 “노이즈”가 실제로 거짓 양성 데이터 엔티티 분류(전통적인 “거짓 양성”)로 인한 것이 아니라 종종 무의미한 경보로 인해 발생한다는 것을 알게 되었습니다. Prism이 하는 일은 더 많은 컨텍스트를 고려할 수 있는 능력을 해방합니다. 단순히 “이 데이터는 무엇인가” 또는 “이 파일에 액세스하는 사람은 누구인가”가 아니라 “실제로 이 파일은 무엇인가”입니다. 비즈니스에서 실제로 무엇을 하는지 및 관심을 가진 내용에 대한 정보를 수집함으로써 각 회사에 대한 “민감한” 데이터의 다른 정의에 따라 제품을 제공할 수 있습니다.
이러한 수준의 세련된 컨텍스트를 포착하는 것은真正로 게임 체인저입니다. 예를 들어, 개인 드라이브에 수백 개의 사회 보장 번호를 저장하는 구글 ドキュメント는 주요 위험 및 데이터 관리 정책 위반이 될 수 있습니다. 그러나 보안한 HR 드라이브에 직원 W2를 저장하는 폴더는 예상된 동작입니다. 보안 팀은 전자의 경우 경보를 받고 싶지만 올바르게 저장된 각 직원의 W2에 대한 경보는 단순히 노이즈입니다. 민감한 데이터가 어디에 존재하는지 및 어떤 컨텍스트에서 존재하는지 이해하려면 단순한 엔티티 분류 모델보다 더 많은 것이 필요합니다.
우리는 Chevron Philips Chemicals라는 다국적 화학 회사와 협력합니다. 이 비즈니스에서는 소비자 데이터 위험이 우선순위가 아니므로 개인 정보 보호 도구나 표준 DSPM을 구매하지 않을 것입니다. 그러나 지적 재산으로서 고유한 화학 방정식을 관심있어합니다. 문서의 본질을 클러스터화된 레이블 목록으로 요약할 수 있으므로 고유한 민감한 요소를 감지하고 이러한 데이터 자산이 “잘못된” 위치에 있는 인스턴스를 찾을 수 있습니다. 이 컨텍스트를 자동화된 수정과 결합하여 이러한 파일을 보관, 삭제, 편집 또는 올바른 위치로 이동하는 조치를 취할 수 있습니다. 데이터 보안 시장에서 아무도 이러한 작업을 수행하지 않고 있습니다.
Teleskope는 멀티 클라우드, 온프레미스, 제3자 시스템을 포함한 지속적인 검색을 강조합니다. “완전한 지도” 커버리지가 무엇인지, 그리고 그린필드 배포에서 알려지지 않은 저장소를 얼마나 빠르게 노출할 수 있는지 설명해 주십시오.
“완전한”이라는 용어는 여기서 까다롭습니다. 실제로 이는 끊임없이 이동하는 기준입니다. 데이터 확산을 관리하는 것이如此 어렵기 때문입니다. 우리의 목표는 고객의 데이터가 존재하는 모든 곳에서 Teleskope가 존재하는 것입니다. 우리는 본질적으로 통합 기반 제품입니다. 우리는 광범위한 범위의 SaaS 도구, 클라우드 데이터 저장소, 온프레미스 시스템을 크롤링, 스캔, 분류할 수 있는 수십 개의 고유한 데이터 커넥터를 구축했습니다. 대부분의 고객은 가장 높은 위험 또는 가장 낮은 가시성을 가진 커넥터와 시작하므로 실제로 회사의 데이터가 존재하는 모든 곳에 거의 존재하지 않습니다. 그러나 각 데이터 소스에서 우리는 새로운 계정, 테이블, 새로운 블롭, 파일, 메시지 등을 실시간으로 노출하기 위해 끊임없이 환경을 크롤링합니다.
AI 보안 및 거버넌스에 대해, 훈련 데이터셋, 모델, 프롬프트, 출력 간의 계보를 감사 가능성을 위해 어떻게 추적합니까?
우리는 실제로 AI 보안 및 거버넌스를 지원하는 세 가지 핵심 방법을 가지고 있습니다. 첫째, 데이터가 이동 중일 때 우리의 분류 및 수정 기술을 적용할 수 있는 능력입니다. 회사가 자신의 모델을 훈련시키기 위해 데이터셋을 생성하거나 준비할 때, 민감한 데이터가 없는지 확인할 수 있는 방법이 필요합니다. 따라서 우리는 데이터 파이프라인에 플러그인하고 데이터가 훈련 세트로 이동되거나 복사될 때 데이터셋을 스クラブ할 수 있습니다. 이를 통해 모델이 민감한 데이터를 출력하는 위험에 처하지 않습니다.
둘째, 우리의 핵심 제품은 AI 채택을 가능하게 하는 것입니다. 모든 회사는 효율적으로 운영하고 시장에 따라야 하므로 AI 도구를 사용해야 합니다. M365의 Copilot은 스마트 검색 기능을 제공하고 파일이나 데이터를 찾는 것을 더 쉽게 합니다. 그러나 이러한 도구는 정의에 따라 민감한 데이터를 찾는 것도 더 쉽게 합니다. 따라서 많은 회사가 나에게 다음과 같이 말합니다. “우리는 이 AI 도구를 구현해야 하지만, 어떤 것을 노출할지 걱정합니다.” 그들은 Teleskope가 환경을 스캔하고 자동으로 데이터 관리 및 보안 정책을 시행하여 AI를 안심하고 채택할 수 있도록 합니다.
마지막으로, 우리는 민감한 데이터가 유출되지 않도록 안전하게 채택할 수 있는 방법으로 AI 도구에 대한 통합을 구축 중입니다. 많은 회사가 이러한 도구의 사용을 금지하지만, 안전하게 채택할 방법이 있습니다. 따라서 민감한 데이터(각 회사가 정의한 대로)를 포함하는 프롬프트를 검증하기 전에 검열 또는 격리할 수 있습니다.
원자재 및 “원천 수정”은 귀하의 접근 방식의 핵심입니다. 자동 수정 대 인간의 개입에 대한 귀하의 철학은 무엇이며, 안전성 경계를 어디에 두십니까?
몇 년 전부터 데이터 발견 및 분류는 반드시 필요한데, 실제로 이야기의 절반만 제공한다는 것을 깨달았습니다. 데이터 위험을 찾는 것은 첫 번째 단계이지만, 그 위험을 해결하고 수정하는 것이 실제 목표입니다. 우리의 고객은 일반적으로 Teleskope의 결과를 데이터 카탈로그에서 평가한 다음 인간의 개입과 함께 수정을 시작한 다음 완전히 자동화된 수정으로 이동합니다. 일부 조치는 팀이 완전히 자동화하는 것을 결코 100% 편안하게 느끼지 않을 것이라는 것을 우리는 잘 알고 있습니다. 예를 들어, 생산 데이터베이스에서 데이터를 삭제하는 것은 매우 문제가 될 수 있습니다. 그러나 많은 경우에 고객은 권한을 취소하는 것, 데이터를 이동하는 것, 보관 또는 보존 정책을 시행하는 것과 같은 것에 대해 완전한 자동화를 채택하는 것을 보게 됩니다.
많은 DSPM/DLP 도구가 실시간 보호에 어려움을 겪습니다. “실시간”이 표준이 되도록 하기 위해 무엇이 건축적으로 변경되어야 했으며, 기업은 생산 환경에서 어떤 지연 및 처리량을 기대할 수 있습니까?
실시간 문제를 해결하기 위해, 작업을 핵심 구성 요소로 분해하는 것이 중요했습니다. 다양한 상황은 서로 다른 유형의 지연을 필요로 하지만, 목표는 항상 가능한 한 가장 빠른 방법으로 가장 정확한 통찰력을 제공하는 것입니다. 이는 다양한 처리량 요구 사항에 따라 저지연 시스템을 병렬화할 수 있는 유연한 아키텍처를 제공하는 것을 의미합니다. 기업이 Teleskope를 실행 중인 경우, 데이터는 실제로 그들의 인프라에서 분류 및 보호되므로 지연 및 아웃바운드 데이터 흐름이 줄어듭니다. 이러한 사실은 실제로 고위험 시나리오에서 수정에 대한 하위 초 시간 프레임에서 제공할 수 있도록 합니다.
개인 정보 및 규정 준수: 지속적인 모니터링 및 프레임워크/규정 자동 매핑을 주장합니다. 법률이 발전함에 따라 매핑을 최신 상태로 유지하는 방법은 무엇이며, 지역 또는 비즈니스 단위에 대한 제어는 얼마나 사용자 지정할 수 있습니까?
솔직히, 우리의 초점은 실제로 체크박스를 표시하는 것에서 벗어나 고객이真正로 관심을 가진 것을 깊이 이해하는 쪽으로 이동했습니다. 경우에 따라, 그들은 새로운 규정에 100% 매핑하고 싶을 수 있으며, 우리는 이러한 변경 사항을 지속적으로 모니터링하고 제품에 통합하고 있습니다. 그러나 대부분의 회사는 이러한 법률을 완전히 준수하는 것에서 너무 멀리 떨어져 있으므로, 우리는 그들이 있는 곳에서 만날 수 있고, 점 A에서 점 B로, 점 C로 이동하는 것을 보장할 수 있어야 합니다. 우리는 이를 통해 고객에게 의미하는 규정 준수를 이해하고, 제품을 고객의 특정 위험 프로파일 및 요구 사항에 따라 형성할 수 있습니다.
GenAI 채택: 고객은 개발자 속도를 저하하지 않고 “안전한 입력” 및 “안전한 출력”을 생성하기 위해 Teleskope를 어떻게 사용합니까? 권장하는 패턴이 있습니까?
고객은 훈련 및 추론 파이프라인에 Teleskope의 Redact API를 통합하여 민감한 데이터가 생성된 AI 모델로 흐르지 않도록 합니다. 검열 과정은 개발자에게서 추상화되어 개발 속도를 유지하기 위해 추론 전에 수행되며, 이후에 데이터를 재수화합니다.
앞으로, 귀하는 종단 간 “에이전트” 데이터 보안 플랫폼 및 자율 수정에 대해 논의했습니다. 산업이 완전히 자율적인 데이터 보호에 준비가 된 것을 나타내는 중요한 里程碑은 무엇입니까?
우리는 산업이 준비되어 있음을 알고 있습니다. 다른 사이버 보안 영역은 이미 SOC와 같은 에이전트 AI로 보안 팀의 용량을 확장하는 방향으로 완전히 전환되었습니다. 자율적인 데이터 보호로의 이동을 주도하려는 고객의 대기열이 있습니다. 따라서 많은 회사가 단일 티켓을 해결하기 위해 수동으로 트라이어지, 조사, 결정, 실행해야 하는 고통을 느끼고 있음을 우리는 알고 있습니다. 우리는 이곳이 시장에서 진행 중인 곳임을 확신합니다. 우리는 이 변화를 주도하기 위해 결심했습니다.
멋진 인터뷰 감사합니다. 더 많은 정보를 배우고 싶은 독자는 Teleskope를 방문해야 합니다.












