인터뷰
Patricia Thaine, Private AI의 CEO – 인터뷰 시리즈

Patricia Thaine은 Private AI의 공동 설립자이자 CEO이며, 토론토 대학교의 컴퓨터 과학 박사 과정 학생이고, 프라이버시 보존 자연어 처리에 대한 연구를 수행하는 벡터 연구소의 대학원 연수생입니다. 특히 적용 암호학에 중점을 둔 연구를 진행하고 있습니다. 또한 언어 해독을 위한 계산 방법에 대한 연구도 진행하고 있습니다.
Patricia는 NSERC 대학원 장학금, RBC 대학원 펠로우십, Beatrice “Trixie” Worsley 컴퓨터 과학 대학원 장학금, 온타리오 대학원 장학금의 수령자입니다. 그녀는 McGill 언어 개발 연구소, 토론토 대학교의 계산 언어학 연구소, 토론토 대학교 언어학부, 공중 보건 기관에서 8년간의 연구 및 소프트웨어 개발 경험을 가지고 있습니다.
컴퓨터 과학에 처음 관심을 가지게 된 것은 무엇입니까?
문제를 해결하고 창의적으로 일할 수 있는 능력입니다. 그것은 한 종류의 공예와 같습니다. 제품 아이디어를 실제로 구현해 볼 수 있고, 목수처럼 가구를 만들 때처럼 볼 수 있습니다. 한 번 누군가가 말한 대로: 프로그래밍은 궁극의 창의적 도구입니다. 구축된 제품이 전 세계 어디에서나 사용될 수 있다는 사실은 매우 매력적입니다.
Private AI의 기원과 프라이버시를 보존하는 도구가 쉽게 통합될 수 없는 사실을 관찰한 내용을 논의해 주시겠습니까?
말과 글을 통해 우리가 생산하고 전송하는 가장 민감한 정보 중 일부가 있습니다. 우리는 NLP 제품을 구축할 때 고려해야 할 프라이버시 계층이 시장에서 존재하지 않는다는 것을 알게 되었습니다. 프라이버시 솔루션을 사용하려면 회사들은 사용자의 데이터를 제3자에게 전송하거나, 사용자 프라이버시를 제대로 보호하지 못하는 하위 오픈 소스 솔루션을 사용하거나, 프라이버시에 대한 전문 지식이 거의 없는 상태에서 자체 솔루션을 구축해야 했습니다. 따라서 우리는 개발자와 AI 팀이 프라이버시 강화 기술의 출력을 쉽게 사용할 수 있는 최상의 제품을 만들기 위해 집중하기로 결정했습니다.
프라이버시 보존 AI가 중요한 이유는 무엇입니까?
생산되는 정보의 약 80%는 비정형화되어 있으며, AI는 이러한 모든 데이터를 이해하는 유일한 방법입니다. 이것은 노인 인구의 낙상 감지와 같은 좋은 용도로 사용될 수 있거나, 소수자 집단의 프로파일링 및 추적과 같은 나쁜 용도로 사용될 수 있습니다. 소프트웨어에 프라이버시를 구축하면 AI가 유해한 방식으로 사용되는 것을 더 어렵게 만듭니다.
프라이버시가 경쟁 우위를 어떻게 제공하는지 설명해 주시겠습니까?
여러 가지 이유가 있지만, 여기 몇 가지가 있습니다:
- 더 많은 사용자가 프라이버시를關心하며, 소비자가 더 교육を受음에 따라 이러한關心은 증가하고 있습니다: 70%의 소비자는 데이터 프라이버시에關心을 가지고 있습니다.
- 데이터 보호 및 데이터 프라이버시 프로토콜 및 기술이 제대로 구축되어 있는 경우 다른 비즈니스와 거래하기가 훨씬 더 쉽습니다.
- 제품을 프라이버시 보존 방식으로 구축하면 서비스의 취약점이 어디에 있는지 더 잘 추적할 수 있으며, 특히 데이터 최소화를 통해 필요하지 않은 데이터를 제거하여 사이버 공격이 발생했을 때 문제가 되는 데이터를 제거할 수 있습니다.
트레이닝 데이터 프라이버시의 중요성과 역공학에 취약한 이유를 논의해 주시겠습니까?
이것은 훌륭한 질문이며, 이에 대한 교육이 훨씬 더 필요합니다. 간단히 말해서, 기계 학습 모델은 정보를 기억합니다. 모델이 더 크면 더 많은 코너 케이스를 기억합니다. 이것은 모델이 훈련에 사용된 정보를 생산에서 내보낼 수 있음을 의미합니다. 이것은 여러 연구 논문에서 입증되었습니다. 예를 들어, 신경망에서 의도하지 않은 기억의 평가 및 테스트와 대형 언어 모델에서 훈련 데이터 추출입니다.
또한 워드 임베딩에서 개인 정보를 추출할 수 있다는 것도 밝혀졌으며, 이 문제가 실제로 존재한다는 의구심이 있는 사람들을 위해, 한국의 사랑 봇이 사용자 세부 정보를 다른 사용자와의 채팅에서 작성하는 스캔들 이 있습니다.
연합 학습과 사용자 프라이버시에 대한您的 견해는 무엇입니까?
연합 학습은 사용 사례가 허용하는 경우에 훌륭한 단계입니다. 그러나 사용자의 기기에서 클라우드로 전송되는 가중치 업데이트에서 사용자의 입력 정보를 추출하는 것이 여전히 가능하므로, 연합 학습을 다른 프라이버시 보존 기술(차이적 프라이버시 및 동형 암호/보안 다당計算)과 결합하는 것이 중요합니다. 각 프라이버시 보존 기술은 사용 사례에 따라 선택되어야 하며, 모든 문제를 해결하는 해머로 사용할 수 없습니다. 우리는 여기에 결정 트리를 다룹니다. 큰 이점 중 하나는 원시 데이터를 절대로 기기 외부로 전송하지 않는다는 것입니다. 큰 단점 중 하나는 시스템을 디버깅하거나 제대로 훈련되고 있는지 확인하기 위해 데이터가 필요한 경우, 데이터를 얻는 것이 훨씬 더 어려워집니다. 연합 학습은 훌륭한 시작이며, 연구와 산업이 모두 해결하려고 노력하는 많은 미해결 문제가 있습니다.
Private AI는 몇 줄의 코드로 프라이버시 분석을 통합하여 프라이버시를 보장하는 방법은 무엇입니까?
우리의 기술은 REST API로 실행되며, 사용자가 텍스트를 전송하여 수정, 비식별 또는 유사한 데이터로 대체/증강할 수 있습니다. 일부 고객은 PCI 규정 준수를 위해 수정해야 하는 콜 전송을 전송하는 반면, 다른 고객은 채팅을 전송하여 정보를 추출하여 챗봇, 감성 분석기 또는 기타 NLP 모델을 훈련시킵니다. 사용자는 또한 유지해야 하는 엔티티 또는 메타데이터로 사용하여 개인 데이터가 저장되는 위치를 추적하는 데 사용할 수 있습니다. 우리는 실제로 어색한 데이터에서 개인 정보를 감지하고 대체하는 정확한 시스템을 훈련하는 어려움을 없애줍니다.
IoT 기기의 프라이버시가 현재 문제인 이유와 이를 해결하기 위한您的 견해는 무엇입니까?
궁극적으로, 프라이버시 문제를 해결하는 최선의 방법은 매우 사용 사례에 의존하며, IoT 기기는 다르지 않습니다. 일부 사용 사례는 에지 배포, 에지 추론 및 프라이버시 보존 연합 학습(예: 스마트 시티의 군중 감지)에 의존할 수 있지만, 다른 사용 사례는 데이터 집계 및匿名화(예: 에너지 사용 정보)에 의존할 수 있습니다. 그러나 IoT 기기는 프라이버시와 보안이 함께 작동해야 하는 대표적인 예입니다. 이러한 기기는 사이버 공격에 대해 악명高い 취약점이 있습니다. 따라서 핵심 기기 취약점을 해결하지 않고 프라이버시 보존 기술만으로는 할 수 있는 일이 제한적입니다. 반면에 사용자 프라이버리를 강화하는 방법을 생각하지 않고 집안에서 수집된 정보가 알 수 없는 당사자에게 공유될 수 있으며, 정보의 보안을 보장하기가 매우 어려워집니다. 우리는 두 가지 방면에서 개선해야 합니다. 유럽 위원회에서 작성 중인 IoT 기기 보안에 대한 초안 법안은 기기 제조업체가 소비자의 보안 및 프라이버시에 대한 책임을 진지하게 받아들이도록 만들 수 있습니다.
Private AI에 대해 더 공유하고 싶은 내용이 있습니까?
우리는 프라이버시, 자연어, 음성 언어, 이미지 처리, 저자원 환경에서 기계 학습 모델 배포에 대한 전문 지식을 보유한 팀입니다. M12, 마이크로소프트의 벤처 펀드에 의해 지원됩니다.
우리가 만드는 제품은 매우 정확한 것만이 아니라, 계산적으로 효율적이므로 월말에巨額의 클라우드 비용을 지불하지 않아도 됩니다. 또한, 고객의 데이터는 절대로 우리에게 전송되지 않으며, 모든 처리가 고객의 환경에서 수행됩니다.
멋진 인터뷰에 감사드립니다. 더 많은 정보를 보려면 Private AI를 방문하세요.












