Connect with us

Єлізабет Наммур, CEO та засновник Teleskope – Серія інтерв’ю

Інтерв’ю

Єлізабет Наммур, CEO та засновник Teleskope – Серія інтерв’ю

mm

Єлізабет Наммур, CEO і засновник Teleskope, – інженер з безпеки, який став засновником, чиїй кар’єра охоплює галузі безпеки даних, розробки програмного забезпечення та інновацій у деяких з найбільших технологічних організацій світу. Під час роботи старшим інженером-програмістом, який зосереджувався на безпеці даних у компанії Airbnb, вона зіткнулася з оперативною проблемою розуміння та контролю величезних, швидко зростаючих даних, розкиданих по десятках систем. Цей досвід, у поєднанні з попередніми технічними та стратегічними ролями в Amazon і Booz Allen Hamilton, сформував її погляд на те, як сучасні організації борються з управлінням конфіденційними даними у великих масштабах, і врешті-решт привів її до створення компанії, яка займається цим пробілом.

Teleskope – це сучасна платформа безпеки даних, розроблена для того, щоб допомогти організаціям безперервно розуміти, де розташовані їхні дані, як вони використовуються та які ризики вони створюють, коли середовища стають все більш складними. Розроблена з урахуванням розробників і команд безпеки, платформа підкреслює точну видимість даних, автоматичне виправлення та керування політикою в хмарі, SaaS та гібридних середовищах. Переходячи за межі статичних аудитів і ручних процесів, Teleskope спрямована на надання організаціям практичної основи для управління розсіюванням даних, одночасно забезпечуючи відповідальне впровадження штучного інтелекту.

Ви заснували Teleskope після створення внутрішніх інструментів безпеки даних у Airbnb для каталогізації та класифікації даних у величезних масштабах. Який момент переконав вас, що це повинно бути компанією, а не внутрішнім проєктом, і як ці ранні уроки сформували вашу продукційну тезу?

Коли я закінчила будівництво цього продукту в AirBnB, у мене була можливість написати статтю на блозі AirBnB під назвою “Автоматизація захисту даних у великих масштабах”. Я ніколи не очікувала, що щось вийде з цього, але спільнота безпеки відповіла дуже позитивно, і я почала отримувати звернення від фахівців з усього світу. Я точно мала цей момент усвідомлення того, що так багато людей поділяють одні й ті ж виклики, з якими я зіткнулася, і що цей продукт був тим, чого справді просила ринок. Я багато чому навчилася від відгуку колег на початку, і навіть Teleskope v1.0 був значно кращим, ніж те, що я спочатку побудувала в AirBnB. Сьогодні наш продукт більший і більш впливовий, ніж я могла коли-небудь уявити раніше.

Ваш багатомодельний класифікаційний трубопровід поєднує традиційний ML, моделі, специфічні для формату, та валідацию GenAI. Чи можете ви роз’яснити логіку прийняття рішень та те, як ви зменшуєте помилкові позитивні/негативні результати у великих масштабах?

Я б kesinlikle рекомендувала прочитати наш блог, який я написала разом з нашим головою відділу даних Іваном про класифікацію даних. Спочатку я хочу сказати, що це мистецтво, так само, як і наука. Там є величезна кількість нюансів – кожен раз, коли ви знаходитьесь конфіденційну дані, контекст буде унікальним. Тим часом масштаб даних зробив цю проблему нескінченно більш складною, оскільки сканування петабайт продукційних даних вимагає багато обчислювальних ресурсів і часу. Основна причина того, що це продовжує вважатися в основному нерозв’язаною проблемою.

Де мистецтво вступає в дію, так це у вирішенні того, як збалансувати всі компроміси – швидкість, затримку, точність, вартість та ширину (у сховищах даних, форматах файлів, мовах тощо). Ми завжди вважали, що відповідь повинна бути творчою і повинна бути багатогранною. Це причина, з якої ми прийняли такий підхід, поєднуючи багато доступних методів класифікації для того, щоб мати динамічний і нюансирований підхід, який, щоб підсумувати, побудований на використанні найбільш легкого методу, не жертвуючи суттєво точністю. Цей динамічний підхід дозволяє нам сканувати дані в 10-20 разів швидше, ніж інструменти, які залежать від одноразових LLM, одночасно забезпечуючи значно більш точні результати, ніж REGEX або традиційні контекстно-залежні підходи.

Ви недавно представили Prism, зосереджуючись на бізнес-рівневому розумінні даних та GenAI-підтримуваному виправленні. Які нові випадки використання це розблокує порівняно з елементним виявленням PII, і як ви охороняєтеся від галюцинації у виправлювальних діях?

Коли я вперше вирішила проблему класифікації та захисту даних, моє внимание було зосереджено на зменшенні фактичних помилкових позитивних результатів. Наприклад, як ми можемо гарантувати, що щонайменше 95% часу, коли ми помічаємо щось як номер соціального страхування, воно справді виявиться номером соціального страхування. Кілька років тому навіть 80% точності по різних типам даних було б покращенням.

Але, працюючи в тісній співпраці з нашими клієнтами за останні рік, стало зрозуміло, що “шум”, який команди завантажені, не викликаний лише неточними класифікаціями даних (традиційні “помилкові позитивні результати”). Шум часто так само багато про те, що команди завантажені нерелевантними сповіщеннями, як і про отримання помилкових сповіщень. Що робить Prism, так це розблокування нашої здатності враховувати значно більше контексту – не тільки “що таке цей шматок даних” або “хто отримує доступ до цього файлу”, але також “що, по суті, є цим файлом”. Об’єднавши це з інформацією, яку ми можемо отримати про те, що дійсно турбує бізнес, ми можемо надати продукт, який відповідає різним визначенням “чутливих” даних кожної компанії.

Захоплення цього рівня нюансированого контексту є справжнім проривом. Зберігання сотень номерів соціального страхування в документі Google Doc у вашому особистому дискові, наприклад, може бути серйозним ризиком і порушенням вашої політики управління даними. Але наявність папки в безпечному дискові HR, повному податкових декларацій ваших працівників? Це очікувана поведінка. Команди безпеки хочуть бути сповіщені про перше, але отримання сповіщення про кожну податкову декларацію працівника, збережену правильно, просто шум. Розуміння того, де та в якому контексті розташовані конфіденційні дані, вимагає більше, ніж просто модель класифікації сутностей.

Ми працюємо з транснаціональною хімічною компанією Chevron Philips Chemicals. Ця компанія ніколи не купуватиме інструменти конфіденційності або стандартний DSPM, оскільки вони не вважають ризик споживчих даних пріоритетом. Що вони турбують, так це інтелектуальна власність у вигляді пропрієтарних хімічних формул. Будучи能够 розбити суть документа на список кластеризованих міток, ми можемо не тільки виявити унікальні конфіденційні елементи, але також знайти випадки цих даних, які знаходяться в “неправильних” місцях. Об’єднавши цей контекст з нашим автоматичним виправленням, ми можемо потім вжити заходів для архівування, видалення, редагування або переміщення цих файлів у їхнє належне місце. Ніхто на ринку безпеки даних не робить такої роботи.

Teleskope підкреслює безперервне відкриття у چندхмарних, локальних та третинних системах, включаючи тіньові дані. Що таке “повне карти”? І як швидко ви можете виявити невідомі сховища у зеленому полі?

“Повне” – це хитрий термін тут – насправді це планка, яка постійно рухається, навіть щодня. Такою є складність управління розсіюванням даних. Наша мета завжди була такою, щоб Teleskope існувала всюди, де розташовані дані наших клієнтів. Ми в кінцевому підсумку продукт, заснований на інтеграції – ми побудували десятки власних конекторів даних, щоб能够 перебувати, сканувати та класифікувати дані у широкому діапазоні інструментів SaaS, сховищ даних у хмарі та локальних систем. Більшість клієнтів починають з декількох конекторів, які вони вважають найбільш ризикованими або де вони мають найменше видимості, тому насправді ми рідко знаходимося всюди, де розташовані дані компанії. Однак усередині кожного джерела даних ми постійно перебуваємо в їхньому середовищі, щоб виявити нові облікові записи, таблиці, нові блоби, файли тощо. Тому, де б ми не були, ми знаходимо дані, нові та старі, майже в режимі реального часу.

Для безпеки та управління штучним інтелектом: як ви відстежуєте походження між наборами даних для навчання, моделями, запитами та виходами для аудитабельності?

Ми дійсно маємо три основних способи підтримки безпеки та управління штучним інтелектом. По-перше, це наша здатність застосовувати нашу технологію класифікації та виправлення до даних у русі через наші API. Коли компанії створюють або готують набори даних для навчання своїх власних моделей, їм потрібно забезпечити, щоб ці дані були вільні від конфіденційних даних або інших конфіденційних даних. Тому ми підключаємося прямо до потоку даних і можемо очистити набори даних, коли вони переміщуються або копіюються у набір для навчання, забезпечуючи, щоб ці моделі ніколи не були під загрозою виведення конфіденційних даних.

Читачі, які бажають дізнатися більше, повинні відвідати Teleskope.

Антуан є видним лідером і засновником Unite.AI, який рухає невпинною пристрастю до формування та просування майбутнього штучного інтелекту та робототехніки. Як серійний підприємець, він вважає, що штучний інтелект буде таким же революційним для суспільства, як і електрика, і часто захоплюється потенціалом деструктивних технологій та AGI.

Як футуролог, він присвячений дослідженню того, як ці інновації сформують наш світ. Крім того, він є засновником Securities.io, платформи, орієнтованої на інвестування в передові технології, які переінакшують майбутнє та змінюють цілі сектори.