Connect with us

Честер Лёнг, сооснователь и глава платформы ИИ в OPAQUE – Интервью

Интервью

Честер Лёнг, сооснователь и глава платформы ИИ в OPAQUE – Интервью

mm

Честер Лёнг является сооснователем и главой платформы архитектуры в OPAQUE, стартапом серии А, который строит конфиденциальную платформу данных и ИИ, позволяющую командам расширять корпоративные конвейеры данных с конфиденциальным слоем, обеспечивая более быстрые идеи с меньшими усилиями и верифицированной конфиденциальностью и контролем.

Ранее Честер был аспирантом компьютерных наук в Университете Калифорнии в Беркли, где он опубликовал рецензируемые статьи на лучших конференциях и также служил ведущим разработчиком открытого проекта MC2 для безопасного сотрудничества и машинного обучения.

Вы основали Opaque после работы в RISELab Университета Калифорнии в Беркли, где ваша работа объединила ИИ и безопасные системы. Какой конкретный пробел в корпоративной инфраструктуре данных вы увидели, что привело к созданию OPAQUE, и как ваш академический опыт повлиял на направление компании?

В то время было огромное внимание, как в академии, так и в промышленности, к использованию машинного обучения для конкретных случаев использования. В лаборатории мы были чрезвычайно удачливы, имея крупных корпоративных спонсоров, которые помогли нам исследователям сформировать нашу работу, чтобы решить более насущные проблемы, с которыми они сталкивались в своих организациях. Наша группа, в частности, имела уникальную возможность работать в тесном сотрудничестве с технологическими и банковскими, финансовыми услугами и страхованием (BFSI) компаниями, сотрудничая для решения сложных проблем конфиденциальности вокруг использования чувствительных, но ценных данных для машинного обучения. Как и все области ИИ, машинное обучение полагается на большие объемы высококачественных данных, чтобы производить ценные и надежные идеи.

Мы столкнулись с одним и тем же шаблоном снова и снова, сотрудничая с командами из таких компаний, как Amazon, Scotiabank и Ant Group (ранее Ant Financial): их проекты, основанные на машинном обучении, застревали до того, как достигали производства из-за проблем с использованием чувствительных, но критических данных для этих случаев использования. Другими словами, эти команды не могли использовать ИИ в проектах, которые они знали, что могут генерировать ценность для компании, не из-за технической проблемы с ИИ, а потому что они не могли получить доступ к правильным данным.

В Opaque мы решаем одну и ту же проблему. Помогая командам получить доступ к правильным данным, чтобы они могли разблокировать или продать свои возможности ИИ. Единственное изменение с наших исследовательских дней заключается в том, что проблема стала более срочной: мы постоянно видим, что принятие и интеграция ИИ становятся стратегической императивом на уровне всей компании, что продолжает быть ограничено доступом к правильным данным.

В ландшафте, где предприятия инвестируют大量 средств в модели рассуждений и агентный ИИ, почему вы считаете, что безопасные конвейеры данных более важны, чем когда-либо?

Безопасные конвейеры данных являются основой, на которой предприятия строят модели рассуждений и агентный ИИ. Все, от обучения этих моделей рассуждений до развертывания агентного ИИ, включает чувствительные данные и полагается на безопасные конвейеры данных.

Например, мы сейчас видим растущие инвестиции в генерацию высококачественных данных для обучения этих моделей. Некоторые отчеты даже предсказывают, что инвестиции в вычисления для генерации высококачественных данных скоро будут больше, чем инвестиции в обучение самих моделей. Конечно, генерация данных является многоступенчатым процессом, управляемым конвейерами, которые производят наиболее ценный интеллектуальный капитал предприятия: высококачественные доменные данные, которые могут обучать модели, генерирующие огромную ценность вниз по потоку. Инвестиции в генерацию этих данных огромны, и сгенерированные данные, учитывая их происхождение, фактически отличают одно предприятие от его конкурентов, служа его рвом. Предприятие должно сделать все, чтобы сохранить этот конвейер в безопасности.

Платформа конфиденциального вычисления OPAQUE позволяет выполнять анализ на зашифрованных данных. Каковы основные технические проблемы в том, чтобы сделать это как масштабируемым, так и удобным для разработчиков в корпоративной среде?

Наша платформа конфиденциального ИИ не только позволяет выполнять анализ, машинное обучение и генеративный ИИ на зашифрованных данных, но также предоставляет верифицируемое доказательство того, что ваши данные были использованы только в том виде, который вы ожидаете и разрешаете.

Основные проблемы, связанные с масштабируемостью, разработкой и управлением, заключаются в том, чтобы сделать оркестровку рабочей нагрузки безопасной и верифицируемой в масштабе. В частности, многие предприятия сегодня используют управляемые облачные услуги, когда им нужно масштабироваться. Это может быть как экономически эффективно, так и удобно. Однако некоторая часть программного обеспечения, управляемого облачным провайдером, является внутренне управляемой облачным провайдером. Итак, проблема заключается в том, как организация может обеспечить безопасность и верифицируемость программного обеспечения, которое не находится под ее контролем? Если организация возьмет под контроль все программное обеспечение, что она должна отказаться от использования управляемой услуги, и что она потеряет, сделав это?

Вы сказали, что безопасная архитектура может обеспечить долгосрочное конкурентное преимущество. Можете ли вы подробнее рассказать о том, как этот принцип реализуется на практике для команд ИИ?

Есть два угла, с которых можно посмотреть на это: продукт и инженерия.

С точки зрения продукта, все понимают, что их данные являются радиоактивными, их рвом или обоими. Предприятия становятся все более зрелыми в оценке решений по конфиденциальности данных, безопасности и суверенитету. Следовательно, любая команда, которая строит любой продукт, который обрабатывает корпоративные данные, должна предоставить гарантии того, что обработанные данные видны и используются только уполномоченными сторонами и сущностями. Безопасная архитектура обеспечивает уверенность в том, что конфиденциальность данных, безопасность и суверенитет были первоклассными соображениями при проектировании продукта и позволяют продукту явно предоставить эти гарантии.

С точки зрения инженерии безопасная архитектура более расширяема и будущепroof. Юридические, рисковые и соответствующие команды становятся все более строгими в ответ на новые риски и регулирование. Таким образом, инженерные организации должны хотеть строить безопасную систему ИИ с самого начала, чтобы они не должны были перестраивать и/или исправлять свою систему, когда они осознают, что их существующая система недостаточно безопасна и рискоустойчива. Перестройка и исправление стоит месяцев, если не лет, ценного инженерного потенциала.

Когда автономные системы ИИ эволюционируют, как организации должны переосмыслить роль данных – за пределами ресурса – как оборонительный ров?

Есть растущий консенсус в отрасли, что данные могут скоро стать единственным рвом, который имеет организация. Мы видим исследования и инженерный талант, и блестящие технологии и продукты, которые они строят, переходят от одной организации к другой. В результате многие организации могут предложить один и те же продукт, поддержанный одной и той же технологией.

То, что не может легко перейти от одной организации к другой, однако, является данными организации – если они не утечены. Более того, именно эти данные могут сделать продукт более привлекательным, чем его конкуренты – более персонализированным, адаптированным и доменно-специфичным. Организации должны сделать все, чтобы сохранить свои данные, чтобы они могли использовать свои данные как конкурентное преимущество.

Что такое устойчивый конвейер ИИ на практике, и как он помогает компаниям избежать скрытых затрат или рисков, когда они масштабируют свои развертывания ИИ?

Устойчивый конвейер ИИ – это тот, который надежен, отказоустойчив, но, прежде всего, верифицируемо безопасен от конца до конца. До обработки компании должны верифицировать как данные, которые поступают в конвейер, так и сам конвейер, чтобы обеспечить, что нет возможности неправильного использования данных. Во время обработки конвейер ИИ должен быть защищен от篡改, чтобы никто не мог украсть какие-либо данные, которые он обрабатывает, или исказить идеи, которые он предоставляет. После обработки конвейер ИИ должен быть верифицируемо аудитором, чтобы команда могла наблюдать и объяснять принятие решений и траекторию конвейера ИИ и чтобы команда могла увидеть, что пошло не так, когда что-то идет не так.

Это крайне важно учитывать, как не安全ный, ошибочный конвейер ИИ может привести к утечке данных организации или проприетарной модели и какие последствия это имеет для факторов дифференциации компании или ее репутации. Что более важно, однако, заключается в том, что, когда компании масштабируют развертывание ИИ в более критические и влиятельные случаи использования, риск не безопасного, необъяснимого конвейера ИИ растет экспоненциально. В мире, где решения о кредитовании и приеме на работу уже усиливаются ИИ, влияя на все, от личных финансов до карьеры, намеренная или непреднамеренная ошибка в конвейере ИИ может иметь драматическое влияние на жизнь человека.

Многие предприятия фокусируются на точности модели или задержке. Что они упускают из виду, когда речь идет о целостности данных и долгосрочном операционном риске?

Хотя многие предприятия фокусируются на модели или технологии ИИ, я давно считаю, что данные являются фундаментальным препятствием для развертывания ценного ИИ.

Иметь модель, которая быстро генерирует точный ответ на тему, которая не интересует конечного пользователя, не генерирует никакой ценности. Чтобы построить уникально привлекательный продукт, предприятия должны обеспечить, чтобы их модели и продукты, которые они поддерживают, были обучены высококачественными, релевантными данными. Проблемы с гигиеной данных, которые возникают из-за отсутствия высококачественных входных данных, могут не проявиться до месяцев позже.

Во-вторых, мы обнаружили, что предприятия обычно не имеют хорошей истории для обнаружения дрейфа данных, загрязнения или утечки, что ставит под угрозу целостность модели. Это тесно связано с моей первой точкой, и, хотя это более реактивное решение, оно делает оценки и наблюдаемость еще более важными.

OPAQUE интегрируется в существующие облачные стэки. Что вы узнали о балансировании легкости принятия с сильными гарантиями безопасности в корпоративных развертываниях?

Мы потратили почти десятилетие, начиная с наших исследовательских дней, на решение этой проблемы. Верифицируемая безопасность систем ИИ, особенно в корпоративной среде, является очень сложной проблемой. Это требует систем, безопасности, криптографии и экспертизы ИИ. В результате большинство систем, с которыми мы столкнулись, не были фундаментально безопасными – потому что безопасность так трудна для реализации.

В Opaque мы построили продукт, который является лучшим из обоих миров – внутренне и верифицируемо безопасным с самого начала, но легко развертываемым через облачные рынки и достаточно гибким, чтобы интегрироваться в новые и существующие приложения ИИ.

Какие виды угроз или уязвимостей возникают вокруг конвейеров ИИ и обмена данными, которые лидеры предприятий могут еще не полностью оценить?

То, что мы видим в этой агентной золотой лихорадке, является слепым срочностью развертывания агентов ИИ, которые взаимодействуют с различными системами учета. Хотя эти агенты могут предоставить ценность, они также представляют огромные риски, потому что они касаются так многих систем с ценными данными. Агенты являются внутренне неопределенными, и мы видели бесчисленные случаи, когда они уходят и делают что-то, чего мы не ожидаем. В мире, где ваши данные являются вашим единственным рвом, лидеры предприятий всегда должны задавать вопрос, могут ли они доверять и полагаться на агентов ИИ, которые имеют доступ ко всем их данным, чтобы они не неправильно использовали их случайно или намеренно.

Когда регулирование ИИ принимает форму во всем мире, как вы видите эволюцию взаимодействия между безопасной инфраструктурой данных, подотчетностью модели и соответствием в течение следующих нескольких лет?

Верифицируемо безопасная инфраструктура данных обеспечивает подотчетность модели и агента. Конкретно, без верифицируемого доказательства принятия решений или использования инструментов агента или модели мы не можем быть уверены в чем-либо, поэтому мы не сможем отслеживать подотчетность. Когда ИИ становится все более интегрированным в нашу повседневную жизнь, чтобы чувствовать, что мы все еще контролируем, мы хотим больше объяснимости и наблюдаемости в ИИ. Однако, когда ИИ может работать на машинной скорости, а мы не можем, злонамеренный ИИ может легко обмануть нас, создавая ложную историю. Нам нужна верифицируемость, чтобы привлечь ИИ к ответственности.

Для меня нормативное соответствие очень реактивно. Разработка и принятие регулирования движется гораздо медленнее, чем технологические инновации. Это будет все более верно, когда ИИ поможет нам увеличить темп инноваций. Хотя соответствие в конечном итоге заставит отстающих принять безопасную инфраструктуру данных, ранние принимающие и раннее большинство осознают, что это крайне важно для безопасности ИИ, и будут принимать это гораздо раньше, чем соответствие сделает это обязательным. Они понимают, что подотчетность агента, обеспеченная безопасной инфраструктурой данных, является крайне важной для принятия своих собственных продуктов, работающих на ИИ.

Спасибо за отличное интервью, читатели, которые хотят узнать больше, должны посетить OPAQUE

Антуан - видный лидер и сооснователь Unite.AI, движимый непоколебимой страстью к формированию и продвижению будущего ИИ и робототехники. Как серийный предприниматель, он считает, что ИИ будет столь же разрушительным для общества, как электричество, и часто увлекается потенциалом разрушительных технологий и ИИ.

Как футуролог, он посвящен изучению того, как эти инновации изменят наш мир. Кроме того, он является основателем Securities.io, платформы, ориентированной на инвестиции в передовые технологии, которые переопределяют будущее и меняют целые сектора.