Интервью
Джеффри Лай, основатель и генеральный директор IrisGo – Интервью

Джеффри Лай, основатель и генеральный директор IrisGo, является предпринимателем в области ИИ и лидером продукта с глубокими корнями в интеллектуальных помощниках и языковых технологиях. До запуска IrisGo в 2025 году и работы в качестве основателя в резиденции AI Fund, Лай провел более 12 лет в Apple, где он помог построить и масштабировать Siri, в конечном итоге став менеджером языковой инженерии Siri. Его работа была сосредоточена на продвижении многоплатформенного разговорного ИИ, включая разработку китайской версии Siri. До Apple он занимал инженерные должности в Cisco Systems и проходил стажировку в группе интеллектуальной робототехники в исследовательском центре NASA Ames. За свою карьеру, охватывающую робототехнику, корпоративное программное обеспечение и потребительский ИИ, Лай последовательно фокусировался на том, чтобы сделать сложные технологии более доступными и полезными в повседневных рабочих процессах.
IrisGo разрабатывает операционную систему ИИ, предназначенную для нового поколения персональных компьютеров, оснащенных ИИ. Вместо работы как отдельного чат-бота, платформа построена для наблюдения за тем, как пользователи выполняют задачи в различных приложениях, изучения этих рабочих процессов и автоматизации их с помощью интеллектуального помощника на устройстве. Основной подход платформы заключается в том, чтобы позволить пользователям продемонстрировать задачу один раз, а затем преобразовать этот процесс в многоразовый рабочий процесс, помогая уменьшить повторяющуюся цифровую работу. Используя возможности обработки ИИ, встроенные в современные компьютеры ИИ, IrisGo стремится обеспечить более частную, отзывчивую и контекстно-зависимую автоматизацию, позиционируя себя на растущем рынке агентских систем ИИ, которые могут активно выполнять задачи от имени пользователей, а не просто предоставлять рекомендации.
После того, как вы помогли построить Siri в Apple, какие конкретные опыт убедили вас, что пришло время запустить IrisGo, и какая была ключевая проблема в взаимодействии между человеком и компьютером, которую вы чувствовали, что остается нерешенной?
Когда мы строили Siri, мы были невероятно сосредоточены на понимании естественного языка. Но Siri испытывала трудности с контекстом, что является сложной задачей, потому что способ, которым люди на самом деле работают и общаются, полон неявного контекста. Когда вы просите коллегу: “Можете ли вы отправить мне этот отчет?”, он знает, какой отчет. Он знает вашу общую историю, ваш текущий проект, о чем вы обсуждали. Siri не имела этого.
В течение многих лет ИИ был разработан для ответа на вас. Вы вводите что-то, получаете что-то обратно. Это модель взаимодействия, которую мы унаследовали от поисковых систем и чат-ботов. Но большая часть того, что люди на самом деле делают на компьютере, не является вопросом, это рабочий процесс. Составьте этот отчет. Перекрестно-проверьте эти электронные таблицы. Извлеките данные из трех разных приложений и отформатируйте их в документ. Такая работа не вписывается в запрос.
То, что убедило меня запустить IrisGo, было осознание того, что отрасль не строит для повседневного использования. Все строили более умные модели, лучшее понимание языка, более быстрые ответы. Но фундаментальный разрыв, где ИИ может фактически выполнить работу, а не просто ответить на запросы, все еще был там. Это проблема, которую мы поставили перед собой для решения.
Оглядываясь на годы работы над Siri, какие были самые большие уроки, которые вы выучили о ограничениях голосовых помощников, особенно когда речь идет о понимании контекста, намерения и поведения пользователя?
Самый большой урок, который я выучил, заключается в том, что контекст является всем. Люди редко общаются изолированными командами; их запросы формируются тем, над чем они работают и что они пытаются достичь. Ранние голосовые помощники были разработаны вокруг ответов на отдельные запросы, что работает хорошо для многих задач, но менее эффективно для непрерывной работы, охватывающей несколько приложений и рабочих процессов. Этот опыт научил меня, что понимание намерения требует понимания контекста, и эта идея стала одной из основополагающих идей за IrisGo.
Мы узнали, что намерение часто многослойно. Кто-то говорит одно и имеет в виду другое, и чтобы это правильно понять, требуется понимание человека, а не просто слов. Это понимание встроено в IrisGo с самого начала.
IrisGo часто описывается как операционная система ИИ, а не как помощник ИИ. В чем разница, и почему вы считаете, что отрасли нужен новый программный слой для эпохи компьютеров ИИ?
Помощник ИИ ждет вас. Вы открываете его, вводите что-то, он отвечает, и затем он закончен. Модель взаимодействия по сути та же, что и у поисковой системы, где пользователь делает запрос, а ИИ генерирует ответ.
IrisGo, которая является операционной системой ИИ, работает вместе со всем, что вы делаете, во всем вашей системе, все время. У нее есть доступ к вашим файлам, приложениям, браузеру, электронной почте. Она понимает, как вы работаете, потому что она наблюдала за вами с вашего разрешения. И, что самое главное, она может действовать, а не просто советовать.
Подумайте о том, что сделала Windows для персональных компьютеров. До нее вам нужно было быть технически подкованным, чтобы использовать компьютер. Windows создала универсальный, интуитивно понятный слой между людьми и программным обеспечением. Эра компьютеров ИИ нуждается в своем собственном варианте этого слоя, принимая сырую мощь моделей ИИ и делая ее действительно полезной для людей, выполняющих свою повседневную работу.
Это то, чем является IrisGo: интеллектуальным слоем компьютера ИИ. Когда вы поставляете компьютеры ИИ без этого слоя, у вас просто есть мощный чип, сидящий бездейственно. Что вам нужно, это программное обеспечение, которое знает, как использовать его для работы от имени человека, использующего его.
Одна из основных идей IrisGo заключается в том, что пользователи могут научить систему задаче через единственную демонстрацию. Почему вы считаете, что “наблюдать и учиться” является более естественной моделью, чем подсказка или ручное построение рабочих процессов?
То, что делает функцию “Наблюдать и учиться” такой мощной, заключается в том, что она основана на том, как мы на самом деле учим друг друга. Когда вы обучаете нового сотрудника, вы не пишете ему 40-шаговую подсказку. Вы показываете ему, как вы делаете что-то один раз, он наблюдает, он учится, и он берет это оттуда. Это интуитивно. Это естественно.
Проблема с подсказкой заключается в том, что она возлагает бремя на пользователя, чтобы точно сформулировать, что он хочет, в формате, который ИИ может понять. Для простых запросов это работает хорошо. Но что насчет сложных, многоэтапных рабочих процессов, включающих ваши конкретные файлы и ваш конкретный способ работы? Это может быстро разрушиться. Большинство людей не могут описать свои рабочие процессы с достаточной точностью, чтобы подсказать ИИ выполнить их правильно.
Показать легче, чем рассказать. Это не новое прозрение; это общее чувство. То, что делает “Наблюдать и учиться”, заключается в применении этой логики к автоматизации. Вы выполняете задачу один раз, так, как вы обычно бы делали. IrisGo учится шаблону. И с этого момента она берет на себя этот рабочий процесс за вас.
Многие агенты ИИ сегодня все еще требуют значительной настройки и надзора. Что отличает真正 автономного агента от чат-бота, который просто следует инструкциям?
Краткий ответ заключается в том, что真正 автономный агент имеет свой контекст, принимает свои собственные решения и продолжает работать, даже когда вы не наблюдаете.
Чат-бот реагирует по дизайну. Он живет и умирает от подсказки. Вы даете ему инструкцию, он выполняет, и затем он останавливается. Если что-то меняется, если шаг не удается, или если ему нужно адаптироваться, он теряется. Он спросит вас, что делать дальше.
Подлинно автономный агент имеет цель, а не просто инструкцию. У него есть контекст об окружающей среде, в которой он работает. Он может обрабатывать исключения. Он может решить, следует ли продолжать, повторить или поднять флаг для человеческого обзора. И, что важно, он может работать в фоновом режиме, пока вы работаете над другими вещами.
Большинство того, что продается как “агенты ИИ” сегодня, на самом деле являются сложными чат-ботами с дополнительными шагами. Разрыв между этими продуктами и настоящей автономией огромен. То, что делает IrisGo khácным, заключается в том, что она начинается с модели того, как вы работаете, изученной直接 из наблюдения за вами, и использует это для принятия правильных решений, а не просто следования инструкциям.
Вы говорили о важности постоянной памяти и локального контекста. Почему эти возможности являются необходимыми, если ИИ должен выйти за рамки ответов на вопросы и начать действовать от имени пользователя?
Представьте себе, что вы нанимаете помощника, который каждое утро не помнит, кто вы, над чем вы работаете или как вы предпочитаете делать вещи. Вы бы потратили половину дня на переобъяснение контекста, и вы стали бы чрезвычайно раздражены. Это по сути то, о чем просят большинство инструментов ИИ сегодня.
Постоянная память означает, что система знает вас. Она знает ваши проекты, ваши рабочие процессы, ваши предпочтения и то, как все это эволюционировало со временем. Вам не нужно переустанавливать контекст каждый сеанс. ИИ несет этот контекст вперед.
Локальный контекст столь же критичен, потому что ваша работа не живет в облаке. Она живет на вашем компьютере, в файлах, приложениях, электронных письмах, вкладках браузера. IrisGo работает на вашем устройстве, что означает, что она имеет доступ ко всей вашей рабочей среде и может работать от вашего имени во всем.
Эти две вещи вместе – память и локальный доступ – являются тем, что позволяет ИИ перестать быть инструментом, который вы используете, и начать быть системой, которая работает для вас. Мы видим, как большая часть технологической отрасли начинает признавать важность этого, включая крупные технологические компании, поэтому это четкое подтверждение нашего подхода.
Приватность остается одной из самых больших проблем, окружающих ИИ. Как вы балансируете необходимость персонализации и памяти с ожиданиями пользователей вокруг безопасности и владения данными?
Предположение, что приватность и персонализация находятся в напряжении, является первым, что нужно бросить вызов. Мы построили IrisGo так, чтобы персонализация могла происходить на устройстве, а не только в облаке.
Большинство обработки IrisGo происходит локально, на вашем компьютере. Ваши рабочие процессы, ваши файлы, ваш контекст все остаются с вами. Обработка в облаке происходит только тогда, когда вы явно авторизуете ее, и когда это происходит, она шифруется от конца до конца. Вы контролируете, что идет куда.
Эта модель делает IrisGo более мощной, потому что она имеет доступ к полному контексту вашей рабочей среды. И это означает, что пользователи не должны выбирать между полезным ИИ и безопасным.
Люди доверяют своим личным компьютерам конфиденциальную работу. Наша цель – сделать IrisGo достойным того же доверия. Это фундаментально для того, как продукт спроектирован.
IrisGo уже поставляется на компьютерах ИИ от Acer, с планами расширить до дополнительных производителей. Как важными, по вашему мнению, будут партнерства по распространению в определении того, какие платформы ИИ в конечном итоге достигнут широкого внедрения?
Распределение абсолютно критично для широкого внедрения. Просто посмотрите на историю конкуренции платформ в технологиях. Windows выиграла, потому что она была на практически каждом ПК. Android выиграла, потому что она была наиболее широко используемой операционной системой для мобильных устройств, которые не были iPhone. Компании, которые пытались выиграть через чистое качество продукта, без распределения, чтобы подтвердить это, в основном не преуспели.
Рынок компьютеров ИИ следует аналогичному шаблону. Когда IrisGo предустановлена на устройстве, она там, когда вы открываете коробку. Вам не нужно искать ее, скачивать ее или решать, дать ей шанс. Это огромное преимущество.
Мы уже находимся в 3 миллионах ноутбуков Acer, которые будут поставлены в этом году, и мы находимся в разговорах с дополнительными производителями ПК первого уровня. Цель – быть операционной системой ИИ для ПК по умолчанию. Эта стратегия распределения является центральной для того, как мы становимся стандартом в этой категории.
Когда агенты ИИ становятся способными обрабатывать счета-фактуры, исследования, отчетность и другие рабочие процессы бизнеса, какие новые проблемы управления, надзора и доверия должны организации готовиться сегодня?
Первой проблемой является аудит. Когда агент ИИ завершает рабочий процесс, такой как обработка счета-фактуры или генерация отчета, можно ли увидеть, что он сделал, почему он сделал это и откуда взялись данные? Этот вид прозрачного аудит-трейла является необходимым для соблюдения и обнаружения ошибок до того, как они станут серьезными.
Второй – определение границ. Какие рабочие процессы подходят для автономного выполнения, а какие требуют человеческого обзора? Компании нуждаются в четких политиках вокруг этого. Тенденция заключается в том, чтобы позволить ИИ делать все больше и больше, постепенно, и затем осознать слишком поздно, что решения высокого уровня принимаются без достаточного надзора.
Третьим является калибровка доверия. Сотрудники должны понимать, что может и не может сделать ИИ, и когда следует проверять его вывод, а не предполагать, что он правильный. Это вопрос культуры и обучения, а не только технологий.
Я считаю, что организации, готовящиеся к этому сегодня, будут иметь значительное преимущество, потому что, когда возможности ИИ растут, больше кадров управления будут накапливаться.
Через пять лет, по вашему мнению, люди будут все еще тратить большую часть своего времени на взаимодействие с ИИ через интерфейсы чата или ИИ все больше будет отходить на задний план и выполнять работу без запроса?
Траектория уже показывает, что ИИ все больше будет перемещаться на задний план. Модель, к которой мы движемся, заключается в том, что ваш компьютер понимает вашу работу и занимается рутинными частями, поэтому ваше внимание освобождается для вещей, которые действительно требуют вас.
Подумайте о том, как работает автопилот в авиации. Пилоты не всегда руками на каждом этапе каждого полета. Система обрабатывает базовую линию, и человек включается, когда требуется суждение и экспертиза. Это будущее работы с ИИ. Ваш компьютер обрабатывает повторяющиеся, основанные на правилах рабочие процессы. Вы сосредотачиваетесь на стратегии, творчестве и решениях, которые требуют настоящего человеческого суждения.
Через пять лет самые продуктивные люди будут теми, кто работает вместе с системами, которые понимают, как пользователь работает. В прошлом люди делали всю работу на своих компьютерах. В будущем ваш компьютер также будет работать для вас.
Спасибо за отличное интервью, читатели, которые хотят узнать больше, должны посетить IrisGo.












