Свяжитесь с нами:

Доктор Линцзя Тан, технический директор и соучредитель Clinc — серия интервью

Интервью

Доктор Линцзя Тан, технический директор и соучредитель Clinc — серия интервью

mm

Доктор Линцзя Тан, технический директор и соучредитель Клинк, профессор компьютерных наук в Мичиганском университете. Исследования доктора Танга по созданию крупномасштабной производственной инфраструктуры для интеллектуальных приложений получили широкое признание и уважение в академическом сообществе. Помимо работы в Microsoft и Google, Линцзя получила докторскую степень в области компьютерных наук в Университете Вирджинии. Lingjia недавно получила престижные награды, включая Зал славы ISCA, награды Facebook Research Awards и премию Google Research Award.

Что изначально привлекло вас в ИИ? Когда вы впервые поняли, что хотите начать бизнес в области искусственного интеллекта?

В середине 2000-х я занимался исследованиями крупномасштабных систем, поддерживающих различные приложения, и тем, как можно проектировать серверы как программные системы для более эффективной работы этих приложений. В то время мы переходили от работы с традиционными веб-приложениями к функциям, основанным на машинном обучении. Именно тогда я начал обращать внимание на алгоритмы, связанные с ИИ, и заинтересовался фундаментальным пониманием принципов работы приложений ИИ. Вскоре после этого исследовательская группа, с которой я работал, решила изменить направление и, по сути, создать собственные приложения ИИ в качестве эталонных образцов для изучения. Это привело к публикации первых нескольких исследовательских работ и разработке нашего первого продукта, Sirius — открытого сквозного персонального помощника с голосовым и визуальным управлением.

В качестве программного обеспечения с открытым исходным кодом Sirius позволял людям самостоятельно создавать диалоговых виртуальных помощников. В то время это были очень ограниченные возможности для широкой публики, и на самом деле они контролировались только крупными компаниями, такими как Google и Apple. Однако мы увидели, что заполнили критический пробел, когда выпустили программное обеспечение, и увидели, что за первую неделю его скачали десятки тысяч! Это был поворотный момент, когда мы знали, что существует большой рыночный спрос на этот тип программного обеспечения.

В 2015 году мы запустили Clinc, думая, что сможем предоставить каждому — каждому разработчику, компании, человеку, — кто хочет иметь возможность создать виртуального помощника с доступом к опыту, инструментам и инновациям, чтобы иметь возможность сделать это. .

Clinc предлагает диалоговые решения на базе искусственного интеллекта, не полагаясь на ключевые слова или сценарии. Не могли бы вы рассказать подробнее, как это достигается? Какие проблемы обработки естественного языка (NLP) пришлось преодолеть?

Что действительно отличает Clinc от других диалоговых платформ искусственного интеллекта на рынке, так это лежащие в его основе алгоритмы искусственного интеллекта, которые обеспечивают его опыт «человека в комнате», который понимает беспорядочный и незаписанный язык. Это позволяет вносить исправления, чтобы отследить и «исцелить» ошибки, допущенные в человеческом разговоре, и позволяет создавать сложные диалоговые потоки — разговоры, которые сможет понять настоящий человек. В отличие от алгоритма сопоставления слов речи с текстом, Clinc анализирует десятки факторов, вводимых пользователем, включая формулировку, настроение, намерение, тон голоса, время суток, местоположение и отношения, и использует эти факторы для предоставления ответа, который представляет собой совокупность знаний, извлеченных из его тренированного мозга. Например, если я спрошу своего виртуального помощника: «Сколько денег я потратил на бургер?» он должен понимать, что я спрашиваю о деньгах и расходах, что я спрашиваю конкретно о гамбургере и что гамбургер — это тип еды, и его следует соотносить с моими недавними расходами в ресторане.

Достичь такого уровня понимания непросто. В общем, мы бы разбили разговорный ИИ на два компонента: понимание естественного языка (NLU) и управление диалогами. Итак, задача, которую нам пришлось решить, заключалась в том, чтобы выяснить, как построить систему, которая может точно извлекать ключевые фрагменты информации и предвидеть, что спрашивает пользователь.

Мы можем сделать это с помощью сложного, контекстуального, нисходящего NLU, который обучен быть интуитивно понятным по своей природе, чтобы не отставать от естественного течения разговора, понимать сленг и контекст. Это по сравнению с конкурентными решениями, которые используют нисходящий, основанный на правилах подход к обработке естественного языка (NLP), который не позволяет исцелять разговором, то есть, если клиент делает ошибку, конкурентные решения заставляют его вернуться к исходной точке. , тратя время и только расстраивая пользователя. Мы также используем краудсорсинг для извлечения наших языковых данных, чтобы создать более богатый и разнообразный набор данных, который можно сразу же использовать для обучения моделей ИИ.

Не могли бы вы обсудить, как глубокое обучение используется в системе Clinc AI?

Clinc использует гибридный подход к глубокому обучению, в котором мы в некоторой степени используем традиционную модель старой школы и применяем глубокое обучение там, где это необходимо. В частности, мы используем глубокое обучение для понимания слов и языков, чтобы определить поток диалога. Вообще весь наш диалог — это сочетание глубокого обучения и символического ИИ. Мы пока не используем глубокое обучение для генерации языка, потому что, когда речь идет о наших клиентах, которые в основном работают в банковской сфере, существует множество правил, которым должен следовать виртуальный помощник, которые определяют, что они могут и что не могут говорить своим клиентам. . Таким образом, по-прежнему существует большая неопределенность в отношении того, сможет ли глубокое обучение следовать установленным языковым ограничениям.

На данный момент я не думаю, что сообщество разговорного ИИ полностью готово к полному внедрению глубокого обучения, в то время как академическое сообщество готово на 100%, но я с нетерпением жду возможности увидеть, на что способны новые модели.

Каков процесс для компании, которая хочет настроить ответы ИИ для целевой аудитории? Не могли бы вы привести несколько примеров того, как Clinc в настоящее время используется клиентами?

Мы позволяем клиентам либо лицензировать платформу, на которой они могут работать по своему усмотрению, либо взять нашего полностью созданного и обученного чат-бота Finie, настроить его и интегрировать в свои приложения или службы обмена сообщениями. Finie может решать вопросы, связанные с балансом, транзакциями, историей расходов, поиском банкомата, осуществлением перевода и многим другим.

Мой любимый пример того, как клиент настроил ИИ Clinc для целевой аудитории, — это İşbank. Будучи крупнейшим частным банком Турции, они обратились к нам за разработкой своего цифрового банковского помощника Maxi еще в 2018 году. Чтобы наделить Maxi уникальной индивидуальностью, İşbank провел 14 фокус-групп, чтобы определить, какие качества и навыки клиенты банка хотели бы иметь в виртуальном помощник. Они также наняли актрису озвучивания, чтобы она читала предложения на турецком языке, связанные с банковскими задачами. Команда разговорного банка İşbank придумала эти предложения, учитывая то, как реальные люди формулируют свои потребности. По нашей рекомендации команда платила участникам на краудсорсинговых площадках, таких как Amazon Mechanical Turk, за предоставление различных способов, которыми они могли бы задать одни и те же вопросы, например, запрос на просмотр своего баланса («какой у меня баланс», «сколько у меня денег? на моем счете», «покажите мне наличные на моем счете») или оплатить счет («оплатить мой счет», «оплата счетов»).

Этот пример действительно показывает, насколько İşbank инвестирует в предложение цифрового банковского помощника, чтобы помочь своим клиентам лучше ориентироваться в своих счетах. Вместе с Clinc İşbank запустил Maxi для более чем 7.5 миллионов человек на турецком языке. С момента своего запуска İşbank получил широкое распространение среди более чем 5.5 миллионов пользователей, в среднем 9.8 взаимодействий на одного пользователя. В последние месяцы, когда число случаев заражения COVID-19 в Турции увеличилось, İşbank быстро обучил Maxi реагировать на запросы, связанные с COVID-19. С марта 2020 года Maxi ответила более чем на 1.2 миллиона запросов клиентов, связанных с COVID-19, что означает увеличение использования более чем на 62%.

Что бы вы сказали женщинам, которые заинтересованы в том, чтобы узнать больше об ИИ, но не хотят вмешиваться из-за того, что в этой области преобладают мужчины?

Сразу скажу, что не думаю, что есть какие-либо причины считать ИИ областью, где доминируют мужчины. Думаю, есть много женщин-пионеров в области ИИ, которые действительно преуспевают и оказывают влияние. Я считаю, что сочетание ИИ и социальной политики — это уникальная область, которая может оказать значительное влияние на повседневную жизнь людей. Именно здесь, на мой взгляд, более разнообразные идеи по всем направлениям были бы нам очень полезны, особенно учитывая многочисленные дискуссии о предвзятости ИИ по расовому и гендерному признакам. Я считаю, что ограниченное сообщество разработчиков ИИ будет и дальше оказывать непропорционально большое влияние на общество и политику.

Женщинам, которые заинтересованы в том, чтобы присоединиться к области ИИ, я настоятельно рекомендую это, особенно если вы заинтересованы в том, чтобы оказать влияние. За прошедшие годы искусственный интеллект добился такого большого роста и инноваций, и это действительно захватывающее время, чтобы стать его частью.

Есть ли что-нибудь еще, что вы хотели бы рассказать о Clinc?

Clinc сейчас делает огромные успехи. Лично я только что вступил в новую должность технического директора Clinc и с нетерпением жду возможности сосредоточиться на том, как мы можем и дальше сотрудничать с разработчиками и специалистами по данным для расширения охвата нашей технологии. Заглядывая в будущее, я вижу, что спрос на приложения на базе ИИ меняется, позволяя людям без многолетнего опыта в области науки о данных и машинного обучения также использовать их. Например, для работы с Photoshop не требуется диплом графического дизайнера. Я думаю, что ИИ движется в том направлении, где разработчики без подготовки в области ИИ или машинного обучения смогут добиваться результатов и создавать высококачественные приложения. В целом, мы хотим подчеркнуть, что мы ориентированы не только на конечного пользователя, но и на разработчиков, независимо от уровня их подготовки, которые проявляют интерес к нашему решению.

Спасибо за отличное интервью, я с нетерпением жду, чтобы следить за вашими успехами. Всем, кто хочет узнать больше, следует посетить Клинк.

Антуан — дальновидный лидер и партнер-основатель Unite.AI, движимый непоколебимой страстью к формированию и продвижению будущего ИИ и робототехники. Серийный предприниматель, он считает, что ИИ будет таким же разрушительным для общества, как электричество, и его часто ловят на том, что он восторженно отзывается о потенциале разрушительных технологий и AGI.

футурист, он посвятил себя изучению того, как эти инновации изменят наш мир. Кроме того, он является основателем Ценные бумаги.io, платформа, ориентированная на инвестиции в передовые технологии, которые меняют будущее и преобразуют целые секторы.