Connect with us

Александр Худек, сооснователь и технический директор Kira Systems – Интервью

Искусственный интеллект

Александр Худек, сооснователь и технический директор Kira Systems – Интервью

mm

Александр Худек является сооснователем и техническим директором Kira Systems. Он имеет степень Ph.D и M.Math в области компьютерных наук в Университете Уотерлоо, и степень B.Sc. в Университете Торонто по физике и компьютерным наукам.

Его прошлые исследования в области биоинформатики были сосредоточены на поиске сходств между последовательностями ДНК. Он также работал в области систем доказательств и компиляции запросов к базам данных.

Когда вы впервые заинтересовались машинным обучением и ИИ?

Я всегда был интересен компьютерными науками. На первом курсе я посещал курсы по алгоритмам планирования и логике, машинному обучению и ИИ, численным методам и другим темам. Мой интерес к машинному обучению вырос более конкретно во время моего аспирантского обучения в Университете Уотерлоо. Там я использовал методы машинного обучения для изучения ДНК. После этого я глубже погрузился в формальную логику в рамках своего постдокторского исследования. Логика и рассуждение – это в некотором смысле “другая сторона” подходов к ИИ, и я считал важным узнать больше об этом.

Некоторые из ваших прошлых исследований в области биоинформатики были сосредоточены на поиске сходств между последовательностями ДНК. Можете ли вы рассказать о некоторых из этих работ?

Основная часть моей диссертации включала создание более реалистичной модели мутации ДНК с использованием скрытых марковских моделей. Я использовал эту более сложную модель в новом алгоритме, предназначенном для поиска областей ДНК, которые имеют общее происхождение с другими видами. В частности, этот новый алгоритм может найти более слабо связанные области последовательностей, чем предыдущие алгоритмы для этой задачи.

До моего аспирантского обучения я работал в исследовательской лаборатории, которая была частью проекта по картографированию человеческого генома. Одним из наиболее заметных проектов, над которым я работал, была первая полная версия человеческой хромосомы 7.

Какова была первоначальная идея запуска Kira?

Идея Kira пришла от моего сооснователя, Ноя Вайсберга. Он провел часы в своей карьере юриста, выполняя работу, которую мы теперь построили с помощью ИИ. Это была интересная идея для меня, поскольку она включала в себя естественный язык, и проблема была хорошо определена, и я мог увидеть бизнес-потенциал. Есть что-то привлекательное в создании ИИ, который может понимать человеческий язык, поскольку язык так тесно связан с человеческим познанием.

Можете ли вы описать, что такое программное обеспечение для анализа контрактов и как оно приносит пользу юридическим специалистам?

Kira использует контролируемое машинное обучение, то есть опытный юрист вводит положения из реальных контрактов в систему, предназначенную для обучения на этих примерах. Система изучает эти данные, учится, какой язык является актуальным, и строит вероятностные модели положений. Эти модели затем тестируются на наборе аннотированных соглашений, с которыми система не знакома, чтобы определить ее готовность. Эта высокоточная технология машинного обучения может идентифицировать и анализировать практически любое положение в любом контракте, в результате чего клиенты сообщают о экономии времени от 20 до 90%. Эта повышенная производительность помогает юридическим фирмам увеличивать их показатели реализации, дает им больше возможностей для роста доходов и сохранения существующих клиентов. Для корпораций это повышает производительность внутри компании, снижая необходимость во внешних юридических расходах.

Обработка естественного языка (NLP) трудна для большинства компаний, можете ли вы рассказать о некоторых дополнительных проблемах, с которыми сталкиваются при обработке юридической терминологии и других нюансов, уникальных для юридической профессии?

Для многих людей юридический язык может показаться очень чужим, но оказывается, что с точки зрения машинного обучения он не так уж и отличается. Есть несколько более уникальных вещей; капитализация более важна, и предложения могут быть намного длиннее, чем обычно, но в целом мы не нуждались в значительно разных подходах NLP, чем в других областях.

Одним из аспектов, который существенно отличается, является необходимость конфиденциальности данных и настройки. Юридические специалисты обязаны сохранять конфиденциальность данных клиентов, и использование их в продукте машинного обучения, который объединяет или делится обучающими данными, противоречит этим требованиям. Фактически, даже хранение обучающих данных часто невозможно, поскольку у них есть обязательства удалить данные клиентов после завершения проекта. Таким образом, возможность обучать модели без участия поставщиков становится критической, а также и методы машинного обучения, которые делают невозможным восстановление любой части обучающих данных путем осмотра изученных моделей. Методы, которые позволяют взять существующую модель и обновить ее с новыми обучающими данными без повторной тренировки с нуля, также являются необходимостью.

На фронте настройки существует необходимость для клиентов создавать свои собственные модели. Это связано с тем, что для более сложных юридических концепций могут быть разумные расхождения среди специалистов, и фирмы часто хотят настроить или создать модели, соответствующие их уникальным позициям.

Можете ли вы описать, как глубокое обучение используется для категоризации данных в программном обеспечении Kira?

Мы не используем много глубокого обучения в нашем продукте, хотя наша внутренняя исследовательская команда тратит много времени на оценку и изучение решений глубокого обучения. Пока что, на типах проблем, с которыми мы сталкиваемся, методы глубокого обучения только соответствуют подходам, не основанным на глубоком обучении, или, в лучшем случае, дают очень небольшое увеличение. Учитывая огромный вычислительный overhead методов глубокого обучения, а также проблемы с сохранением конфиденциальности обучающих данных, они пока не являются убедительными для принятия.

Что такое некоторые из встроенных моделей положений, которые предлагает Kira?
Текущая Kira может идентифицировать и извлекать более 1 000 встроенных положений, пунктов и данных (умных полей). Они относятся к множеству различных тем, от Due Diligence при слиянии и поглощении – с которым Kira была первоначально задумана для помощи – до Brexit; до недвижимости. Умные поля создаются нашей командой специалистов по предмету, в которую входят опытные юристы и бухгалтеры. С нашей технологией машинного обучения стандарты Kira требуют, чтобы практически каждое умное поле достигало минимального показателя воспоминания 90%, то есть наше программное обеспечение найдет 90% или более положения, пункта или данных, которые вы ищете в своих контрактах или документах, снижая риски и ошибки в процессе проверки контрактов. Кроме того, можно создать неограниченное количество пользовательских полей, которые можно автоматически идентифицировать и извлекать, используя наш инструмент Quick Study.

Юридический мир часто известен тем, что медленно принимает новую технологию. Вы обнаружили, что существует барьер образования при обучении юридических фирм?

Юристам действительно нравится знать, как работают вещи, поэтому образование важно. Это не труднее обучать юристов машинному обучению и ИИ, чем других специалистов, но это определенно необходимо иметь готовые обучающие материалы. Многие барьеры принятия также являются социальными; люди часто спрашивают о лучших практиках в адаптации своих внутренних процессов для использования ИИ или интересуются тем, как они могут использовать ИИ для изменения своих бизнес-предложений таким образом, чтобы получить преимущества, выходящие за рамки простых улучшений эффективности.

По сравнению с тем, когда мы начали Kira Systems в 2011 году, юридические фирмы сегодня гораздо более осведомлены о ИИ и технологиях. Многие имеют инновационные команды, которые занимаются изучением новых технологий и поощрением принятия новых решений.

Есть ли что-то еще, что вы хотели бы поделиться о Kira?

Академическая литература и открытые библиотеки машинного обучения были инструментальными в помощи нам запустить компанию. Мы считаем, что открытая информация и программное обеспечение являются огромным благом для мира. В свете этого я особенно рад, что наша исследовательская команда публикует результаты многих наших исследовательских усилий в академических журналах и конференциях. Помимо демонстрации того, что мы продвигаем границы современного состояния искусства, это позволяет нам отдавать долг сообществам, которые помогли нам начать и от которых мы продолжаем получать огромную пользу. Вы можете найти наши статьи по адресу https://kirasystems.com/science/.

Чтобы узнать больше, посетите Kira Systems.

Антуан - видный лидер и сооснователь Unite.AI, движимый непоколебимой страстью к формированию и продвижению будущего ИИ и робототехники. Как серийный предприниматель, он считает, что ИИ будет столь же разрушительным для общества, как электричество, и часто увлекается потенциалом разрушительных технологий и ИИ.

Как футуролог, он посвящен изучению того, как эти инновации изменят наш мир. Кроме того, он является основателем Securities.io, платформы, ориентированной на инвестиции в передовые технологии, которые переопределяют будущее и меняют целые сектора.