人工智能
亚历山大·胡德克,Kira Systems联合创始人兼首席技术官 – 采访系列

亚历山大·胡德克是Kira Systems的联合创始人兼首席技术官。他拥有来自滑铁卢大学的计算机科学博士和数学硕士学位,以及来自多伦多大学的物理和计算机科学学士学位。
他的过去的研究领域包括生物信息学,重点是寻找DNA序列之间的相似性。他还曾在证明系统和数据库查询编译领域工作。
您最初是什么时候对机器学习和人工智能感兴趣的?
我一直对计算机科学感兴趣。在本科阶段,我学习了算法规划、逻辑、机器学习和人工智能、数值计算等课程。我的机器学习兴趣是在滑铁卢大学的博士阶段更加具体地发展起来。在那里,我使用机器学习方法来研究DNA。之后,我在博士后研究中更深入地研究了形式逻辑。逻辑和推理在某种意义上是人工智能方法的“另一面”,我觉得了解它很重要。
您的一些过去的研究在生物信息学领域,重点是寻找DNA序列之间的相似性。您能讨论一些这方面的工作吗?
我的论文的主要内容是使用隐马尔可夫模型构建一个更现实的DNA突变模型。我使用这个更复杂的模型设计了一个新算法,用于找到与其他物种共享共同祖先的DNA区域。特别是,这个新算法可以找到比以前的算法更弱地相关的序列区域。
在我的博士研究之前,我曾在一个与人类基因组项目相关的研究实验室工作。其中一个最值得注意的项目是我帮助完成的第一个完整的人类染色体7草图。
Kira的最初灵感是什么?
Kira的想法来自我的联合创始人诺亚·韦斯伯格。他在他的律师职业生涯中花了很多时间做我们现在使用人工智能来做的工作。这对我来说是一个有趣的想法,因为它涉及自然语言,问题范围明确,我也看到了商业潜力。构建能够理解人类语言的人工智能很有吸引力,因为语言与人类认知密切相关。
您能描述一下合同分析软件是什么以及它如何造福法律专业人士吗?
Kira使用有监督的机器学习,这意味着一位经验丰富的律师将真实合同中的条款输入到一个设计用于学习这些示例的系统中。该系统研究这些数据,学习相关语言,并构建概率模型。然后使用一组未知的注释协议来测试这些模型,以确定其准备就绪程度。这种高精度的机器学习技术可以识别和分析几乎任何合同中的任何条款,结果客户报告的时间节省为20-90%。这种提高的生产力帮助律师事务所通过提高他们的实现率,增加收入,并保留现有客户。对于公司来说,它可以提高内部的生产力,减少外部法律支出。
自然语言处理(NLP)对大多数公司来说是具有挑战性的,法律专业人士在处理法律术语和其他独特的法律专业细节方面会面临哪些额外的挑战?
对于很多人来说,法律语言似乎很陌生,但从机器学习的角度来看,它实际上并没有那么不同。有一些独特的方面;大写字母更重要,句子可以比正常的长得多,但总体而言,我们不需要在其他领域中使用明显不同的NLP方法。
一个显著不同的方面是需要数据隐私和定制。法律专业人士需要保密客户数据,在机器学习产品中使用或共享训练数据与这些要求相矛盾。事实上,甚至保留训练数据通常是不可能的,因为他们有义务在项目完成后删除客户数据。因此,能够在不需要供应商参与的情况下训练模型变得至关重要,机器学习技术可以使得通过检查学习模型很难或不可能恢复任何训练数据。允许您使用新训练数据更新现有模型而无需从头开始重新训练的技术也是必不可少的。
在定制方面,客户需要能够构建自己的模型。这是因为对于更复杂的法律概念,专业人士之间可能存在合理的分歧,公司通常希望调整或构建模型以匹配他们自己的独特立场。
您能描述一下Kira软件中如何使用深度学习来分类数据吗?
我们在产品中没有使用太多的深度学习,尽管我们的内部研究团队花了很多时间评估和探索深度学习解决方案。到目前为止,在我们面临的问题上,深度学习技术只与非深度学习方法相匹配,或者最多获得很小的提高。考虑到深度学习方法的巨大计算开销,以及保持训练数据隐私的挑战,它们还没有令人信服到足以被采用。
话虽如此,我们发现深度学习方法很有吸引力,我们认为它们有潜力在NLP中变得重要。为此,我们不断评估和探索深度学习NLP方法,以便我们可以在优势开始超过缺点时采用它们。
Kira提供哪些内置的条款模型?
目前,Kira可以识别和提取超过1,000个内置条款、子句和数据点(智能字段)。它们涉及多个不同主题,从M&A尽职调查(Kira最初被设计用来协助)到Brexit;到房地产。这些智能字段由我们的主题专家团队构建,包括经验丰富的律师和会计师。使用我们的机器学习技术,Kira的标准要求几乎每个智能字段都达到至少90%的召回率,这意味着我们的软件将找到90%或更多您正在寻找的合同或文档中的条款、子句或数据点,从而减少合同审查过程中的风险和错误。此外,使用我们的Quick Study工具,可以创建/教导无限数量的自定义字段来自动识别和提取相关见解。
法律界通常以采用新技术缓慢而闻名,您是否发现有一个教育障碍需要教育律师事务所?
律师真的很想知道事情是如何工作的,所以教育很重要。教律师关于机器学习和人工智能并不比教其他专业人士更难,但确实需要准备好培训材料。许多采用障碍也是社会性的;人们经常询问如何将内部流程适应使用人工智能,或者对如何使用人工智能改变业务以获得超出效率提高的优势感兴趣。
与我们2011年创立Kira Systems时相比,今天的律师事务所对人工智能和技术的了解程度要高得多。许多公司都有创新团队,负责调查新技术并鼓励采用新解决方案。
您是否还有其他关于Kira的事情想要分享?
学术文献和开源机器学习库在帮助我们启动公司方面起到了重要作用。我们相信开放信息和软件对世界来说是一种巨大的福祉。鉴于此,我特别高兴的是,我们的研究团队在学术期刊和会议上发表了我们许多研究工作的结果。除了展示我们正在推动最先进技术的发展外,这还使我们能够回馈那些帮助我们起步的社区,并继续从中获得巨大的价值。你可以在https://kirasystems.com/science/找到我们的论文。
要了解更多,请访问Kira Systems。












