访谈
卡尔·罗斯特,Patsnap 首席顾问 – 采访系列

卡尔·罗斯特 是 Patsnap 人工智能专利搜索工具背后的创造者。
Patsnap 是创新情报领域的先驱,利用人工智能和机器学习技术来分析数十亿的数据集,使创新者能够建立关键的联系。他们的尖端大型语言模型(LLM)技术专为研发和知识产权专业人士设计,可以轻松地在每天数十亿页的专利中导航。Patsnap 的人工智能助手可以对新颖性问题进行对话式的回应,并可以在大量文本中准确地找出特定的答案。例如,它可以准确地确定某种小工具类型是否已经被专利保护。
您能否概述 Patsnap 的人工智能助手的工作原理及其主要功能?
当然!它是一个名为 Hiro 的人工智能助手,允许您询问有关特定专利或结果集或我们的整个数据库的问题!它被训练为理解创新和专利相关的问题,并以满足技术主题专家和知识产权专业人士的方式做出回应。最近的进展是,Hiro 还可以帮助您解决技术问题并为新发明提出新颖的方向,通过将发明原则应用于技术解决方案和问题,这些问题和解决方案都存在于我们的专利和文献数据库中。Hiro 的工作方式取决于您是否在为研发或知识产权专业人士使用的产品中使用它。
我认为 Hiro 的独特之处在于,它由 Patsnap 的专有 LLM 提供支持,答案还链接到 Patsnap 库中的参考资料和来源,包括 2 亿份专利、1.9 亿篇文献、2.54 亿种化学结构、8790 万种生物序列和 20 亿篇新闻文章。
该应用程序为企业解决了哪些问题?
伟大的创新者应该将时间花在创新上,而不是确定产品的新颖性或进行初步的市场研究。专利数据是我们最丰富的技术信息来源之一,尤其是在某些技术领域,甚至可以媲美期刊数据。对于研发人员来说,找到和审查此类数据所需的时间一直是一个巨大的障碍,但像 Hiro 这样的工具可以真正地将此类信息民主化。
对于法律专业人士来说,花费数小时、数天、数周进行先前艺术和自由操作搜索是很常见的。有了人工智能工具,这可以更快、更准确地完成,从而腾出更多的带宽用于更战略性的工作。
现有的人工智能工具要么过于通用化,因此不适合知识产权领域,要么它们是黑盒子,没有透明度,无法让人了解资源,减少了信心,阻碍了决策。有了 Hiro,我们可以链接到来源并确保整个开发过程的透明度。
您的团队在开发 Patsnap 的人工智能功能时面临的主要挑战是什么,您是如何克服这些挑战的?
我们知道,正在建造新发明的人希望保护它们,因此在构建 Hiro 时,安全性是首要考虑的问题。由于 Hiro 的模型是本地的,并集成到我们的应用程序中,因此不会将任何数据传输到第三方,这些第三方很难被信任。我们的竞争对手没有做好基础工作,而是添加了第三方模型,这些模型在审查中无法站住脚。我们说我们没有在客户数据上训练模型,我们知道这是真的,并且可以向客户展示这一点以及我们做了什么。相比之下,我们的竞争对手的解决方案通过第三方将您暴露在风险之中,这些第三方在透明度和数据处理方面的声誉不佳。
您能否详细说明 Hiro 如何回答特定的新颖性问题以及这对研发和知识产权工作流程的影响?
使用 Hiro,用户可以询问诸如“这项发明的哪些方面使其新颖?”或“这项专利在不同的法律体系中会如何坚持?”或甚至“如何制造一款可穿戴的喷气背包”等问题,并获得针对发明过程的每个步骤的答案。与一般模型相比,Hiro真正理解是什么使专利特殊。用户不需要成为专利专家就可以了解他们的发明或产品中哪个部分需要保护,并可以在几秒钟内了解哪个部分是新颖的。
Hiro 如何处理来自专利和非专利文献的海量数据以提供精确和相关的答案?
我们对该数据集进行了广泛的训练,并由专家评估。然后,我们对专家评估的结果进行了人工智能训练,并让人工智能评估输出结果。总的来说,我们通过这种方式评估了数百万个数据点,以确保答案对技术专家和知识产权专业人士有意义。
Hiro 如何利用大型语言模型(LLM)来提高专利搜索和知识产权分析的效率?Patsnap 的专有 LLM 使用什么数据进行训练,您如何确保其准确性和可靠性?
Patsnap 构建了一个行业特定的 LLM 来驱动 Hiro。该 LLM 已经在专利记录、学术论文和其他创新数据上进行了训练,这有助于它以更有助于专业人士的方式理解和重述信息。为了确保准确性和可靠性,我们采用了严格的数据预处理方法,包括过滤低质量数据、去重和重写。我们还通过组合不同的来源来合成新数据,以增强模型对知识产权特定细微差别的理解。我们使用人工反馈对模型进行了监督微调和强化学习,以不断提高其性能。
PatsnapGPT 已经经过了广泛的测试,并在知识产权特定任务中超越了 GPT-4,展示了其在起草、分类、总结和推理方面的卓越能力,所有这些都在专利领域内进行。
专有 LLM 是透明的,链接到来源和参考资料,并且不在客户数据上进行训练。它是行业中唯一使用本地定制 LLM 的公司,尤其是在一个非常依赖数据隐私和保密性的行业中。
Patsnap 的专有 LLM 与其他通用大型语言模型(如 GPT-4)相比,在知识产权相关任务中的性能和准确性如何?
Patsnap 的专有 LLM 在知识产权查询方面的性能优于 GPT-4。使用美国专利和商标局(USPTO)专利考试,PatsnapGPT-1.0 的表现达到知识产权专家的水平,而一般的 LLM 没有达到专利律师参加考试的合格分数。
PatsnapGPT 在知识产权特定基准测试中表现出色。Hiro 一致地在 USPTO 专利考试中比 GPT-4 得分更高。一般的 LLM 未能通过考试的 70 分门槛,而 PatsnapGPT 1.0 达到了知识产权专家的水平,表明它对知识产权基础知识有更好的理解。另外,在 PatentBench 中,这是一个知识产权任务的综合基准测试,PatsnapGPT 在多个领域表现出色。它为专利撰写生成了更准确、更相关的文本,在根据国际专利分类系统对专利进行分类时得分更高,其技术效果、问题、方法和摘要的总结也一致地被评估者评为更高。它还显示出比 GPT-4 更快的速度和更低的内存使用率,用于长篇专利文档。
您如何看待人工智能在知识产权和研发领域的角色在未来十年内的演变?
我认为人工智能将在知识产权和研发领域扮演越来越重要的角色。在未来十年内,人工智能将大大提高专利搜索和分析的效率和准确性。像 PatsnapGPT 这样的先进人工智能模型将变得更擅长于理解和分类复杂的技术文档,撰写高质量的专利规格,并识别潜在的侵权或现有专利中的重叠。这将节省大量时间,并减少人为错误的余地。
此外,人工智能将革命性地改变我们处理和解释大量知识产权数据的方式。凭借快速处理和分析大量数据的能力,人工智能可以发现可能不为人知的趋势和见解。这可以为知识产权管理和研发中的决策和战略提供参考,例如识别新兴技术、潜在的创新领域和战略伙伴关系。
在研发中,人工智能将通过协助发现过程来推动创新。机器学习算法可以分析以前的研究,预测结果,甚至提出新的研究方向,加速发现和开发的速度。人工智能还可以模拟实验和模拟复杂系统,减少对昂贵和耗时的物理试验的需求。
随着人工智能技术的不断进步,其在知识产权和研发中的整合将提高创造力、效率和战略规划。
感谢您接受这次精彩的采访,希望了解更多的读者可以访问 Patsnap。












