访谈
卡尔·罗斯特,Patsnap 首席顾问 – 采访系列

卡尔·罗斯特 是 Patsnap 人工智能驱动的专利搜索工具背后的策划者。
Patsnap站在创新智慧的前沿,利用人工智能和机器学习的力量,筛选数十亿的数据集,使创新者能够做出关键的联系。他们的尖端LLM技术,专为研发和知识产权专业人员量身定制,轻松地每天浏览数十亿页的专利。Patsnap的人工智能助手参与对新颖性问题的对话式响应,并可以在大量文本中准确定位特定的答案。例如,它可以准确确定某种小工具类型是否已经被专利保护。
您能否提供Patsnap人工智能助手的工作概述及其主要功能?
当然!它是一个名为Hiro的人工智能助手,允许您询问有关特定专利或结果集或我们整个数据库的问题!它被训练为理解创新和专利相关问题,并以满足技术主题专家和知识产权专业人员的方式做出响应。最近的进展是,Hiro甚至可以帮助您解决技术问题,并为新发明提出新颖的方向,通过将发明原理应用于技术解决方案和在我们的专利和文献数据库中找到的问题。Hiro的工作方式取决于您是否在我们的产品中使用它,用于研发或知识产权专业人员。
我认为使Hiro独特的是,它由Patsnap的专有LLM提供支持,答案还链接到Patsnap图书馆中的参考和来源,包括2亿份专利,1.9亿篇文献,2.54亿种化学结构,8.79亿种生物序列和20亿篇新闻文章。
该应用程序为企业解决了哪些问题?
伟大的创新者应该花时间创新,而不是确定产品的新颖性或进行初步的市场研究。专利数据是我们最丰富的技术信息来源,尤其是在某些技术领域,甚至超过了期刊数据。对于研发人员来说,找到和审问此类数据所需的时间一直是一个巨大的障碍,但像Hiro这样的工具可以真正使此类信息民主化。
对于法律专业人员来说,花费数小时、数天、数周进行先前艺术和自由操作搜索是很常见的。有了人工智能工具,这可以更快、更准确地完成,从而为更战略性的工作腾出更多的带宽。
现有的人工智能工具要么过于通用,因此不适合知识产权领域,要么是黑盒子,没有透明的资源,降低了信心,阻碍了决策。有了Hiro,我们链接回来源,并确保在整个开发过程中保持完全的可见性。
您的团队在开发Patsnap的AI功能时面临的主要挑战是什么,您是如何克服它们的?
我们知道,正在构建新发明的人们希望保护它们,因此在构建Hiro时,安全性是首要考虑的问题。由于Hiro背后的模型是本地构建的并集成到我们的应用程序中,因此没有数据离开环境到难以信任的第三方。我们的竞争对手没有做基础工作,而是添加了第三方模型,这些模型在审查中站不住脚。我们说我们没有在客户数据上训练模型,我们知道这是真的,并且可以向客户展示这一点以及我们做了什么。相比之下,我们的竞争对手的解决方案通过第三方将您暴露在风险之中,第三方在透明度和数据处理方面的声誉不佳。
您能否详细说明Hiro如何回答特定的新颖性问题以及这对研发和知识产权工作流程的影响?
使用Hiro,用户可以询问诸如“这项发明的哪些方面使其新颖?”或“这项专利在不同法律体系中如何坚持?”或甚至“如何构建可穿戴式喷气背包”等问题,并获得针对发明过程的每个步骤的答案。与通用模型相比,Hiro真正理解是什么使专利特殊。用户不需要成为专利专家就可以弄清楚他们的发明中什么是或不是新颖的,并且可以在几秒钟内了解他们的产品或工具的哪个部分需要保护。
如何处理来自专利和非专利文献的海量数据,以提供准确和相关的答案?
我们对该数据集进行了广泛的训练,并由专家评估响应。然后,我们在专家响应上训练了人工智能,人工智能评估输出,并由专家审查。总的来说,我们通过这种方式评估了数百万个数据点,以确保响应对技术专家和专利专业人员有意义。
如何利用大型语言模型(LLM)来增强专利搜索和知识产权分析的效率?用于训练Patsnap专有LLM的数据类型是什么,您如何确保其准确性和可靠性?
Patsnap构建了一个行业特定的LLM来为Hiro提供支持。LLM已在专利记录、学术论文和其他创新数据上进行了训练,这有助于它以更有助于专业人士而非通用模型的方式理解和重述信息。为了确保准确性和可靠性,我们采用了严格的数据预处理方法,包括过滤低质量数据、去重和重写。我们还通过组合不同的来源来增强模型对知识产权特定细微差别的理解。我们从人工反馈中监督微调和强化学习,以不断提高其性能。
PatsnapGPT经过了广泛的测试,并在知识产权特定任务中超越了GPT-4,展示了在专利领域的草拟、分类、总结和推理方面的卓越能力。
专有LLM是透明的,链接来源和参考,并且不在客户数据上进行训练。它是行业中唯一使用本地调整LLM的公司,尤其是在数据隐私和保密性方面依赖性极高的行业中。
Patsnap的专有LLM与GPT-4等通用LLM相比,在知识产权相关任务方面的性能和准确性如何?
Patsnap的专有LLM在知识产权查询方面的性能优于GPT-4。使用美国专利和商标局(USPTO)专利考试,PatsnapGPT-1.0的表现达到知识产权专家的水平,而通用LLM则无法达到专利律师参加考试的合格线。
PatsnapGPT在知识产权特定基准方面真正脱颖而出。Hiro在USPTO专利考试中始终比GPT-4等通用模型得分更高。通用LLM无法通过考试的70分合格线,而PatsnapGPT 1.0的得分达到知识产权专家的水平。这表明它对知识产权基础知识有更好的理解。此外,在专利基准(PatentBench)中,这是一个全面评估知识产权任务的基准,PatsnapGPT在几个领域表现出色。它为专利撰写生成更准确、更相关的文本,在根据国际专利分类系统对专利进行分类方面得分更高,其对技术效果、问题、方法和摘要的总结也被评估者一致评为更高。它还比GPT-4在长专利文档方面显示出更快的速度和更低的内存使用量。
您如何看待人工智能在知识产权和研发领域的角色在未来十年内的演变?
我认为人工智能将在未来十年内在知识产权和研发领域发挥越来越重要的作用。首先,人工智能将大大提高专利搜索和分析的效率和准确性。像PatsnapGPT这样的高级人工智能模型将变得更擅长于理解和分类复杂的技术文档,撰写高质量的专利规范,并识别现有专利中的潜在侵权或重叠。这将节省大量时间,并减少人为错误的余地。
此外,人工智能将革新我们处理和解释大量知识产权数据的方式。凭借快速处理和分析大量数据集的能力,人工智能可以发现可能不被注意到的趋势和见解。这可以更好地为知识产权管理和研发的决策和战略提供信息,例如识别新兴技术、潜在的创新领域和战略合作伙伴。
在研发中,人工智能将通过辅助发现过程来推动创新。机器学习算法可以分析以前的研究,预测结果,甚至提出新的研究线索,从而加速发现和开发的步伐。人工智能还可以模拟实验和复杂系统,减少对昂贵和耗时的物理试验的需求。
随着人工智能技术的不断发展,其在知识产权和研发中的整合将增强创造力、效率和战略规划。
感谢这次精彩的采访,希望了解更多的读者请访问Patsnap。












