人工智能
什么是 NLU(自然语言理解)?

自然语言理解(NLU) 是自然语言处理更大主题中的一个技术概念。NLU 是将自然、人类语言翻译成计算机可以解释的格式的过程。从本质上讲,在计算机可以处理语言数据之前,它必须理解数据。
NLU 的技术包括使用常见的语法和语法规则,使计算机能够理解自然人类语言的含义和上下文。这些技术的最终目标是计算机能够像人类一样具有对语言的“直觉”理解,能够像人类一样编写和理解语言,而不需要不断参考单词的定义。
定义 NLU(自然语言理解)
计算机科学家和 NLP 专家使用许多技术来使计算机能够理解人类语言。大多数技术属于“语法分析”类别。语法分析技术包括:
- 词干提取
- 词形还原
- 词语分割
- 解析
- 形态学分割
- 句子分割
- 词性标注
这些语法分析技术将语法规则应用于一组单词,并尝试使用这些规则来推导出含义。相比之下,NLU 通过使用“语义分析”技术来运作。
语义分析将计算机算法应用于文本,尝试在自然上下文中理解单词的含义,而不是依赖于基于规则的方法。一个短语的语法正确性/错误性并不一定与该短语的有效性相对应。可能存在语法正确但无意义的短语,也可能存在语法错误但有意义的短语。为了区分单词中最有意义的方面,NLU 应用了各种旨在捕捉一组单词的含义的技术,而不是依赖于语法结构和规则。
NLU 是一个不断发展和变化的领域,被认为是人工智能的难题。各种技术和工具正在被开发,以使机器能够理解人类语言。大多数 NLU 系统都有一些共同的核心组件。语言词典是必需的,某种类型的文本解析器和语法规则也是必需的,以指导文本表示的创建。该系统还需要语义理论来启用对表示的理解。有各种语义理论用于解释语言,例如随机语义分析或天真语义。
常见的 NLU 技术包括:
命名实体识别是识别“命名实体”的过程,这些实体是人、重要的地方/事物。命名实体识别通过区分基本概念和引用在文本体中,识别命名实体并将其放入类别中(例如位置、日期、组织、人、作品等)来运作。通常使用基于语法规则的监督模型来执行命名实体识别任务。
词义消歧是根据单词出现的上下文确定单词的含义或意义的过程。词义消歧通常使用词性标注器来上下文化目标单词。词义消歧的监督方法包括使用支持向量机和基于内存的学习。然而,大多数词义消歧模型都是半监督模型,它们同时使用标记数据和未标记数据。
NLU(自然语言理解)示例
NLU 的常见示例包括自动推理、自动票据路由、机器翻译和问答。
自动推理
自动推理 是一门旨在使机器具有逻辑或推理能力的学科。这是认知科学的一个分支,旨在根据医疗诊断或编程/自动解决数学定理来进行推理。NLU 用于帮助收集和分析信息,并根据信息生成结论。
自动票据路由
NLU 通常用于自动化客户服务任务。当生成客户服务票据时,聊天机器人和其他机器可以解释客户需求的基本性质,并将其路由到正确的部门。公司每天都会收到成千上万的支持请求,因此 NLU 算法在优先处理票据和使支持代理能够更高效地处理它们方面非常有用。
机器翻译
准确地将语音或文本从一种语言翻译成另一种语言是很困难的。事实上,机器翻译 是 NLP 和 NLU 中最困难的问题之一。许多机器翻译系统依赖于语言学规则来翻译语言,但研究人员正在寻求更复杂的翻译语言的方法。NLU 机器翻译试图通过保留目标文本相关的上下文和语义信息来实现更准确的翻译。最准确的机器翻译系统将语言学规则与提取语义含义的算法相结合。
问答
语音识别使用 NLU 技术,使计算机能够 理解用自然语言提出的问题。NLU 用于为设备用户提供自然语言的响应,而不是提供可能的答案列表。当您向数字助手提出问题时,NLU 用于帮助机器理解问题,根据识别的实体和之前语句的上下文选择最合适的答案。因此,当您问数字助手一个问题时,NLU 会帮助机器理解问题,根据识别的实体和之前语句的上下文选择最合适的答案。












