关注我们.

思想领袖

如何克服 GenAI 应用中的语言和文化偏见

mm

2025年,ChatGPT和人工智能驱动的谷歌搜索将占据主导地位,但务必牢记不同的沟通模式。生成式人工智能(genAI)主要基于文本,并以英语运行,这使其在非母语人士中的使用场景受到限制。

尽管英语是全球不到 20% 的人口的母语,但它却占 67.3% 网站。许多 genAI 平台都是用英语进行训练的,这意味着在涉及多种语言或文化的工作环境中,沟通可能会出现偏差。

沟通远不止屏幕上的文字:它涉及语气、肢体语言、面部表情、节奏和文化差异,这些只是几个关键因素。部署新一代人工智能的组织必须确保他们也能减轻潜在的语言和文化偏见,尤其是在我们生活在全球化的世界的情况下。

为什么声音仍然重要

有多种理论阐述了多模式交流的重要性,尤其是在多元文化和多语言环境中。

其中最突出的是爱德华·T·霍尔的理论 高语境文化和低语境文化霍尔概述了不同文化沟通方式的内在差异。高语境文化存在于许多亚洲国家,这种文化在沟通中依赖间接和非语言的线索。例如,日语就是一种高语境语言,拟声词和表达方式的细微变化会极大地影响意图和推理。

相比之下,低语境文化,例如西方国家(美国和许多欧洲国家),则更依赖直接的口头交流。由于低语境文化往往更加直白,基于文本的数字信息传递能够无缝地融入他们的沟通结构。将genAI以文本为主的特征与这一理论进行对比,我们就能理解,来自高语境文化的人,尤其是非英语母语人士,很难有效地使用这些工具进行沟通。

在国际化的商业环境中,各行各业的人们汇聚一堂,缺乏肢体语言和语气等微妙的线索,会严重降低与人工智能沟通的可靠性。数字或基于技术的沟通,尤其是通过genAI工具进行的沟通,必须包含文本消息以外的其他模式。

GenAI 中的英语偏见问题

也有过 提出严重关切 关于人工智能检测器(讽刺的是,它是由人工智能驱动的)对非英语母语作家的偏见。此外,在科学界,最近的研究表明,多达 38% 的非英语母语人士 由于语言障碍而被期刊拒稿。这项研究的作者实际上认为,打破语言障碍是知识共享的关键。他们还认为,语言质量不应该决定知识是否值得分享。

研究人员 敲响警钟 关于法学硕士课程缺乏语言多样性,以及将大量非英语母语人士排除在外的风险。这是一个根深蒂固的问题,限制了人们如何参与和使用人工智能工具。

考虑到 95% 的美国公司已经采用了 genAI。这项技术正在 日益应用 到像制造工厂车间这样繁忙的工作环境。然而,在讨论人工智能部署策略时,非英语母语人士往往被排除在外。

让我们来看看在现实生活中成功应用人工智能的障碍有哪些。非英语母语人士难以理解提示,导致输出结果不准确,并存在信息或指令被误解的风险。例如,英语水平有限的越南制造商依靠genAI提供的英语翻译来获取指令。由于上下文和更细微的线索被剥离,这会导致巨大的错误空间。

此外,信任和信心也会受到侵蚀。这会增强员工对在工作流程中使用技术的抵触情绪,同时削弱员工的士气和积极性。

缩小差距

这些障碍和挑战应尽早解决。为了在通用人工智能 (genAI) 的采用中创造公平的竞争环境,必须考虑到文化和语言方面的细微差别。组织可以采取多种策略来弥合这些差距,并为多语言未来构建通用人工智能 (genAI) 的采用。

融入认知和分析框架

一个特别有用的认知框架是 OODA循环由著名喷气式战斗机飞行员约翰·博伊德开发。OODA 循环四个步骤之一的“适应”的五个组成部分——遗传基因、文化传统、过往经验、新信息以及分析/综合——可用于理解个体决策如何受到输入的影响。

我的建议是将语言视为“文化传统”的一部分,同时特别关注个体的“遗传基因”和“分析/综合”。以下将详细介绍每个组成部分如何在训练AI模型使其具备更广泛的语言能力方面发挥作用。

  • 遗传基因(人类固有特质):训练人工智能系统识别不同语言和文化之间共通的线索,例如音调和节奏。一种多模态的 genAI 方法,涵盖语音、文本和视频线索,而不仅仅是文本。

  • 文化传统:创建数据集以捕捉某些语言特征,例如拟声词和注重语境的交流方式。根据不同地区制定模型,而不是使用缺乏文化或语言灵活性的通用模型。

  • 以往经验:人们更有可能信任能够反映其现实生活的系统。例如,越南或日本的员工使用人工智能的方式与美国团队不同,这取决于他们对这些工具的接触程度和信心。本地团队可以参加研讨会,测试和练习使用genAI。然后,他们可以分享反馈,了解该系统如何更好地反映他们的语言和文化背景。之后,组织可以根据这些指南的用例(工厂工人通常更喜欢视觉指南)相应地调整提示库。

  • 新信息:genAI 工具需要不断利用真实世界的数据进行更新。利用跨数据集的多语言数据输入,使集成系统能够学习不同语言和沟通方式的细微差别。

  • 分析/综合:这是人与人工智能协调一致的关键。语言数据和信号通常比较零散,与通用人工智能模型不兼容。这些数据需要转化为人工智能可理解的数据,以便进行处理和分析,从而生成兼具文化和语言灵活性的输出。

最佳实践实践培训

员工还应接受有关提示型 genAI 平台最佳实践的培训,重点在于清晰度。提示库对于帮助团队熟悉提示的最佳实践非常有用。

重要的是,在人工智能培训研讨会上,我还建议关注公平和透明等原则。这些是公正部署人工智能的基本要素,团队也应该善于识别幻觉和偏见的迹象,因为这些迹象会加剧语言障碍。

此外,要避免“回音室效应”,确保来自人工智能的新信息不仅来自个人,还来自广泛的来源。回音室效应是包括人工智能在内的技术领域的一个重大问题,它会强化已有的偏见,并扭曲结果。员工面临着陷入偏见陷阱并遵循错误指导或信息的风险。

最后,要认识到任何人工智能工具,包括genAI,都应被视为“顾问”,而非严格的指导方针。应鼓励团队始终与人工沟通,以澄清任何疑惑,从而降低错误信息或误导的风险。

人工智能正在改变商业流程,但重要的是,在这一过程中不遗漏任何一方。将这些策略融入人工智能部署中,可以帮助企业克服语言障碍,避免偏见和问题滚雪球般扩大。

中村信一郎 (Shinichiro Nakamura) 一对一控股是 IndustrialML 的母公司,IndustrialML 是一家智能工厂软件公司,致力于为制造商开发人工智能解决方案。Shin 与 IndustrialML 的工程和产品团队紧密合作,指导 AI 在亚洲和美国各地工厂的落地,确保技术转化为真正的运营价值。Shin 拥有扎根于大和钢管工业(东亚最大的在线镀锌钢管生产商之一)的全球制造背景,在 AI、行业和跨文化融合方面拥有独特的视角。