伦理
弥合语言鸿沟:推动非洲语言的人工智能工具发展

在今天的科技驱动时代,人工智能(AI)已经催生了像ChatGPT这样的文本通信工具和像Siri这样的语音激活服务,增强了人类的能力。然而,这些AI奇迹主要是为英语、法语和西班牙语等主导语言设计的。因此,数十亿人由于语言差异而处于技术劣势。
幸运的是,非洲的一组研究人员正在努力弥合这一数字鸿沟。他们最近在《模式》杂志上发表的研究概述了开发适用于非洲语言的AI工具的策略。
马萨卡内研究基金会的AI研究员凯瑟琳·西米尼尤(Kathleen Siminyu)强调了这一努力的重要性。“在语言技术的发展中,包容性和代表性不是最后的补丁,而是需要从一开始就考虑的东西,”她说,并指出AI工具中非洲语言的匮乏是不可接受的。
人工智能对人类语言的理解是通过自然语言处理(NLP)实现的,使计算机能够解析和处理人类的语音模式和文本数据。这个过程的效率取决于特定语言的数据可用性。数据越少,AI工具的效率就越低。考虑到许多非洲语言的数据量,研究人员面临着独特的挑战。
非洲语言人工智能开发的四大支柱
为了解决这个问题,研究人员启动了一个过程,识别和参与开发非洲语言工具的关键利益相关者。这包括内容创作者、基础设施建设者、语言学家、软件工程师和企业家等。
他们的互动产生了四个核心见解,用于创建非洲语言工具:
- 非洲拥有丰富的语言多样性,语言不仅仅是交流的工具,也与文化身份、教育、政治和经济等领域密切相关。
- 急需提升非洲内容的创造力,包括开发适用于非洲语言的基本工具,如词典、拼写检查工具和本地键盘。此外,还需要消除在官方沟通中翻译成多种非洲语言的障碍。
- 语言学和计算机科学之间的合作对于创建以个人为中心、促进个人和社区成长的工具至关重要。
- 虽然数据对于这些工具至关重要,但其收集、策划和应用应以道德考虑和社区尊重为基础。
西米尼尤强调了这些发现的重要性:“这些发现突出了和阐明了时间和财务投资的优先顺序。”
研究并没有就此停止。计划正在展开,以扩大研究的范围,包括更多的参与者,以更好地衡量AI语言工具的潜在影响。此外,团队致力于识别和克服可能阻碍这些工具的获取的障碍。他们的愿景是拥有大量的语言工具,不仅可以简化沟通,还可以抵制虚假信息。此外,这一努力可能会促进保护非洲的土著语言。
西米尼尤的愿景与许多人产生了共鸣:“我希望我们能生活在一个世界里,非洲人能够拥有与英语、法语、普通话或其他语言母语者一样好的生活质量和获取信息、机会的途径。”
这项研究无疑是朝着这一目标迈出的一大步。












