人工智能

DeepScribe AI 可以帮助翻译古代平板电脑

更新 on 2022 年 12 月 9 日

芝加哥大学东方研究所和计算机科学系的研究人员合作设计了一种人工智能，可以帮助解码古代文明的平板电脑。据 Phys.org 报道该人工智能被称为 DeepScribe，并接受了从波斯波利斯防御档案中提取的 6,000 多张带注释的图像的训练，完成后，人工智能模型将能够解释未经分析的平板电脑，从而使研究古代文献变得更加容易。

研究古代文献的专家，比如研究波斯阿契美尼德帝国时期创建的文献的研究人员，需要手工翻译古代文献，这是一个漫长的过程，很容易出现错误。自 1990 世纪 XNUMX 年代以来，研究人员一直在使用计算机来协助解释古代文献，但所使用的计算机程序的帮助有限。复杂的楔形文字以及平板电脑的三维形状限制了计算机程序的实用性。

计算机视觉算法和深度学习架构为该领域带来了新的可能性。 OI 计算机科学系的 Sanjay Krishnan 与亚述学副教授 Susanne Paulus 合作推出了 DeepScribe 项目。研究人员负责管理一个名为 OCHRE 的数据库管理平台，该平台负责组织考古发掘的数据。目标是创建一个既广泛又灵活的人工智能工具，能够解释不同地理区域和时间段的脚本。

据 Phys.org 报道克里希南解释说，考古研究人员面临的识别文字的挑战本质上与计算机视觉研究人员面临的挑战相同：

“从一台从愿景的角度来看，这真的很有趣，因为这些都是我们面临的相同挑战。计算机视觉在过去五年中取得了显着的进步；十年前，这可能是一举两得的事，我们不会走到这一步。这是一个很好的机器学习问题，因为这里的准确性是客观的，我们有一个带标签的训练集，我们很好地理解了脚本，这对我们很有帮助。这并不是一个完全未知的问题。”

所讨论的训练集是从 OI 和芝加哥大学大约 80 年来进行的考古研究中提取的平板电脑和翻译的结果，并从中制作高分辨率的带注释图像。目前，训练数据大小约为 60 TB。研究人员能够使用该数据集并创建一个包含超过 100,000 个单独识别的迹象的字典，模型可以从中学习。当训练好的模型在未见过的图像集上进行测试时，模型达到了大约 80% 的准确率。

虽然研究人员团队正在尝试提高模型的准确性，但即使 80% 的准确性也可以帮助转录过程。 Paulus 表示，该模型可用于识别或翻译文档中高度重复的部分，让专家将时间花在解释文档中较困难的部分上。即使该模型不能确定地说明符号的含义，它也可以为研究人员提供概率，这已经使他们处于领先地位。

该团队还致力于使 DeepScribe 成为其他考古学家可以在他们的项目中使用的工具。例如，该模型可以在其他楔形文字上进行重新训练，或者该模型可以对损坏或不完整的平板电脑上的文本进行明智的估计。足够稳健的模型甚至可以估计药片或其他文物的年龄和起源，这通常是通过化学测试完成的。

DeepScribe 项目由高级计算发展中心 (CDAC) 资助。计算机视觉也已用于其他 CDAC 资助的项目中，例如旨在识别艺术品风格的项目和旨在量化海洋双壳类生物多样性的项目。研究人员团队还希望他们的合作能够促进芝加哥大学计算机科学系和 OI 之间未来的合作。