AI 模型与平台

OpenAI 的 ChatGPT 挑战大学会计考试

mm

OpenAI 最近推出了其开创性的 AI 聊天机器人 GPT-4,它在各个领域引起了轰动。凭借 90 百分位的律师考试成绩,通过 13 个 AP 考试,并在 GRE 词汇测试中取得近乎完美的成绩,GPT-4 的表现简直令人惊叹。

来自杨百翰大学(BYU)和其他 186 所大学的研究人员对 OpenAI 的技术在会计考试中的表现感到好奇。他们测试了原始版本的 ChatGPT,并发现虽然在会计领域仍有改进的空间,但该技术是一个游戏规则的改变者,它将以积极的方式影响教育的传递和接受。

自 2022 年 11 月首次亮相以来,ChatGPT 已成为增长最快的技术平台,仅用两个月就达到 1 亿用户。在关于 AI 模型在教育中的作用的持续辩论中,首席研究作者和 BYU 会计教授 David Wood 决定招募尽可能多的教授来评估 AI 的表现与实际大学会计学生的表现。

ChatGPT 与学生在会计考试中的对比

该研究涉及 327 位来自 186 所教育机构和 14 个国家的共同作者,他们贡献了 25,181 个课堂会计考试题目。BYU 本科生还提供了 2,268 个教科书测试题库。这些问题涵盖了会计的各个子领域,例如会计信息系统(AIS)、审计、财务会计、管理会计和税务。它们还在难度和类型上有所不同。

尽管 ChatGPT 的表现令人印象深刻,但学生们还是超越了 AI,平均成绩为 76.7%,而 ChatGPT 的平均成绩为 47.4%。在 11.3% 的问题中,ChatGPT 的成绩高于学生的平均成绩,特别是在 AIS 和审计方面表现出色。然而,它在税务、财务和管理评估方面遇到了困难,可能是由于其在数学过程方面的困难。

ChatGPT 在真假题(68.7% 正确)和多选题(59.5%)方面表现更好,但在简答题(28.7% 至 39.1%)方面遇到了困难。它通常在高阶问题上遇到困难,有时会为错误答案提供权威的书面描述,或者以不同的方式回答同一个问题。

ChatGPT 在教育中的未来

尽管存在局限性,研究人员预计 GPT-4 将在会计问题上有所改进,并解决他们发现的问题。最有前途的方面是聊天机器人的潜力,它可以通过帮助设计和测试作业或草拟项目的一部分来增强教学和学习。

“这是一个颠覆,我们需要评估我们从这里去哪里,”研究共同作者和 BYU 会计教授 Melissa Larson 说。“当然,我仍然会有教学助理,但这将迫使我们以不同的方式使用它们。”

随着 AI 的不断进步,教育者必须适应并找到新的方法将这些技术融入他们的教学方法中。

Alex McFarland 是一名人工智能记者和作家,探索最新的人工智能发展。他曾与世界各地的众多人工智能初创公司和出版物合作。