Trí tuệ nhân tạo
ChatGPT của OpenAI đối mặt với kỳ thi kế toán tại trường đại học

OpenAI gần đây đã ra mắt trình chatbot AI đột phá của mình, GPT-4, đã gây sóng gió trong các lĩnh vực khác nhau. Với điểm số thuộc phần trăm 90 trên kỳ thi luật sư, vượt qua 13 trên 15 kỳ thi AP và đạt điểm gần hoàn hảo trên kỳ thi GRE Verbal, hiệu suất của GPT-4 không gì ngắn hơn là phi thường.
Các nhà nghiên cứu tại Đại học Brigham Young (BYU) và 186 trường đại học khác tò mò về việc công nghệ của OpenAI sẽ hoạt động như thế nào trên các kỳ thi kế toán. Họ đã thử nghiệm phiên bản gốc, ChatGPT, và phát hiện ra rằng mặc dù vẫn còn chỗ để cải thiện trong lĩnh vực kế toán, công nghệ này là một yếu tố thay đổi trò chơi sẽ ảnh hưởng tích cực đến cách giáo dục được cung cấp và nhận.
Kể từ khi ra mắt vào tháng 11 năm 2022, ChatGPT đã trở thành nền tảng công nghệ phát triển nhanh nhất từ trước đến nay, đạt 100 triệu người dùng trong dưới hai tháng. Trong bối cảnh cuộc tranh luận đang diễn ra về vai trò của các mô hình AI như ChatGPT trong giáo dục, tác giả chính của nghiên cứu David Wood, giáo sư kế toán tại BYU, đã quyết định tuyển dụng càng nhiều giáo sư càng tốt để đánh giá hiệu suất của AI so với sinh viên kế toán thực tế tại trường đại học.
ChatGPT so với sinh viên trên kỳ thi kế toán
Nghiên cứu liên quan đến 327 đồng tác giả từ 186 cơ sở giáo dục trên 14 quốc gia, những người đã đóng góp 25.181 câu hỏi thi kế toán trên lớp. Sinh viên đại học BYU cũng cung cấp 2.268 câu hỏi từ ngân hàng đề thi sách giáo khoa. Các câu hỏi bao gồm các lĩnh vực kế toán khác nhau, chẳng hạn như hệ thống thông tin kế toán (AIS), kiểm toán, kế toán tài chính, kế toán quản trị và thuế. Chúng cũng khác nhau về mức độ khó và loại.
Mặc dù hiệu suất của ChatGPT rất ấn tượng, sinh viên đã vượt qua AI, với điểm trung bình là 76,7% so với 47,4% của ChatGPT. Trên 11,3% câu hỏi, ChatGPT đạt điểm cao hơn điểm trung bình của sinh viên, đặc biệt là xuất sắc trong AIS và kiểm toán. Tuy nhiên, nó gặp khó khăn với thuế, tài chính và đánh giá quản trị, có thể do sự khó khăn với các quá trình toán học.
ChatGPT hoạt động tốt hơn trên các câu hỏi đúng / sai (68,7% đúng) và các câu hỏi trắc nghiệm (59,5%) nhưng gặp khó khăn với các câu hỏi trả lời ngắn (28,7% đến 39,1%). Nó thường gặp khó khăn với các câu hỏi cấp cao, đôi khi cung cấp các mô tả viết có thẩm quyền cho các câu trả lời không chính xác hoặc trả lời cùng một câu hỏi theo các cách khác nhau.
Tương lai của ChatGPT trong giáo dục
Mặc dù có những hạn chế, các nhà nghiên cứu dự đoán rằng GPT-4 sẽ cải thiện trên các câu hỏi kế toán và giải quyết các vấn đề họ đã phát hiện. Khía cạnh hứa hẹn nhất là khả năng của trình chatbot này trong việc nâng cao việc giảng dạy và học tập, chẳng hạn như giúp thiết kế và kiểm tra bài tập hoặc soạn thảo các phần của một dự án.
“Đây là một sự gián đoạn, và chúng tôi cần đánh giá nơi chúng tôi đi từ đây,” tác giả nghiên cứu cùng Melissa Larson, giáo sư kế toán tại BYU cho biết. “Tất nhiên, tôi vẫn sẽ có các trợ lý, nhưng điều này sẽ buộc chúng tôi phải sử dụng chúng theo các cách khác nhau.”
Khi AI tiếp tục phát triển, các nhà giáo dục phải thích nghi và tìm ra các cách mới để kết hợp những công nghệ này vào phương pháp giảng dạy của họ.












