Connect with us

Kunstig intelligens

OpenAI’s ChatGPT Tager Universitetsregnskabsprøver

mm

OpenAI har nyligt lanceret sin banebrydende AI-chatbot, GPT-4, som har skabt bølger i forskellige fag. Med en 90. percentil score på bar-examen, bestået 13 af 15 AP-eksamener og scoret næsten perfekt på GRE Verbal-testen, har GPT-4’s præstation været intet mindre end ekstraordinær.

Forskere ved Brigham Young University (BYU) og 186 andre universiteter var nysgerrige efter at se, hvordan OpenAI’s teknologi ville klare sig på regnskabsprøver. De testede den originale version, ChatGPT, og fandt, at selv om der stadig er plads til forbedring på regnskabsområdet, er teknologien en game-changer, der vil have en positiv indvirkning på, hvordan uddannelse leveres og modtages.

Siden sin debut i november 2022 er ChatGPT blevet den hurtigst voksende teknologi-platform nogensinde, og har nået 100 millioner brugere på under to måneder. I lyset af den pågående debat om AI-modellers rolle i uddannelse, besluttede lead studie-forfatter David Wood, en BYU-professor i regnskab, at rekruttere så mange professorer som muligt for at evaluere AI’s præstation i forhold til virkelige universitetsstuderende i regnskab.

ChatGPT vs. Studerende på Regnskabsprøver

Forskningen involverede 327 medforfattere fra 186 uddannelsesinstitutioner i 14 lande, som bidrog med 25.181 klasserum-regnskabsprøvespørgsmål. BYU-undergraduates leverede også 2.268 lærebog-testbank-spørgsmål. Spørgsmålene dækkede forskellige regnskabs-underfag, såsom regnskabsinformationssystemer (AIS), revision, finansielt regnskab, ledelsesregnskab og skat. De varierede også i sværhedsgrad og type.

Selv om ChatGPT’s præstation var imponerende, klarede studerende sig bedre end AI’en, med en gennemsnitlig score på 76,7% i forhold til ChatGPT’s 47,4%. På 11,3% af spørgsmålene scorede ChatGPT højere end gennemsnittet for studerende, især i AIS og revision. Men det havde svært ved skat, finansielle og ledelsesmæssige vurderinger, muligvis på grund af dens svigt i matematiske processer.

ChatGPT klarede sig bedre på sand/falske spørgsmål (68,7% korrekt) og multiple-choice-spørgsmål (59,5%), men havde svært ved at besvare kort-svar-spørgsmål (28,7% til 39,1%). Det havde generelt svært ved højere-ordenens spørgsmål, og gav undertiden autoritative skriftlige beskrivelser for forkerte svar eller besvarede det samme spørgsmål på forskellige måder.

ChatGPT’s Fremtid i Uddannelse

Trods dens begrænsninger forventer forskerne, at GPT-4 vil forbedre sig på regnskabsspørgsmål og løse de problemer, de opdagede. Det mest lovende aspekt er chatbot’ens potentiale til at forbedre undervisning og læring, såsom at hjælpe med at designe og teste opgaver eller udarbejde dele af et projekt.

“Dette er en disruption, og vi må vurdere, hvor vi skal gå herefter,” sagde studie-medforfatter og fellow BYU-regnskabsprofessor Melissa Larson. “Selvfølgelig vil jeg stadig have TAs, men dette vil tvinge os til at bruge dem på forskellige måder.”

Da AI fortsætter med at avancere, må uddannelsesinstitutioner tilpasse sig og finde nye måder at inkorporere disse teknologier i deres undervisningsmetoder.

Alex McFarland er en AI-journalist og forfatter, der udforsker de seneste udviklinger inden for kunstig intelligens. Han har samarbejdet med talrige AI-startups og publikationer verden over.