网易首页 > 网易号 > 正文 申请入驻

人类依然掌握财权:研究显示 ChatGPT 在会计考试中不如大学生

0
分享至

IT之家 4 月 25 日消息,上个月,OpenAI 推出了最新的 AI 聊天机器人 GPT-4,并声称该机器人在各种考试中表现异常出色,比如律师考试,研究生入学考试等。然而,根据美国杨百翰大学领导的一项研究,ChatGPT 在会计考试中的表现远不及人类,甚至还会一本正经的胡说八道,为错误的答案辩解。

美国杨百翰大学的会计教授伍德和他的团队决定对 ChatGPT 进行一次测试,看看它能否回答大学会计课程的考题。他们在社交媒体上发起了一个号召,吸引了来自 14 个国家 186 所教育机构的 327 位合作者参与。他们共提供了 25181 道会计考题,涵盖了会计信息系统、审计、财务会计、管理会计和税务等领域。他们还邀请了 BYU 的本科生(包括伍德的女儿杰西卡)向 ChatGPT 输入了 2268 道教科书上的考题。

结果显示,ChatGPT 的表现虽然有亮点,但总体上还是不及学生水平。学生的平均分是 76.7%,而 ChatGPT 的平均分只有 47.4%。在 11.3% 的问题上,ChatGPT 的得分高于学生平均分,尤其是在会计信息系统和审计方面。但是,在税务、财务和管理方面,ChatGPT 就显得力不从心,可能是因为这些领域需要更多的数学运算能力。在问题类型上,ChatGPT 比较擅长判断题(68.7% 正确率)和选择题(59.5% 正确率),但是在简答题上就很吃力(正确率在 28.7% 到 39.1% 之间)。一般来说,对于需要更高层次思维的问题,ChatGPT 更难回答。有时候,ChatGPT 甚至会为错误答案提供权威的解释,或者对同一个问题给出不同的答案。

“它并不完美,你不能指望它能做所有事情。”杰西卡说,“仅仅依靠 ChatGPT 来学习是愚蠢的。”

IT之家注意到,研究人员还发现了一些其他有趣的现象:

  • ChatGPT 有时候不知道自己在做数学题,会犯一些荒谬的错误,比如在减法问题里加两个数,或者除法算错。

  • ChatGPT 经常会为自己的答案提供解释,即使它们是错误的。有时候,ChatGPT 的描述是正确的,但它却选择了错误的选项。

  • ChatGPT 有时候会编造事实。比如,在提供参考文献时,它会生成一个看起来真实的参考文献,但其实完全是虚构的,甚至有时候连作者都不存在。

尽管如此,研究人员相信,在未来的版本中,ChatGPT 会在会计问题上有所进步,并解决上述问题。他们认为最有前景的是,这款聊天机器人可以帮助改善教学和学习,比如设计和测试作业,或者用于草拟项目的部分内容。

“这是一个反思的机会,我们要看看我们是否在教授有价值的信息。”研究的合作者之一,BYU 的会计教授拉森说,“这是一种颠覆,我们需要评估我们接下来该怎么做。当然,我还是会有助教,但其工作内容会有所不同。”

这项研究发表在《会计教育问题》杂志上。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
杨瀚森自信一幕!进半场神奇三分为自己竖起大拇指 用英文说完美

杨瀚森自信一幕!进半场神奇三分为自己竖起大拇指 用英文说完美

罗说NBA
2025-11-08 10:30:21
经不起查!长沙医生不雅视频升级,网传两人6个月共同出差27次…

经不起查!长沙医生不雅视频升级,网传两人6个月共同出差27次…

火山诗话
2025-11-07 13:42:14
湖南母亲送儿子18岁成人礼物,被丈夫回家看见后,酿成一场悲剧

湖南母亲送儿子18岁成人礼物,被丈夫回家看见后,酿成一场悲剧

晓艾故事汇
2024-10-29 20:58:22
危险!中国神二十还未返航,太空出现大量不速之客,航天员该咋办

危险!中国神二十还未返航,太空出现大量不速之客,航天员该咋办

趣文说娱
2025-10-29 15:27:34
115岁的李陈氏,出生于清朝的“老宝贝”|面孔

115岁的李陈氏,出生于清朝的“老宝贝”|面孔

大象新闻
2025-11-09 09:38:06
重庆北碚区划调整情况通报会举行,区委书记:实现国家战略下的“再生长”

重庆北碚区划调整情况通报会举行,区委书记:实现国家战略下的“再生长”

澎湃新闻
2025-11-08 13:32:27
23年是联盟倒数第一!现在成东部第一,新版坏孩子军团,防守太硬

23年是联盟倒数第一!现在成东部第一,新版坏孩子军团,防守太硬

你的篮球频道
2025-11-09 07:52:04
年薪5400万,场均19分4助攻!知道你尽力了,但确实也在拖累球队

年薪5400万,场均19分4助攻!知道你尽力了,但确实也在拖累球队

老梁体育漫谈
2025-11-09 00:46:45
三星Galaxy S26标准版手机线稿曝光:6.9mm厚度,比S25更薄

三星Galaxy S26标准版手机线稿曝光:6.9mm厚度,比S25更薄

IT之家
2025-11-08 23:02:07
鲁比奥被大陆排除在外,美却替台当局说情:台湾地区必须赴陆参会

鲁比奥被大陆排除在外,美却替台当局说情:台湾地区必须赴陆参会

阿七说史
2025-11-08 08:56:25
爆大冷!WTA年终总决赛:莱巴金娜2-0萨巴全胜夺冠,狂揽巨额奖金

爆大冷!WTA年终总决赛:莱巴金娜2-0萨巴全胜夺冠,狂揽巨额奖金

小彭美识
2025-11-09 09:32:23
狂胜浙江28分粤迷仍不满意!广东最大混子揪出,不上你早赢37分了

狂胜浙江28分粤迷仍不满意!广东最大混子揪出,不上你早赢37分了

后仰大风车
2025-11-09 08:10:05
中甲联赛落幕!诞生4个赢家,3个输家!铜梁龙、广州豹位列其中

中甲联赛落幕!诞生4个赢家,3个输家!铜梁龙、广州豹位列其中

小火箭爱体育
2025-11-08 16:56:15
那么优秀的曾医生,为什么会如此主动呢

那么优秀的曾医生,为什么会如此主动呢

大张的自留地
2025-11-08 14:39:50
燃爆!台积电发巨额奖金!黄仁勋:我需要更多晶圆!魏哲家:3纳米扩产50%、盈利年年新高!员工:双11买爆!

燃爆!台积电发巨额奖金!黄仁勋:我需要更多晶圆!魏哲家:3纳米扩产50%、盈利年年新高!员工:双11买爆!

芯榜
2025-11-09 08:22:41
张国荣真正死因曝光!向太:根本没抑郁症,本来能活,男友不让救

张国荣真正死因曝光!向太:根本没抑郁症,本来能活,男友不让救

八斗小先生
2025-09-08 14:05:28
想不到吧,表面呆板木讷的石破茂,竟是日本近十年三观最正的首相

想不到吧,表面呆板木讷的石破茂,竟是日本近十年三观最正的首相

议纪史
2025-11-07 12:15:03
可控核聚变+科技赛道十大主线+储能+最具稀缺性的全球级龙头等

可控核聚变+科技赛道十大主线+储能+最具稀缺性的全球级龙头等

牛锅巴小钒
2025-11-08 09:42:04
“三资三化”最后谁买单?从淤泥拍卖看国有资源盘活的狂欢与隐忧

“三资三化”最后谁买单?从淤泥拍卖看国有资源盘活的狂欢与隐忧

细雨中的呼喊
2025-11-01 00:24:05
副院长与眼科主任,两个月前办公室的一次关系!

副院长与眼科主任,两个月前办公室的一次关系!

闲侃闲侃
2025-11-07 08:25:25
2025-11-09 10:23:00
IT之家
IT之家
爱科技,爱这里 - 前沿科技人气平台
314195文章数 606722关注度
往期回顾 全部

科技要闻

黄仁勋亲赴台积电“讨要更多芯片”

头条要闻

牛弹琴:欧洲议会故意挑衅中国触犯红线 中国很愤怒

头条要闻

牛弹琴:欧洲议会故意挑衅中国触犯红线 中国很愤怒

体育要闻

马刺绞赢火箭,不靠文班亚马?

娱乐要闻

古二再度放料!秦雯王家卫吐槽出现新人物

财经要闻

小马、文远回港上市 但自动驾驶还没赢家

汽车要闻

钛7月销破2万 霜雾灰与青峦翠配色正式开启交付

态度原创

游戏
数码
旅游
公开课
军事航空

盘点《穿越火线》生化模式垫底的武器,真不怪他们想摆烂

数码要闻

荣耀亲选耳夹式耳机2 Pro曝光:金线充电盒加持,支持空间音频

旅游要闻

回龙观菩萨庙活化升级 昌平再添一处年轻态公共文化空间

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

福建舰常驻地为三亚军港

无障碍浏览 进入关怀版