网易首页 > 网易号 > 正文 申请入驻

人类依然掌握财权:研究显示 ChatGPT 在会计考试中不如大学生

0
分享至

IT之家 4 月 25 日消息,上个月,OpenAI 推出了最新的 AI 聊天机器人 GPT-4,并声称该机器人在各种考试中表现异常出色,比如律师考试,研究生入学考试等。然而,根据美国杨百翰大学领导的一项研究,ChatGPT 在会计考试中的表现远不及人类,甚至还会一本正经的胡说八道,为错误的答案辩解。

美国杨百翰大学的会计教授伍德和他的团队决定对 ChatGPT 进行一次测试,看看它能否回答大学会计课程的考题。他们在社交媒体上发起了一个号召,吸引了来自 14 个国家 186 所教育机构的 327 位合作者参与。他们共提供了 25181 道会计考题,涵盖了会计信息系统、审计、财务会计、管理会计和税务等领域。他们还邀请了 BYU 的本科生(包括伍德的女儿杰西卡)向 ChatGPT 输入了 2268 道教科书上的考题。

结果显示,ChatGPT 的表现虽然有亮点,但总体上还是不及学生水平。学生的平均分是 76.7%,而 ChatGPT 的平均分只有 47.4%。在 11.3% 的问题上,ChatGPT 的得分高于学生平均分,尤其是在会计信息系统和审计方面。但是,在税务、财务和管理方面,ChatGPT 就显得力不从心,可能是因为这些领域需要更多的数学运算能力。在问题类型上,ChatGPT 比较擅长判断题(68.7% 正确率)和选择题(59.5% 正确率),但是在简答题上就很吃力(正确率在 28.7% 到 39.1% 之间)。一般来说,对于需要更高层次思维的问题,ChatGPT 更难回答。有时候,ChatGPT 甚至会为错误答案提供权威的解释,或者对同一个问题给出不同的答案。

“它并不完美,你不能指望它能做所有事情。”杰西卡说,“仅仅依靠 ChatGPT 来学习是愚蠢的。”

IT之家注意到,研究人员还发现了一些其他有趣的现象:

  • ChatGPT 有时候不知道自己在做数学题,会犯一些荒谬的错误,比如在减法问题里加两个数,或者除法算错。

  • ChatGPT 经常会为自己的答案提供解释,即使它们是错误的。有时候,ChatGPT 的描述是正确的,但它却选择了错误的选项。

  • ChatGPT 有时候会编造事实。比如,在提供参考文献时,它会生成一个看起来真实的参考文献,但其实完全是虚构的,甚至有时候连作者都不存在。

尽管如此,研究人员相信,在未来的版本中,ChatGPT 会在会计问题上有所进步,并解决上述问题。他们认为最有前景的是,这款聊天机器人可以帮助改善教学和学习,比如设计和测试作业,或者用于草拟项目的部分内容。

“这是一个反思的机会,我们要看看我们是否在教授有价值的信息。”研究的合作者之一,BYU 的会计教授拉森说,“这是一种颠覆,我们需要评估我们接下来该怎么做。当然,我还是会有助教,但其工作内容会有所不同。”

这项研究发表在《会计教育问题》杂志上。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
2909亿身价有何用?97岁的李嘉诚无力回天,两个60岁儿子已成心病

2909亿身价有何用?97岁的李嘉诚无力回天,两个60岁儿子已成心病

归史
2025-08-27 14:29:47
华为官宣:9月26日,新机正式开售!

华为官宣:9月26日,新机正式开售!

科技堡垒
2025-09-13 10:49:11
戴维斯杯:中国队客场3-0击败爱尔兰,重返世界一组资格赛

戴维斯杯:中国队客场3-0击败爱尔兰,重返世界一组资格赛

直播吧
2025-09-15 08:36:14
一句话的信息量能大到什么程度?网友:万般皆是命,半点不由人

一句话的信息量能大到什么程度?网友:万般皆是命,半点不由人

解读热点事件
2025-09-14 00:10:03
脑梗谨记,早晨1大忌,中午2不要,晚上3不做

脑梗谨记,早晨1大忌,中午2不要,晚上3不做

医学原创故事会
2025-09-12 13:53:42
女儿的美艳闺蜜借住我家,她问我:“可以叫你爸爸吗?”我沦陷了

女儿的美艳闺蜜借住我家,她问我:“可以叫你爸爸吗?”我沦陷了

宅家伍菇凉
2023-12-30 13:40:33
金融监管总局、中国人民银行、中国证监会联合启动2025年金融教育宣传周活动

金融监管总局、中国人民银行、中国证监会联合启动2025年金融教育宣传周活动

证券时报
2025-09-15 16:24:07
戏子误国!这6位为了捞金“坑惨”老百姓,如今下场是咎由自取

戏子误国!这6位为了捞金“坑惨”老百姓,如今下场是咎由自取

小椰的奶奶
2025-09-15 16:09:27
“大幅降息”要来了?美联储,突发!

“大幅降息”要来了?美联储,突发!

每日经济新闻
2025-09-15 18:38:10
善恶到头终有报!如今58岁的那英,终于为自己的“张扬”付出代价

善恶到头终有报!如今58岁的那英,终于为自己的“张扬”付出代价

一针见娱
2025-09-11 18:02:13
一个花卷33,一碗豆腐汤要69,贵到离谱的西贝,为什么总是挤满人

一个花卷33,一碗豆腐汤要69,贵到离谱的西贝,为什么总是挤满人

北纬的咖啡豆
2025-09-13 19:14:42
巴特尔二女儿结婚,没彩礼嫁妆,老公是葡萄牙富豪,他却晚年孤独

巴特尔二女儿结婚,没彩礼嫁妆,老公是葡萄牙富豪,他却晚年孤独

喜欢历史的阿繁
2025-09-15 16:05:10
美国务卿对黄岩岛国家级自然保护区说三道四,外交部:奉劝美方还南海清净太平

美国务卿对黄岩岛国家级自然保护区说三道四,外交部:奉劝美方还南海清净太平

澎湃新闻
2025-09-15 15:42:42
不能再忽悠印度了,外资下跌99%,国家级杀猪盘反被宰。

不能再忽悠印度了,外资下跌99%,国家级杀猪盘反被宰。

西方寻史
2025-09-15 17:25:50
多项数据位居同类第一,算力ETF——5G通信ETF(515050)回调布局机会受关注

多项数据位居同类第一,算力ETF——5G通信ETF(515050)回调布局机会受关注

界面新闻
2025-09-15 11:15:57
甘肃:暴雨+山洪预警齐发,兰州:沙尘将至

甘肃:暴雨+山洪预警齐发,兰州:沙尘将至

鲁中晨报
2025-09-15 14:15:07
重大转变:特朗普首次称普京为侵略者

重大转变:特朗普首次称普京为侵略者

微微热评
2025-09-15 21:43:30
天津女排有远见!全队将出国热身,李盈莹在列,对手名单曝光

天津女排有远见!全队将出国热身,李盈莹在列,对手名单曝光

跑者排球视角
2025-09-15 23:48:49
原来他早已经去世,患病后仍坚持拍戏,临走前放心不下的还是妻儿

原来他早已经去世,患病后仍坚持拍戏,临走前放心不下的还是妻儿

乡野小珥
2025-09-16 00:16:59
这种国家才配叫铁哥们!欠中国81亿全额还清,附赠百亿能源大礼!

这种国家才配叫铁哥们!欠中国81亿全额还清,附赠百亿能源大礼!

基斯默默
2025-09-15 12:04:03
2025-09-16 06:03:00
IT之家
IT之家
爱科技,爱这里 - 前沿科技人气平台
306011文章数 606545关注度
往期回顾 全部

科技要闻

官方:英伟达违反反垄断法 将施进一步调查

头条要闻

中美就妥善解决TikTok问题达成基本框架共识

头条要闻

中美就妥善解决TikTok问题达成基本框架共识

体育要闻

诺维茨基退役十年后,德国篮球走向巅峰

娱乐要闻

60岁张曼玉定居法国:瘦成皮包骨?

财经要闻

华与华秒怂 罗永浩称已接到对方道歉

汽车要闻

后轮转向和5C 2026款梦想家把想到的都给了

态度原创

教育
健康
旅游
公开课
军事航空

教育要闻

十五岁为什么非常重要天才不是越小越可喜而是这一年最关键

内分泌科专家破解身高八大谣言

旅游要闻

热闻|清明假期将至,热门目的地有哪些?

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

三人伪装"外卖员""钓鱼佬"窃取军事秘密 详情公布

无障碍浏览 进入关怀版