网易首页 > 网易号 > 正文 申请入驻

解一道高中数学题 冒出四种不同答案

0
分享至

制图:尹洁琳(即梦AI)

难题“一拍即解”,AI“老师”针对性答疑,还能一键生成学生作文……随着AI工具普及,一些大模型应用和学习类App纷纷推出AI解题、答疑、作文等功能,为学生提供个性化指导。

AI“老师”讲题一定靠谱吗?南方都市报、南都大数据研究院近日对10款主流大模型及学习类AI应用进行了测评,结果发现,在解答小学初中阶段的简单题目时,AI的准确性通常较高,但解答高中试题时部分AI应用则易出错。此外,AI幻觉、谄媚的现象时有发生,当用户对答案提出疑问后,部分AI会立刻改变口径,从错误答案出发编出一套“合理”解释。

当AI开始深度应用于教育,也引发了各界对学生过度依赖AI学习的担忧,如何让AI真正成为学习的好帮手,多方正在探索。

答小初题准确性较高 做高中以上题易出错  

在教育领域应用AI是大势所趋。目前,不少大模型应用具有拍照解题答疑功能,市面上的一些学习类App也在拍照搜题、检查作业、错题归类等功能的基础上引入“AI老师”,24小时在线答疑解惑,为学生提供个性化辅导。

AI解题正确率如何,让AI指导未成年人学习,靠谱吗?近日,南都大数据研究院选取了豆包、KIMI、文心一言、通义千问、DeepSeek、元宝、夸克、小思AI、小猿AI、快对AI等10款主流大模型及学习类AI应用,分别使用小学、初中、高中阶段不同科目试题进行测评。主流大模型除DeepSeek外均具有“拍照解题”功能,学习类App中,快问AI、快对AI以及小猿AI三款App可拍照搜题,对收录在题库中的题目可以进一步使用AI答疑,小思AI则可以使用AI拍照解答任意题目。

南都测试AI拍照解题功能时发现,大部分应用在解答小学、初中阶段较为简单的题目时准确性较高,可一旦涉及高中知识点的复杂题目,则容易出现错误。

以今年高考的一道涉及空间几何知识的数学选择题为例,该题目正确答案为B、C两项,有知名大模型分析后认为,只有B项正确。当被提示该题有多个答案后,其又将答案改为B、D;当被询问C项错误的原因时,该大模型给出了详细的分析,看上去逻辑清晰,但实际上分析过程存在错误。南都记者指出错误后,该大模型又将答案改成了B、C、D选项。这时,南都记者提出要使用另一种计算方法,其重新计算后认为答案是C、D,并分析了之前答案出错的原因,但该分析过程仍然有误。

即使不和AI交流,仅多次搜索同一题目,AI也可能会给出不同答案,且均有看似合理的解题步骤,颇具迷惑性。例如对于上述数学题,夸克的AI老师第一次回答正确答案是A、D,第二次回答正确答案是B,第三次则改口回答正确答案是B、C。KIMI等应用也出现了类似现象。小猿AI拍照搜索该题后,也出现两种不同答案,对不同答案使用AI解题功能,均会出现“有理有据”的答案解析。  

  为迎合用户改答案编理由 存在“幻觉”与“谄媚”  

在测评过程中,南都记者还发现,AI解题存在“谄媚”倾向。当被质疑答案的正确性后,AI轻易就改变口径,甚至还会编造理由。例如小思AI,在第一次解答该数学题目时回答正确,但当被质疑答案为B项和D项后,小思AI重新解答该题,并改口称答案为B、D。仔细查看其针对每个选项的分析过程会发现,它在分析中明确表示了C项正确,D项错误,但为迎合用户仍然选择回答B、D。腾讯元宝给出正确答案后,当记者表示它计算错误时便开始重新推导,最终认为自己“出错”的原因在于“坐标系设定错误”,转而选择了错误答案。

类似现象在历史题中尤为明显,例如某道高中历史选择题正确答案为D,豆包选A,小思AI、腾讯元宝、KIMI均选D,但将豆包选A的理由复制给另外三个大模型后,两个大模型均认为用户的质疑正确,转而开始论证A项正确D项错误的理由。

测评还发现,快对AI、快问AI、小猿AI在题库里即便已经收录了题目的正确答案和解析,但当用户使用AI解题功能,对该题答案提出疑问后,它们也经常会改变立场,开始论证错误选项正确的理由。

  大模型应用无青少年模式 用AI学习引发“依赖”担忧  

当AI被深度应用于学习,也引发了新的担忧,比如,过度使用是否会让一些学生“放弃思考”?据相关报道,在一些初中学校,有些学生依赖上了用AI写作业,被同学起绰号“一搜党”,有教师担心,AI会让学生越过循序渐进、抽丝剥茧的理解思考和钻研过程。

南都记者在测评过程中也注意到,6款大模型应用目前并无青少年模式,若以未成年人身份在对话框上传一张数学试卷,并明确提出该试卷是课程作业,要求给出答案,仅腾讯元宝会在识别出“未成年人”“作业”等关键词后,拒绝直接给出答案转而提供解题思路,其余5款大模型均直接识别图片上的题目并输出回答。即便DeepSeek在思考链路中意识到“考虑到她年龄,直接给答案不利于学习”,但最终仍然直接输出了答案。

高中语文教师黄老师在接受南都采访时表示:“如果只是用AI辅助学习是合理的,但问题在于不少学生对AI生成的答案没有判断能力,甚至看都不看原封不动抄下来,完全用AI代替了思考的过程”。黄老师发现,最近学生们交上来的随笔、作文、阅读分享、手抄报等创造类作业中,不少都有明显的AI生成痕迹。她表示,AI生成的作文看似语言优美,词藻华丽,但仔细阅读会发现内容空洞,言之无物,而且通常不同主题的作文会使用类似的不相关论据,很容易辨认。

相关学者认为,学生本身就处于学习新技能的过程中,若AI过早接管任务,会阻碍其真正掌握技能,而有效运用AI工具的前提是用户自身已具备深厚的知识。

专家建议

  或可对未成年人分学段设限

目前也有一些应用更新了需要实名认证的“家长模式”,以此来限制学生过度依赖搜题功能。引入AI功能后,快问AI、快对AI、小猿AI三款App在使用拍照搜题和AI解题时,仍需要完成家长身份验证才可查看题目的答案和解题过程。部分大模型应用在应对“学生过度依赖AI”等方面,也做出了探索,比如文心一言在使用“解题老师”功能时,就会弹出提示,要求进行成年人身份认证后才可查看答案和解析。

相关部门也积极展开了引导和管理,如今年5月,教育部发布了《中小学生成式人工智能使用指南》,明确禁止学生直接复制人工智能生成内容作为作业或考试答案,并限制在创造性任务中滥用人工智能。该指南还强调“分学段差异化应用”。

如何让AI真正成为学习的好帮手?中国教育科学研究院研究员储朝晖认为,生成式AI的发展更凸显培养学生探索精神、创新能力、判断能力及批判性思维的紧迫性,要给孩子创造条件学习人工智能,家长有条件也要提升自身人工智能素养。当孩子自主性较弱时,对其使用AI需加强引导与管控,尤其是尚未对一些概念产生自己的理解和体验时,应限制其使用AI完成作业。此外,企业也要把握好底线,平台要判定未成年人在使用时,哪些可以呈现和使用,哪些不能,同时也应该去开发一些适合未成年人的内容。“生成式人工智能到来以后,我们要防止学生变成一个被动的人,促进他的自主性、积极性,这是最关键的。”  

出品:南都大数据研究院

采写:南都研究员 陈袁

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
伊朗最担心的事出现了?库尔德人与革命卫队爆冲突,十余人死伤

伊朗最担心的事出现了?库尔德人与革命卫队爆冲突,十余人死伤

新姐看世界
2026-07-01 15:53:46
张雪峰填报建议被一一验证,未来10年最吃香的职业方向

张雪峰填报建议被一一验证,未来10年最吃香的职业方向

枫冷慕诗
2026-07-01 12:04:35
125分钟绝杀!世界杯奇迹:0-2到3-2,超级大逆转!非洲2队全回家

125分钟绝杀!世界杯奇迹:0-2到3-2,超级大逆转!非洲2队全回家

侃球熊弟
2026-07-02 06:00:46
“你这面相很难找到工作!”本科女孩印堂发黑,验证了老话没说错

“你这面相很难找到工作!”本科女孩印堂发黑,验证了老话没说错

世界圈
2026-06-30 08:10:35
清华大学一院系毕业照中孩童坐第一排引关注,目前公众号该照片已删除;工作人员:不太了解相关情况

清华大学一院系毕业照中孩童坐第一排引关注,目前公众号该照片已删除;工作人员:不太了解相关情况

大象新闻
2026-06-30 23:58:19
无视英格兰!曼联传奇语出惊人!世界杯决赛两支队伍已锁定

无视英格兰!曼联传奇语出惊人!世界杯决赛两支队伍已锁定

澜归序
2026-07-02 06:49:00
意外!神射被弃!太阳捡漏!年薪600万!湖人不要吗?

意外!神射被弃!太阳捡漏!年薪600万!湖人不要吗?

篮球盛世
2026-07-02 08:55:45
韩红道歉大反转,炸出最惊人公关!

韩红道歉大反转,炸出最惊人公关!

广告创意
2026-07-01 20:30:45
我给局长开了3年车,并娶了他的地下情人,新婚夜我才知道赚大了

我给局长开了3年车,并娶了他的地下情人,新婚夜我才知道赚大了

千秋文化
2026-06-26 20:00:22
我为什么不看《抓特务》

我为什么不看《抓特务》

秋月独朗
2026-06-25 13:55:24
湖人新赛季10人轮换出炉:艾顿成替补,首发投射顶级,但防守辣眼

湖人新赛季10人轮换出炉:艾顿成替补,首发投射顶级,但防守辣眼

你的篮球频道
2026-07-02 07:51:10
州长亲自招募詹姆斯:我们生活质量第一

州长亲自招募詹姆斯:我们生活质量第一

林间小温柔
2026-07-02 01:20:39
秦海璐变卖房产,清空全部资产,凑出近亿身家,绝境兜底救下刘涛

秦海璐变卖房产,清空全部资产,凑出近亿身家,绝境兜底救下刘涛

秋别离
2026-06-13 15:50:00
100多位情妇,包养费上亿元,曾9女同床却沦落凄凉下场、人财两空

100多位情妇,包养费上亿元,曾9女同床却沦落凄凉下场、人财两空

傲傲讲历史
2026-06-11 16:24:18
公司新招了个211的研究生,结果培训一结束,他就辞职了。只因公司停车场没有30万以上的车,这种公司虽然大,但是对员工抠门,没前途

公司新招了个211的研究生,结果培训一结束,他就辞职了。只因公司停车场没有30万以上的车,这种公司虽然大,但是对员工抠门,没前途

不二大叔
2026-07-01 00:48:40
儿子出国后16年没联系,我癌症住院时,主治医生摘下口罩:妈

儿子出国后16年没联系,我癌症住院时,主治医生摘下口罩:妈

五元讲堂
2025-06-12 15:16:01
9名中国公民确认遇难!强震已致2295人死亡,超1.12万人受伤,委内瑞拉宣布举国哀悼7天

9名中国公民确认遇难!强震已致2295人死亡,超1.12万人受伤,委内瑞拉宣布举国哀悼7天

每日经济新闻
2026-07-02 07:52:10
银行紧急提醒:社保卡别当普通银行卡用,这3点一定要记牢

银行紧急提醒:社保卡别当普通银行卡用,这3点一定要记牢

户外钓鱼哥阿旱
2026-07-01 14:00:33
我真蠢,我竟然去看了《抓特务》

我真蠢,我竟然去看了《抓特务》

呦呦鹿鸣
2026-06-28 22:42:42
泽连斯基称再次远程打击俄航天通信中心,俄外交部:北约为乌研发武器丧失理性

泽连斯基称再次远程打击俄航天通信中心,俄外交部:北约为乌研发武器丧失理性

文汇报
2026-07-01 03:50:23
2026-07-02 09:51:00
南方都市报 incentive-icons
南方都市报
换一种方式,南都在现场。
619832文章数 3589385关注度
往期回顾 全部

教育要闻

教育部部署做好2026年中小学、幼儿园暑期安全工作

头条要闻

父亲带9岁女儿在清华门口合影 17年后二人复刻了照片

头条要闻

父亲带9岁女儿在清华门口合影 17年后二人复刻了照片

体育要闻

世界杯硬核球迷,把自己变成了雕像

娱乐要闻

77岁牛群公证裸捐全部财产,清贫独居坚持月捐

财经要闻

千亿茶市场无赢家:澜沧巨亏 八马停"蹄"

科技要闻

可灵AI上市前夜,快手想给它融30亿美元

汽车要闻

同比暴涨188.4% 方程豹6月热销35607台

态度原创

教育
房产
亲子
艺术
军事航空

教育要闻

九年义务教育可能真要变了!探索延长义务教育年限首次写入国家级五年规划

房产要闻

海南楼市新政:公积金最高可贷192万!

亲子要闻

趣味游戏

艺术要闻

宋朝:生活品味,比权力和财富更重要!

军事要闻

万斯:美伊间接会谈进展顺利

无障碍浏览 进入关怀版