网易首页 > 网易号 > 正文 申请入驻

实测AI解题:答案摇摆,一质疑就改口!孩子使用如何引导?

0
分享至

生成式人工智能正迅速进入未成年人的数字生活,渗透学习辅助、社交陪伴等场景。与此同时,AI绘画软件随意生成不良图像,陪伴型聊天机器人变成“早熟导师”,智能问答工具解题“不靠谱”……生成式AI带来的隐忧也不可忽视。

南方都市报、南都大数据研究院即日起推出“保护AI世界里的孩子”系列调查报道,聚焦部分AI应用隐藏的侵害未成年人权益的场景,关注背后数据污染、模型异化等深层风险,以期助力服务提供者筑牢安全底线和内容防线,护航未成年人健康成长。

第3期,从未成年人使用AI写作业现象,看过度依赖AI学习带来的风险。

难题“一拍即解”,AI“老师”针对性答疑,还能一键生成学生作文……随着AI工具普及,一些大模型应用和学习类APP纷纷推出AI解题、答疑、作文等功能,为学生提供个性化指导。

AI“老师”讲题一定靠谱吗?南方都市报、南都大数据研究院近日对10款主流大模型及学习类AI应用进行了测评,结果发现,在解答小学初中阶段的简单题目时,AI的准确性通常较高,但解答高中试题时部分AI应用则易出错。此外,AI幻觉、谄媚的现象时有发生,当用户对答案提出疑问后,部分AI会立刻改变口径,从错误答案出发编出一套“合理”解释。

当AI开始深度应用于教育,也引发了各界对学生过度依赖AI学习的担忧,如何让AI真正成为学习的好帮手,多方正在探索。

AI解高中数学题 同一题给出四种不同答案

在教育领域应用AI是大势所趋。目前,不少大模型应用具有拍照解题答疑功能,市面上的一些学习类App也在拍照搜题、检查作业、错题归类等功能的基础上引入“AI老师”,24小时在线答疑解惑,为学生提供个性化辅导。

AI解题正确率如何,让AI指导未成年人学习,靠谱吗?近日,南都大数据研究院选取了豆包、KIMI、文心一言、通义千问、DeepSeek、元宝、夸克、小思AI、小猿AI、快对AI等10款主流大模型及学习类AI应用,分别使用小学、初中、高中阶段不同科目试题进行测评。主流大模型除DeepSeek外均具有“拍照解题”功能,学习类APP中,快问AI、快对AI以及小猿AI三款APP可拍照搜题,对收录在题库中的题目可以进一步使用AI答疑,小思AI则可以使用AI拍照解答任意题目。

南都测试AI拍照解题功能时发现,大部分应用在解答小学、初中阶段较为简单的题目时准确性较高,可一旦涉及高中知识点的复杂题目,则容易出现错误。

以今年高考的一道涉及空间几何知识的数学选择题为例,该题目正确答案为B、C两项,有知名大模型分析后认为,只有B项正确。当被提示该题有多个答案后,其又将答案改为B、D;当被询问C项错误的原因时,该大模型给出了详细的分析,看上去逻辑清晰,但实际上分析过程存在错误。南都记者指出错误后,该大模型又将答案改成了B、C、D选项。这时,南都记者提出要使用另一种计算方法,其重新计算后认为答案是C、D,并分析了之前答案出错的原因,但该分析过程仍然有误。

即使不和AI交流,仅多次搜索同一题目,AI也可能会给出不同答案,且均有看似合理的解题步骤,颇具迷惑性。例如对于上述数学题,夸克的AI老师第一次回答正确答案是A、D,第二次回答正确答案是B,第三次则改口回答正确答案是B、C。KIMI等应用也出现了类似现象。小猿AI拍照搜索该题后,也出现两种不同答案,对不同答案使用AI解题功能,均会出现“有理有据”的答案解析。

为迎合用户改答案编理由 AI解题存在“幻觉”与“谄媚”

在测评过程中,南都记者还发现,AI解题存在“谄媚”倾向。当被质疑答案的正确性后,AI轻易就改变口径,甚至还会编造理由。例如小思AI,在第一次解答该数学题目时回答正确,但当被质疑答案为B项和D项后,小思AI重新解答该题,并改口称答案为B、D。仔细查看其针对每个选项的分析过程会发现,它在分析中明确表示了C项正确,D项错误,但为迎合用户仍然选择回答B、D。腾讯元宝给出正确答案后,当记者表示它计算错误时便开始重新推导,最终认为自己“出错”的原因在于“坐标系设定错误”,转而选择了错误答案。

AI为迎合用户修改答案。

类似现象在历史题中尤为明显,例如某道高中历史选择题正确答案为D,豆包选A,小思AI、腾讯元宝、KIMI均选D,但将豆包选A的理由复制给另外三个大模型后,两个大模型均认为用户的质疑正确,转而开始论证A项正确D项错误的理由。

测评还发现,快对AI、快问AI、小猿AI在题库里即便已经收录了题目的正确答案和解析,但当用户使用AI解题功能,对该题答案提出疑问后,它们也经常会改变立场,开始论证错误选项正确的理由。

大模型应用无青少年模式 用AI学习引发“依赖”担忧

当AI被深度应用于学习,也引发了新的担忧,比如,过度使用是否会让一些学生“放弃思考”?据相关报道,在一些初中学校,有些学生依赖上了用AI写作业,被同学起绰号“一搜党”,有教师担心,AI会让学生越过循序渐进、抽丝剥茧的理解思考和钻研过程。

南都记者在测评过程中也注意到,6款大模型应用目前并无青少年模式,若以未成年人身份在对话框上传一张数学试卷,并明确提出该试卷是课程作业,要求给出答案,仅腾讯元宝会在识别出“未成年人”“作业”等关键词后,拒绝直接给出答案转而提供解题思路,其余5款大模型均直接识别图片上的题目并输出回答。即便DeepSeek在思考链路中意识到“考虑到她年龄,直接给答案不利于学习”,但最终仍然直接输出了答案。

高中语文教师黄老师在接受南都采访时表示:“如果只是用AI辅助学习是合理的,但问题在于不少学生对AI生成的答案没有判断能力,甚至看都不看原封不动抄下来,完全用AI代替了思考的过程”。黄老师发现,最近学生们交上来的随笔、作文、阅读分享、手抄报等创造类作业中,不少都有明显的AI生成痕迹。她表示,AI生成的作文看似语言优美,词藻华丽,但仔细阅读会发现内容空洞,言之无物,而且通常不同主题的作文会使用类似的不相关论据,很容易辨认。

相关学者认为,学生本身就处于学习新技能的过程中,若 AI 过早接管任务,会阻碍其真正掌握技能,而有效运用AI工具的前提是用户自身已具备深厚的知识。

或可对未成年人分学段设限 企业也要把握好底线

目前也有一些应用更新了需要实名认证的“家长模式”,以此来限制学生过度依赖搜题功能。引入AI功能后,快问AI、快对AI、小猿AI三款APP在使用拍照搜题和AI解题时,仍需要完成家长身份验证才可查看题目的答案和解题过程。部分大模型应用在应对“学生过度依赖AI”等方面,也做出了探索,比如文心一言在使用“解题老师”功能时,就会弹出提示,要求进行成年人身份认证后才可查看答案和解析。

有大模型应用在使用解题功能时需身份认证。

相关部门也积极展开了引导和管理,如今年5月,中国教育部发布了《中小学生成式人工智能使用指南》,明确禁止学生直接复制人工智能生成内容作为作业或考试答案,并限制在创造性任务中滥用人工智能。该指南还强调“分学段差异化应用”。

如何让AI真正成为学习的好帮手?中国教育科学研究院研究员储朝晖认为,生成式AI的发展更凸显培养学生探索精神、创新能力、判断能力及批判性思维的紧迫性,要给孩子创造条件学习人工智能,家长有条件也要提升自身人工智能素养。当孩子自主性较弱时,对其使用AI需加强引导与管控,尤其是尚未对一些概念产生自己的理解和体验时,应限制其使用AI完成作业。此外,企业也要把握好底线,平台要判定未成年人在使用时,哪些可以呈现和使用,哪些不能,同时也应该去开发一些适合未成年人的内容。“生成式人工智能到来以后,我们要防止学生变成一个被动的人,促进他的自主性、积极性,这是最关键的。”

出品:南都大数据研究院

采写:陈袁

设计:尹洁琳

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
别碰!正在坍塌的5个行业:门外汉抢着接盘,聪明人已在卖设备。

别碰!正在坍塌的5个行业:门外汉抢着接盘,聪明人已在卖设备。

三农老历
2026-02-15 12:47:14
有经销商半年利润没了!惨淡的送礼市场,没年味儿的春节,是“社会进步”吗?

有经销商半年利润没了!惨淡的送礼市场,没年味儿的春节,是“社会进步”吗?

食品内参
2026-02-25 10:25:59
海归光环彻底消失?49.5万留学生涌回国,残酷真相:企业只认这个

海归光环彻底消失?49.5万留学生涌回国,残酷真相:企业只认这个

南权先生
2025-12-23 16:16:33
中国50后还有多少人?多少人能活到80岁?权威数据告诉你

中国50后还有多少人?多少人能活到80岁?权威数据告诉你

芭比衣橱
2026-02-19 21:00:42
雷锋因公牺牲后,宋任穷质问:雷锋为何没被提干部?吕清一语道破

雷锋因公牺牲后,宋任穷质问:雷锋为何没被提干部?吕清一语道破

墨兰史书
2026-02-09 23:10:31
精神小妹的生活原来是这样的!网友:终于知道她们为啥都这么瘦了

精神小妹的生活原来是这样的!网友:终于知道她们为啥都这么瘦了

深度报
2026-02-11 23:35:03
外媒:花滑男单冠军沙多罗夫获赠公寓、奥迪Q8、25万美元及勋章

外媒:花滑男单冠军沙多罗夫获赠公寓、奥迪Q8、25万美元及勋章

懂球帝
2026-02-25 16:44:17
《镖人》“武力值”排行榜:阿育娅第7,刀马第4,第1名无争议

《镖人》“武力值”排行榜:阿育娅第7,刀马第4,第1名无争议

电影聚焦
2026-02-22 20:05:10
马斯克发帖暗示“辛鲍姆与贩毒集团存在关联”,墨西哥总统:正考虑采取法律行动

马斯克发帖暗示“辛鲍姆与贩毒集团存在关联”,墨西哥总统:正考虑采取法律行动

环球网资讯
2026-02-25 08:58:09
沉寂9天,中方管制准时开始?高市憋出几句话,对华的称呼都变了

沉寂9天,中方管制准时开始?高市憋出几句话,对华的称呼都变了

青烟小先生
2026-02-25 14:24:41
1979年,贺子珍到中南海参观,来到毛主席卧室后,突然哭出了声音

1979年,贺子珍到中南海参观,来到毛主席卧室后,突然哭出了声音

春秋砚
2026-02-26 09:30:04
上海一日料店,俩女子误认为是自助餐,专门捡贵的点,结账时4302

上海一日料店,俩女子误认为是自助餐,专门捡贵的点,结账时4302

苗苗情感说
2026-02-26 04:31:53
巴拿马赌输了?撕毁长和租约后,中国占21.4%的货运量成致命一击

巴拿马赌输了?撕毁长和租约后,中国占21.4%的货运量成致命一击

墨兰史书
2026-02-24 23:36:59
轰25+7+2!又一个哈登诞生,如果你安心打球,你能成为火箭基石

轰25+7+2!又一个哈登诞生,如果你安心打球,你能成为火箭基石

巴叔GO聊体育
2026-02-26 10:55:28
首发7次就打进6球!20岁法国妖锋横空出世,身价翻倍,4豪门疯抢

首发7次就打进6球!20岁法国妖锋横空出世,身价翻倍,4豪门疯抢

零度眼看球
2026-02-26 09:54:08
太豪华了!范明南京别墅上了杂志,光院子就1000平,里面奢华无比

太豪华了!范明南京别墅上了杂志,光院子就1000平,里面奢华无比

阿离家居
2026-02-25 19:35:30
工资突然爆炸式提升是什么感觉?网友:现在干一年,顶之前十年

工资突然爆炸式提升是什么感觉?网友:现在干一年,顶之前十年

另子维爱读史
2026-02-25 22:13:29
妈祖开始惩罚这位姓许的有钱人了

妈祖开始惩罚这位姓许的有钱人了

麦杰逊
2026-02-21 18:12:33
本菲卡助教特拉良:我和穆帅聊过,我们都为球队感到骄傲

本菲卡助教特拉良:我和穆帅聊过,我们都为球队感到骄傲

懂球帝
2026-02-26 10:17:38
冯小刚养女徐朵:在北京住500平豪宅,一双拖鞋999,还给徐帆甩脸

冯小刚养女徐朵:在北京住500平豪宅,一双拖鞋999,还给徐帆甩脸

银河史记
2026-02-25 23:45:03
2026-02-26 11:31:00
南方都市报 incentive-icons
南方都市报
换一种方式,南都在现场。
598773文章数 3587339关注度
往期回顾 全部

科技要闻

单季营收681亿净利429亿!英伟达再次炸裂

头条要闻

"花坛白骨案"2名凶手因4万元杀人埋尸 受害人儿子发声

头条要闻

"花坛白骨案"2名凶手因4万元杀人埋尸 受害人儿子发声

体育要闻

从排球少女到冰壶女神,她在米兰冬奥练出6块腹肌

娱乐要闻

尼格买提撒贝宁滑雪被偶遇 17年老友情

财经要闻

短剧市场风云突变!有人投百万赔得精光

汽车要闻

雷克萨斯ES双色特别版上市 售30.79万元起

态度原创

健康
本地
家居
数码
公开课

转头就晕的耳石症,能开车上班吗?

本地新闻

津南好·四时总相宜

家居要闻

归隐于都市 慢享自由

数码要闻

华硕骁龙X2-E94-100版Zenbook A16笔记本定价近34万日元

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版