网易首页 > 网易号 > 正文 申请入驻

首个高考数学满分AI诞生!海淀名师审大题,给出惊艳超高分

0
分享至

  新智元报道

  编辑:Aeneas 犀牛

  【新智元导读】高考数学满分AI出现了!豆包爱学App首次公开挑战高考数学全国卷,由6位资深名师严格把关,主观题步骤全打分,竟然斩获Ⅰ卷144分、Ⅱ卷150分满分战绩。这个惊艳的成绩或许预示着,AI教育真要变天了。

  大模型来做高考数学真题,最近可是太火了。

  不过对于各个版本的AI解题评分是否公正,坊间一直颇多争议。

  我们突然发现,一位高考数学满分选手出现!

  我们在豆包爱学的官方账号看到,考试结束后,豆包爱学第一时间将结果放到了网上。

  豆包爱学App的AI深度解题能力(即豆包大模型教育版),直接获得了高考数学全国Ⅰ卷144分、全国Ⅱ卷150分满分。

  而且它的得分,是由六位平均教龄超10年的一线资深数学教师给出的,甚至对解答题的步骤进行了严格打分,可以说,这个分数十分有含金量了。

  2025高考数学卷

  豆包大模型教育版接近满分!

  下面我们来看看,豆包大模型教育版对于2025高考数学全国卷中部分选择题、填空题、问答题的解答情况。

  先来看一道让一众大模型闻风丧胆的选择题,全国Ⅰ卷第6题。

  这道题AI之所以很难做对,是因为它既有文字、又有图表、图片。

  不仅需要模型的多模态能力,还要有很好的信息整合能力。

  尤其是模型还要理解图中向量的方向,然后进行推理计算,这对模型极其困难。

  来看看豆包大模型教育版的表现。

  它的回答有两点让人印象深刻,甚至惊艳。

  首先,它在思考过程中消耗的token数非常少,比行业里其他大模型都要精简很多。尽管在整个过程中检查了3次。

  经常用推理模型的同学肯定都见过那些长到可以让人发狂的思考过程。

  其次是它的公式渲染能力,基础的绝对值、根号这些就不说了,它连向量上边的小箭头都渲染的很好了。

  读起来专业又舒服。

  最后简单说下它的解题过程,流畅又有逻辑,简洁而准确。

  说完了最让模型挠头的题,再来看试卷中最难的题——压轴题。

  这是一道导数计算证明题,使用的三角函数。

  我们来看豆包大模型教育版是如何应对的。

  思路同样清晰。

  这个过程中,模型还有几个有趣的表现。

  例如,拿到简化结果后,它会惊讶。

  对变量替换法、反证法这些常用的方法,掌握得非常娴熟。

  还有就是可以快速锁定问题的本质。

  完整思考过程及结果如下。

  接下来,看一下模型对于II卷的解题结果。

  对于几道选择题,模型是手拿把掐、不在话下,解题过程非常丝滑。

  单项选择题1:

  这道题涉及到实数和虚数的知识点,模型在分布推理后,得到了正确答案A。

  单项选择题2:

  这道选择题,应用到了余弦定理。

  模型在思考过程中,找出解题关键——需要用余弦定理求角A,最终得出了正确答案A。

  单项选择题3:

  在解题过程中,模型利用了抛物线的定义和直线方程的性质,最后得出正确答案C。

  多项选择题,模型也是不会放过一个正确答案。

  多项选择题4:

  这道题涉及到知识点是等比数列,模型通过构建了一个关于首项a_1和公比q的方程组来求解,最终得出了正确选项A、D。

  多项选择题5:

  这道题涉及到了双曲线的知识点,模型通过求解以F_1F_2为直径的圆与渐近线的交点,再推导a、b的关系,利用向量点积公式,得出了A、C、D三个正确答案。

  对于填空题,模型的求解过程也是十分丝滑。

  填空题1:

  在这道填空题中,模型推理出要计算结果,就需要让铁球满足「与圆柱底面、顶面、侧面相切,且两球自身相切」的极限条件,最终通过计算和验证,得出正确答案5/2cm。

  然后到了真刀真枪测实力的大题环节。

  解答题1:

  对于这道几何题,模型首先将直线A’B的方向向量与屏幕CD’F的法向量进行点积运算,通过结果为0,成功证明直线A’B平行于平面CD’F。

  随后在第二步中,通过转向二面角计算、求解第一和第二个法向量、计算法向量夹角的余弦,最终得出了正确的正弦值。

  解答题2:

  这道大题既包括计算,还包括证明,难度不小。

  模型通过求导,分析f’(x)在(0,+∞)的符号,证明了存在唯一零点。随后通过分析g’(t)的正负确定了g(t)单调性,进而并完成了大小比较,三个问题全部给出了正确解答。

  解答题3:

  对于这道概率题,模型首先计算出了p_3,p_4的概率,然后得到关于p和q的简洁关系式,得出了p正确的值。

  到了最后一问的证明,题目难度已经飙到极高。

  为了成功完成证明,模型引入了一个辅助数列,这样就将需要证明的不等式转化为了分析新数列项与项之间的差值。

  经过严谨的推理后,最终它成功完成了证明。

  看完这些解题过程,可能你会疑问:这么好的成绩,真的是全靠模型做出来的吗?会不会是每次都取最好成绩,才有的这个结果?

  看完下面这个过程,你就可以打消顾虑了——豆包大模型教育版的数学解题能力,就是这么牛!

  评分过程超严,绝不放水

  5次都答对,才算过关

  经常使用AI做题的小伙伴肯定都有体会,那就是现阶段的AI答题并不稳定。

  有些模型很不稳定,简单些的还好,遇到难一点的题目,需要试好几次才能得到一个满意的答复。

  如果模型性能不行就更别提了,彻底摆烂,答不对不说,还会时常一本正经地胡言乱语。

  这就使得AI解题看上去不那么实用:你很难判断它首次给出的答案是不是对的——我如果知道正确答案,还请AI干嘛呢?

  所以,AI答题正确的稳定性至关重要。

  为了避免随机性,根据公布的结果看,此次豆包爱学测了五次,同时前五遍结果发到了HuggingFace上。

  可以看出,每道题分别列出了思考过程 与输出答案 ,只有每次都答对才算过关。

  要求相当严苛,结果相对公正。

  这也说明了豆包大模型教育版解题稳定性很高。

  6大资深数学名师把关,AI满分交卷

  不仅,如此,豆包大模型教育版此次答题的评分过程,还经过了不少名师把关!

  为了得到足够严谨的测评结果,豆包爱学App特意邀请了6位平均教龄超10年、毕业于知名高校的一线教学、阅卷岗位的资深数学教师,对作答结果进行了详细的交叉评分。

  最终评分结果为——全国Ⅰ卷:144分、全国Ⅱ卷:150分(满分)

  这一结果充分证明了豆包大模型教育版在解题结果方面出色的能力,能在几位名师手里拿到满分,更是说明了模型在解题过程中推理逻辑缜密、步骤精准,符合评分细则。

  而在测评过程中,这些资深数学老师们也发现了豆包大模型教育版的一些有意思的细节。

  比如,赵武俊老师发现,模型再在解Ⅰ卷最后一题的最后一问时,推理的过程「特别像考生作答的这种感觉」。

  所以,看模型的解题思考过程就好像是在看自己的解答过程一样,十分有启发。

  李想老师则给出了更加详细的使用建议。

  例如,他建议利用模型解答立体几何部分的题目时,可以让AI给出常规定义法和空间向量法两种方法。

  这样,就可以直观地比较出到底哪种方法更加适合自己,而且也更加贴近高中的教学内容。

  当然,在测评过程中名师们也发现了模型现在在解题过程中存在的一些问题。

  比如,曾多次参与高考集中阅卷的杨春晖老师就发现,部分解题过程可能会出现高中未学的技巧与公式。

  韩晓乐老师也发现了数字之间的乘法符号使用点乘、点坐标结果未化简等问题。

  当然,上面出现的这些问题也不是没有解决办法。

  比如,我们可以要求模型解题时使用高中的知识,解题步骤中即时化简等。

  在经过深入的体验与测试后,李伟景老师对豆包大模型教育版给出了高度评价,总结道:豆包大模型教育版无论是「对教师授课还是学生自学都非常有用,未来将有很大帮助。」

  对于教师来说,豆包大模型教育版就像一位得力的教学助手。

  它能够快速生成多样化的教学思路,涵盖课程设计、课堂互动到知识点讲解等方方面面,帮助老师更高效地备课和授课。

  无论是需要梳理复杂的知识框架,还是设计生动有趣的教学活动,模型都能提供全面且实用的建议,让课堂更加生动、条理清晰,大大提升教学效果。

  对于学生,这款模型同样是一个强大的学习伙伴。

  它能够根据学生的需求,清晰地拆解题目,提供详细且易懂的解题步骤,帮助学生快速掌握解题方法和核心知识点。

  无论是数学的逻辑推导、语文作文的分析,还是其他学科的疑难问题,豆包大模型教育版都能以通俗易懂的方式引导学生逐步攻克难点,从而有效提高学习效率和考试成绩。

  堪称学习神器!

  AI教育新形态来了

  在亲自实测了豆包大模型教育版的解题过程后,小编最强烈的感受就是——

  它的思考过程完全透明,每一步的解析都很明确,不仅能拿高分,还能讲明白。这样,就能让学生获得高质量的一对一讲解。

  从此,学数学可以不再只靠「刷题」,而是通过大模型的帮忙,养成严谨的推理能力,和直觉式的解题思路。

  在AI做题和讲解的帮助下,学生可以给自己来一个「自我诊断」,搞清楚自己是错在哪里,是计算失误、逻辑混乱还是审题不清?

  在教育资源不均的地区,弱势学生也能更公平地获得好「老师」。

  总之,豆包大模型教育版这位「高考数学」满分选手的惊艳表现,不仅展示了目前AI大模型做题的实力,更是对未来教育模式的一次前瞻性预演。

  AI教育,未来可期!

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
懂车帝发布汽车以旧换新白皮书:超8成燃油车用户换车首选新能源

懂车帝发布汽车以旧换新白皮书:超8成燃油车用户换车首选新能源

中国日报网
2026-03-02 15:34:04
意大利男子为证明中国治安,将行李放电动车上,他吃完饭一看惊呆

意大利男子为证明中国治安,将行李放电动车上,他吃完饭一看惊呆

华人星光
2025-11-26 12:28:31
破防了!原来只要失业,所有人都一样!网友:人都快抑郁了

破防了!原来只要失业,所有人都一样!网友:人都快抑郁了

另子维爱读史
2026-01-16 21:03:12
全球坠机冠军!F-16一天两连坠 总坠毁高达771架 印度也自叹不如

全球坠机冠军!F-16一天两连坠 总坠毁高达771架 印度也自叹不如

军评陈光文
2026-03-04 22:02:59
中方的资本,已经开始不受管控了,政府必须要提高警惕!

中方的资本,已经开始不受管控了,政府必须要提高警惕!

大静吖
2026-02-07 23:30:36
30岁小叔子和35岁嫂子去赶集,路过苞谷地,嫂子说这样一句话

30岁小叔子和35岁嫂子去赶集,路过苞谷地,嫂子说这样一句话

热心市民小黄
2026-03-04 08:12:16
正式退役?31岁林高远正式上任,亮相新岗位,安置级别薪水曝光

正式退役?31岁林高远正式上任,亮相新岗位,安置级别薪水曝光

懂球社
2026-03-04 11:33:38
特朗普承认油价或因与伊朗冲突上升,美媒:系其首次承认冲突给美国人带来经济损失

特朗普承认油价或因与伊朗冲突上升,美媒:系其首次承认冲突给美国人带来经济损失

环球网资讯
2026-03-04 16:23:11
A股:明天稳了!出现两大“关键”信号,这几个板块将直接起飞!

A股:明天稳了!出现两大“关键”信号,这几个板块将直接起飞!

另子维爱读史
2026-03-04 19:40:28
塞尔:姆巴佩的伤情相当严重,左膝的后十字韧带已经接近极限

塞尔:姆巴佩的伤情相当严重,左膝的后十字韧带已经接近极限

懂球帝
2026-03-04 09:50:07
数百艘油轮被困霍尔木兹海峡

数百艘油轮被困霍尔木兹海峡

中国能源网
2026-03-04 17:27:06
韩国财政部长:股市和外汇市场暴跌系外部因素所致 非国内基本面问题

韩国财政部长:股市和外汇市场暴跌系外部因素所致 非国内基本面问题

财联社
2026-03-04 16:25:06
回顾“91女神”琪琪:五官出众,却因天真让自己“受伤”

回顾“91女神”琪琪:五官出众,却因天真让自己“受伤”

就一点
2025-11-22 10:36:39
特朗普这棋,下成了死局

特朗普这棋,下成了死局

梳子姐
2026-03-04 10:08:59
有钱人是怎样奢侈,看网友讲述。真是误闯天家

有钱人是怎样奢侈,看网友讲述。真是误闯天家

侃神评故事
2026-03-01 17:30:03
比亚迪3月5日发大招!已确定超11款新车+第二代刀片电池首发!

比亚迪3月5日发大招!已确定超11款新车+第二代刀片电池首发!

音乐时光的娱乐
2026-03-04 17:26:39
谷爱凌参加罗浮宫晚宴,终于像亚洲人!不刻意扮外国人,好看多了

谷爱凌参加罗浮宫晚宴,终于像亚洲人!不刻意扮外国人,好看多了

乐悠悠娱乐
2026-03-04 10:49:30
最多领先49分!马刺8人上双狂胜76人 文班10+8+6帽马克西21+8

最多领先49分!马刺8人上双狂胜76人 文班10+8+6帽马克西21+8

醉卧浮生
2026-03-04 11:35:50
美国突发史无前例撤离令!外界担忧终极空袭来临

美国突发史无前例撤离令!外界担忧终极空袭来临

看看新闻Knews
2026-03-03 20:12:10
4号午评:沪指跌破4100点!所有人都注意了,大盘后市或将这样走

4号午评:沪指跌破4100点!所有人都注意了,大盘后市或将这样走

春江财富
2026-03-04 11:56:50
2026-03-04 23:00:49
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
14638文章数 66648关注度
往期回顾 全部

教育要闻

某211大学计算机考研,一学生考了专业第一,却连国家线都没过

头条要闻

外媒称伊朗封锁霍尔木兹海峡只让中俄船通行 中方回应

头条要闻

外媒称伊朗封锁霍尔木兹海峡只让中俄船通行 中方回应

体育要闻

2026年中超,为什么值得你多看一眼?

娱乐要闻

谢谢谢娜 贡献出26年内娱的第一个笑话

财经要闻

人大代表建议:将农民养老金提到500元

科技要闻

多位核心离职,阿里亲手废掉最强AI天团?

汽车要闻

鸿蒙智行首款猎装车 尚界Z7/Z7T首发

态度原创

游戏
房产
家居
教育
公开课

LPL季后赛:冰鸟辅助出奇效,BLG五局战胜JDG,挺进先锋赛

房产要闻

400组,30套!聚亿·椰海锦程为何能在春节火出圈?

家居要闻

极简无界 静居自安然

教育要闻

别再等孩子突然醒悟,开窍其实有“流程表”

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版