网易首页 > 网易科技 > 网易科技 > 正文

有道14B低成本轻量模型“子曰3”开源,数学推理性能超越大模型

0
分享至

6月24日消息,网易有道昨日宣布正式开源“子曰3”系列大模型数学模型(英文名称Confucius3-Math)。这是国内首个专注于数学教育,可在单块消费级GPU上高效运行的开源推理模型。其在一系列数学推理任务中取得当前最优性能,超越了许多规模更大的通用模型。该模型的开源,为教育领域提供了低成本、高性能的AI解决方案,推动大模型技术向教育领域加速渗透。

低成本高性能,助力教育公平

据悉,“子曰3数学模型”在解决国内数学问题任务中展现出了显著优势。其通过大规模增强学习以及一系列的创新算法,训练成本仅为2.6万美元,推理性能约为DeepSeek R1的15倍。

测试数据显示,在CK12-math(Internal)、GAOKAO-Bench(Math)、MathBench(K12)、MATH500等数据集上,14B轻量级的“子曰3数学模型”各项得分均高于DeepSeek-R1等通用大模型。在GAOKAO-Bench(Math)这一基于高考数学题的大模型评测框架中,“子曰3数学模型”的得分高达98.5分。

除了出色的性能,“子曰3数学模型”的成本优势同样显著,其在消费级GPU即可运行,大大降低了教育场景的AI应用门槛。

事实上,中小学教育长期面临教育资源不平等、个性化辅导资源不足、复杂题型讲解成本高等痛点,而教育大模型能有效辅助提升学习效果,但高性能大模型的构建和部署成本却非常高昂,许多低收入地区难以负担。

针对这一问题,“子曰3数学模型”实现了部署性能的极致突破,服务成本每百万token低至0.15美元,远超目前大多数通用大模型的成本效益。这意味着更广泛的普通教育机构和开发者都能以低成本部署专业级的数学AI应用。

“对于行业而言,‘子曰3数学模型’证明了在低成本情况下,在特定领域构建强大推理模型的可行性,为垂类推理大模型的研发与应用提供了重要参考。”网易有道首席科学家段亦涛表示。

“AI+教育”加速进化,子曰释放教育大模型应用价值

自2023年7月推出国内首个教育大模型“子曰”以来,网易有道在“AI+教育”领域加速进化,持续释放大模型在教育行业的应用价值。

从“子曰”大模型在一年内快速推出10余个垂直应用,到今年初发布国内首个输出分步式讲解的推理模型“子曰-o1”,再到如今“子曰3数学模型”正式开源,网易有道充分结合应用场景进行模型迭代和优化,持续推动教育大模型技术创新和应用落地。

此次“子曰3数学模型”发布及开源,标志着“子曰”大模型系列在轻量级模型推理能力上实现了又一重要突破,也使得有道在教育大模型领域长期积累的技术成果能够共享给更多的开发者和从业者,构建起协同发展的行业格局。

段亦涛强调:“AI+教育的终极目标不是替代教师,而是让技术成为教育公平的杠杆。希望‘子曰3数学模型’的开源能够吸引更多开发者加入,共同探索推理模型在教育领域的应用价值。”

附1:Demo地址,欢迎试用

https://confucius.youdao.com/

附2:模型开源地址

https://github.com/netease-youdao/Confucius3-Math

附3:论文地址

https://github.com/netease-youdao/Confucius3-Math/blob/main/Confucius3-Math.pdf

延伸阅读
相关推荐
热点推荐
河南一男子闯入女澡堂打人,洗浴中心:他进去打他媳妇;涉事男子已被警方控制

河南一男子闯入女澡堂打人,洗浴中心:他进去打他媳妇;涉事男子已被警方控制

扬子晚报
2026-01-30 12:20:05
金晨肇事逃逸更多细节曝光!疑似医务工作者透露:车祸前刚做鼻子

金晨肇事逃逸更多细节曝光!疑似医务工作者透露:车祸前刚做鼻子

社会酱
2026-01-30 19:48:11
商务部新闻发言人就中国诉美《通胀削减法》世贸争端案专家组发布裁决答记者问

商务部新闻发言人就中国诉美《通胀削减法》世贸争端案专家组发布裁决答记者问

界面新闻
2026-01-30 23:35:20
黄金史诗级巨震,5500-5100-5450,2倍做空白银15%收益归零

黄金史诗级巨震,5500-5100-5450,2倍做空白银15%收益归零

金石随笔
2026-01-30 08:34:11
2025 年全球手机销量排行榜来了!第三名有点意外啊

2025 年全球手机销量排行榜来了!第三名有点意外啊

XCiOS俱乐部
2026-01-30 19:14:42
保命还是保饭碗?5万种中成药强制退市!是要毁了中医还是救中医

保命还是保饭碗?5万种中成药强制退市!是要毁了中医还是救中医

李将平老师
2026-01-29 14:58:04
吴君如很早就说过了,陈妍希私下就是这样穿

吴君如很早就说过了,陈妍希私下就是这样穿

八星人
2026-01-21 15:14:26
172:199,日本选举杀出黑马,"新首相"对华态度成最大看点

172:199,日本选举杀出黑马,"新首相"对华态度成最大看点

书纪文谭
2026-01-30 14:07:45
闻泰科技:预计2025年净亏损90亿元~135亿元

闻泰科技:预计2025年净亏损90亿元~135亿元

每日经济新闻
2026-01-30 19:47:07
全线大跌,超22万人爆仓!刚刚,黄金、白银,直线跳水

全线大跌,超22万人爆仓!刚刚,黄金、白银,直线跳水

中国基金报
2026-01-30 09:29:21
6旬失独夫妻相约轻生,丈夫却提前心梗离世,妻子凑不齐1万火化钱

6旬失独夫妻相约轻生,丈夫却提前心梗离世,妻子凑不齐1万火化钱

有范又有料
2026-01-30 16:36:34
你以为干净,但实际却很脏的9大生活习惯,大病小病就是这么来的

你以为干净,但实际却很脏的9大生活习惯,大病小病就是这么来的

室内设计师有料儿
2026-01-26 18:54:48
央视暗访曝光!超市“完美蔬菜”竟是毒菜,高毒农药,清洗也没用

央视暗访曝光!超市“完美蔬菜”竟是毒菜,高毒农药,清洗也没用

现代小青青慕慕
2026-01-30 11:08:23
美国宣布对伊朗最新制裁措施

美国宣布对伊朗最新制裁措施

界面新闻
2026-01-30 23:40:21
中央委员孙绍骋落马!中纪委新年首月已打下7“虎”

中央委员孙绍骋落马!中纪委新年首月已打下7“虎”

上观新闻
2026-01-30 12:09:11
中国理发店老板被捕:涉嫌向哈马斯转账60万欧元

中国理发店老板被捕:涉嫌向哈马斯转账60万欧元

桂系007
2026-01-30 23:47:18
公布:2025年,台湾GDP增长8.63%,创15年新高!人均多少?

公布:2025年,台湾GDP增长8.63%,创15年新高!人均多少?

王爷说图表
2026-01-30 17:09:04
爆iPhone 18 Pro将首搭星链卫星通信,无需额外硬件实现“无死角”联网

爆iPhone 18 Pro将首搭星链卫星通信,无需额外硬件实现“无死角”联网

环球网资讯
2026-01-30 15:14:07
白银重挫20% 创2008年以来最大盘中跌幅

白银重挫20% 创2008年以来最大盘中跌幅

财联社
2026-01-31 01:13:04
一个疯狂的时代,结束了

一个疯狂的时代,结束了

大嘴説
2026-01-29 23:15:14
2026-01-31 06:19:00

科技要闻

意念控制机器人不是科幻 1-2年就落地

头条要闻

特朗普:已向伊朗告知达成协议的最后期限

头条要闻

特朗普:已向伊朗告知达成协议的最后期限

体育要闻

“假赌黑”的子弹,还要再飞一会儿吗?

娱乐要闻

警方通报金晨交通事故,否认网传骗保

财经要闻

水贝惊雷:揭秘杰我睿百亿黄金赌局的背后

汽车要闻

合资品牌首搭800V/5C快充 东风日产NX8将于3、4月上市

态度原创

时尚
教育
旅游
家居
军事航空

今日热点:《闪灵》今日上映;保险公司确认金晨方曾放弃索赔……

教育要闻

教育部:严控冷热搭配专业组,考生如何应对?

旅游要闻

从荒滩到网红花海,抚仙湖这个公园完成了三重蜕变!

家居要闻

蓝调空舍 自由与个性

军事要闻

新西兰拒绝特朗普:不加入"和平委员会"

无障碍浏览 进入关怀版
×