网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

微软亚洲研究院发布 rStar-Math 技术，大幅提升小语言模型数学解题能力

2025-01-11 12:29:07　来源: DoNews

北京举报

0

分享至

微软亚洲研究院的数学和人工智能研究团队于1月10日发布了一项新技术——rStar-Math，专门用于提升小语言模型解决数学问题的能力。与之前的 Phi-4 模型不同，rStar-Math 采用蒙特卡洛树搜索（Monte Carlo Tree Search）进行推理，模拟人类逐步解决问题的思维方式，将复杂问题分解成更小的部分逐步求解。

研究人员要求模型输出自然语言描述和 Python 代码形式的“思维链”步骤，并将自然语言作为 Python 代码注释，仅使用 Python 代码输出训练模型。通过训练一个“策略模型”生成数学推理步骤，并使用“过程偏好模型”（PPM）选择最有希望的解题步骤，这两个模型经过四轮“自我进化”互相改进，不断提升性能。

初始数据包括74万道公开的数学应用题及其解答，利用上述两个模型生成新的解题步骤。测试结果显示，应用 rStar-Math 技术后，Qwen2.5-Math-7B 模型的准确率从58.8%跃升至90.0%，Phi3-mini-3.8B 模型从41.4%提升到86.4%，分别比 OpenAI 的 o1-preview 模型高4.5%和0.9%。

研究团队计划在 GitHub 上公开 rStar-Math 的代码和数据，方便其他研究者使用和改进。

风险警告：本文根据网络内容由AI生成，内容仅供参考，不应作为专业建议或决策依据。用户应自行判断和验证信息的准确性和可靠性，本站不承担可能产生的任何风险和责任。内容如有问题，可联系本站删除。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

平舆县杨埠镇：104岁老人蔡潘氏五世同堂新春团圆尽显家风温情

驻马店广视网 2026-02-17 17:11:25
10 跟贴 10
57岁贴瓦工大叔用水泥写“喜迎新春” 一出手就是大师级别！（来源：中国新闻网）

学申论的谈妹 2026-02-17 05:23:59
75 跟贴 75

河南105岁奶奶给20多个重孙、玄孙发压岁钱，家属：娘家基因好，眼不花耳不聋！

大象新闻 2026-02-16 23:43:07
91 跟贴 91

王菲水滴耳环再次出圈，网友立刻找到同款！窦靖童发文

每日经济新闻 2026-02-17 00:23:36
818 跟贴 818
湖南95后女生上门做年夜饭月入4万多：春节前订单就满了

齐鲁壹点 2026-02-17 14:54:08
87 跟贴 87

反向过年新潮流：老外扎堆来中国，单日飞三亚外国游客大增3倍

每日经济新闻 2026-02-15 11:30:33
1672 跟贴 1672

蔡磊近照曝光，一家三口送新年祝福！曾称科研实现多维突破

南方都市报 2026-02-16 21:41:43
119 跟贴 119
游客在胖东来买到搬不动：买了5000多元的年货，还花了500多元的快递费

杭州日报 2026-02-16 13:34:00
764 跟贴 764

马斯克预言：2026年底编程将迈向全自动化

极目新闻 2026-02-17 12:50:39
847 跟贴 847
赛场频现违例，中国冰壶队：相信世界壶联有办法解决争议

澎湃新闻 2026-02-17 10:17:03
107 跟贴 107
官宣！苹果春季发布会3月4日在中国上海举行

现代快报 2026-02-17 09:13:03
95 跟贴 95
黄循财：日本给我们的苦难教训极重

上观新闻 2026-02-17 13:57:06
86 跟贴 86
春晚吉祥物“骋骋”，原来是匹这样的马儿

新民周刊 2026-02-17 13:03:52
81 跟贴 81
春晚16架“空中的士”和22580架无人机合肥炫技

环球网资讯 2026-02-17 09:37:09
241 跟贴 241
苹果，突然官宣！

每日经济新闻 2026-02-17 07:47:09
37 跟贴 37
海拔4000米以上，他们为地球“把脉”

国际在线 2026-02-16 21:42:09
63 跟贴 63
大众汽车大力降本增效，消息称到2028年所有品牌都要减少20%成本

中国能源网 2026-02-17 09:55:37
203 跟贴 203
日经225指数跌幅扩大，现跌1.0%，最新报56200.73点

每日经济新闻 2026-02-17 11:39:05
1 跟贴 1
马斯克母亲发视频拜年新年愿望是多去中国看看

看看新闻Knews 2026-02-17 14:02:03
11 跟贴 11
阿联酋：暖风拂动“中国红”

新华社 2026-02-17 15:08:38
20 跟贴 20
事发朔州，凌晨，一车在高速上逆行

朔州那些事儿 2026-02-17 19:33:02
0 跟贴 0
超20℃，湖北升温时间确认

极目新闻 2026-02-17 15:27:20
0 跟贴 0
98元涨到963元，最近价格飞涨近十倍，网友直呼离谱！有的已突破2000元

浙江之声 2026-02-17 17:35:40
0 跟贴 0
从杭州借道俄罗斯回东北的女孩已抵达黑河家中：耗时5天4夜，比国内直飞节约500多元，还玩了两个俄罗斯城市

极目新闻 2026-02-16 20:11:03
0 跟贴 0

一夜输光、跳楼身亡！2月15日中国驻岘港总领馆紧急警告

一夜输光、跳楼身亡！2月15日中国驻岘港总领馆紧急警告

小虎新车推荐员

2026-02-16 19:44:15

罗嘉良一家三口爱丁堡过春节，51岁苏岩瘦得干巴巴，没以前好看了

罗嘉良一家三口爱丁堡过春节，51岁苏岩瘦得干巴巴，没以前好看了

八怪娱

2026-02-17 14:42:21

广东受冷空气影响大年初一降温约5℃！初二白天起气温回升

广东受冷空气影响大年初一降温约5℃！初二白天起气温回升

南方都市报

2026-02-16 21:14:38

大年初一“抄底”出游！部分热门航线机票价格“腰斩”，近日仍有低价机票在售

大年初一“抄底”出游！部分热门航线机票价格“腰斩”，近日仍有低价机票在售

红星新闻

2026-02-17 14:31:16

北京一男房东因联系不上女租客，担心出事，直接开锁进了房间。

北京一男房东因联系不上女租客，担心出事，直接开锁进了房间。

南权先生

2026-01-12 16:44:03

醒醒吧，伊朗从来不是我们的“好朋友”

醒醒吧，伊朗从来不是我们的“好朋友”

苏格拉高

2026-01-11 07:42:04

成吉思汗打败花剌子模时，俘虏女人50万，后来是如何处置的？

成吉思汗打败花剌子模时，俘虏女人50万，后来是如何处置的？

铭记历史呀

2026-02-11 12:13:17

你见过最土的土豪有多土？网友：你这明显是短剧看多了

你见过最土的土豪有多土？网友：你这明显是短剧看多了

带你感受人间冷暖

2026-02-11 11:21:06

《昭和米国物语》制作人展望:数年磨剑终有斩下的一刻

《昭和米国物语》制作人展望:数年磨剑终有斩下的一刻

游民星空

2026-02-17 19:07:15

内蒙古一200斤男子欠5000万不还，被债主装进铁笼沉入80米水库，谁料，2年后才被捞出...

内蒙古一200斤男子欠5000万不还，被债主装进铁笼沉入80米水库，谁料，2年后才被捞出...

品读时刻

2026-02-11 17:18:30

本赛季意甲中卫年薪榜：巴斯托尼1020万欧第1，布雷默930万第2

本赛季意甲中卫年薪榜：巴斯托尼1020万欧第1，布雷默930万第2

懂球帝

2026-02-17 16:10:07

39元铜葫芦卖爆1000万件，这家公司，算把中年男人消费玩明白了！

39元铜葫芦卖爆1000万件，这家公司，算把中年男人消费玩明白了！

李砍柴

2026-02-06 16:36:05

惊呆！老外竟称中国治安“离谱”，外国超市连零食都要上锁！

惊呆！老外竟称中国治安“离谱”，外国超市连零食都要上锁！

特约前排观众

2026-01-20 00:15:06

你知道中国最大的资金外流通道是什么吗？

你知道中国最大的资金外流通道是什么吗？

流苏晚晴

2026-02-02 18:08:27

权威，确认！皇马“顶薪先生”转会离队！1.05亿“铁闸”有望入替

权威，确认！皇马“顶薪先生”转会离队！1.05亿“铁闸”有望入替

头狼追球

2026-02-17 17:44:50

费城两年335万转正沃克！佩恩倒贴87.5万加盟全新15+3名单出炉

费城两年335万转正沃克！佩恩倒贴87.5万加盟全新15+3名单出炉

颜小白的篮球梦

2026-02-17 17:49:02

贝克汉姆坚持儿子离婚，16亿婚前协议导致和解困难

贝克汉姆坚持儿子离婚，16亿婚前协议导致和解困难

君笙的拂兮

2026-01-26 15:51:34

三人穿越羌塘，因内讧分道扬镳，一人失联19天靠吃草根绝境生还

三人穿越羌塘，因内讧分道扬镳，一人失联19天靠吃草根绝境生还

猫咪纪实说

2026-01-21 11:16:23

特朗普惊出一身冷汗，中美已无法开战，一杀手锏让美军无计可施

特朗普惊出一身冷汗，中美已无法开战，一杀手锏让美军无计可施

健身狂人

2026-02-14 15:44:06

诡异，春联上没有汉字！越南去汉字化确实很成功

诡异，春联上没有汉字！越南去汉字化确实很成功

魔都姐姐杂谈

2026-02-15 14:12:14

不局限于对互联网行业的追踪与探索，更要向未来、向未知的方向迈进。

105937文章数 26807关注度

往期回顾全部

科技要闻

春晚这些机器人是怎样做到的？

头条要闻

鲁比奥再就对华关系表态：若美中无交流那将是疯狂的

头条要闻

鲁比奥再就对华关系表态：若美中无交流那将是疯狂的

体育要闻

谷爱凌：'不小心"拿到了银牌祝大家马年大吉

娱乐要闻

春晚三大感人瞬间：周深于和伟上榜

财经要闻

大年初一，这三件事很不寻常

汽车要闻

问界M6更多信息：乾崑智驾ADS4.0+鸿蒙座舱5.0

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

旅游

房产

健康

教育

军事航空

旅游要闻

大美雨花，一“片”打尽！马年新春共赴山水之约

房产要闻

三亚新机场，又传出新消息！

转头就晕的耳石症，能开车上班吗？

教育要闻

高中生开始获得省自然科学基金某项目资助

军事要闻

美国国务卿鲁比奥发表农历新年祝福

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版