网易首页 > 网易号 > 正文 申请入驻

Parallel-Probe问世,并行推理效率提升35.8%

0
分享至



当大模型推理进入Parallel Thinking时代,一个关键问题随之出现:

模型在并行推理的过程中,究竟发生了什么?多条推理路径同时展开,看似为模型带来了更强的能力,却也引入了一个长期被忽视的问题——大量计算是否正在被浪费在已经「没有必要继续」的思考上?

为了回答这一问题,来自马里兰大学、圣路易斯华盛顿大学、北卡罗来纳大学教堂山分校等机构的研究团队提出了Parallel-Probe。不同于直接从算法设计出发,该研究首先通过引入2D Probing,对 online 并行推理过程中的全局动态性进行了系统性刻画。研究发现,并行推理并非一个「算得越多越好」的过程:全局共识往往在所有分支结束之前就已提前稳定,而少数冗长的长尾路径却持续占据大量计算资源,成为并行推理效率的主要瓶颈。

基于这些关键发现,研究团队进一步提出了一个 training-free 的并行推理控制算法 Parallel-Probe,能够在不牺牲核心准确率的前提下,显著减少无效计算,将推理延迟降低35.8%,总 token 成本降低25.8%。



  • 论文名称:Parallel-Probe: Towards Efficient Parallel Thinking via 2D Probing
  • 论文链接:
  • https://arxiv.org/pdf/2602.03845
  • Code:
  • https://github.com/zhengkid/Parallel-Probe
  • Online Judge:
  • https://huggingface.co/spaces/EfficientReasoning/efficient_reasoning_online_judgement

核心痛点:孤立的

「并行路径」到底带来了什么?

目前的并行推理方法(如多数投票机制)存在一个显著缺陷:各推理分支彼此独立。这意味着,即使大部分分支已经达成了共识,系统仍需等待所有分支(包括那些冗余的长尾路径)全部生成完毕。



研究人员提出,这种「局部视角」导致了严重的效率低下。通过系统2D 探测接口,研究团队揭示了并行推理的三大底层动态特征:

  • 非单调缩放:准确率并非随着算力投入单调增加,而是取决于「宽度」与「深度」的精细平衡(Figure (a))。
  • 路径长度不均:并行分支的生成长度差异极大,计算资源往往被少数「长尾」路径占据(Figure (b))。
  • 共识提早稳定:全局共识往往在所有分支结束前就已经达成(平均共识达成率仅为 0.31)(Figure (c))。

技术突破:基于全局信号的

「外科手术式」 2D Budget Control

即插即用:Parallel-Probe 是一种模型无关的方法,可直接适配各种现成的开源或闭源大语言模型。



针对上述发现,Parallel-Probe采用了一种 Training-Free 的轻量级控制器,通过两个核心机制优化同时从宽度和深度优化在线并行思考:

  • 基于共识的早期停止(Consensus-based Early Stopping):该机制周期性地从各分支中提取中间结果。一旦探测到全局多数答案在连续几个周期内保持稳定,控制器将直接终止整组推理,避免后续冗余步骤。

  • 基于偏差的分支剪枝(Deviation-based Branch Pruning):实时监控每一条路径。如果某条路径显著偏离了当前的全局大趋势(即出现异常),系统会果断对其进行「剔除」,将资源倾注在更有潜力的路径上。

实验结果:刷新帕累托前

研究团队在Qwen3系列模型(0.6B 至 8B)上进行了广泛测试,涵盖了 AIME 2024/2025 和 HMMT 2025 等高难度竞赛题库。



实验结果表明,Parallel-Probe 在性能、成本效率和延迟效率之间建立了更优的平衡点,系统性地优于现有的 ESC 和 SC 等基准方法。

基础设施贡献:SCOUT 测试床

为了推动该领域的持续研究,团队还推出了SCOUT(顺序与并发离线利用测试床)。该平台实现了推理生成与控制策略的解耦,允许开发者在极低开销下模拟各种缩放策略,极大提升了测试效率。



代码及 Online Judge 平台已开源:

  • GitHub:
  • https://github.com/zhengkid/Parallel-Probe
  • 平台:Efficient Reasoning Online Judge

本文作者

郑童,马里兰大学计算机科学系二年级博士生,研究方向聚焦于Reasoning尤其是Parallel Thinking(并行思考)。他的研究关注如何打破传统顺序推理在效率与鲁棒性上的瓶颈,使大语言模型能够以更结构化、更高效的方式进行并行推理。代表性工作包括Parallel-R1,该工作首次提出基于强化学习的框架,在真实世界推理任务中自适应地激励并行思考行为;以及MoT(Mixture of Thoughts),系统性地构建多推理模态的并行思考机制,在训练与推理阶段统一整合自然语言、代码与符号推理等不同模态,从而实现更高效、更具表达力的并行推理。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
燃气调价通知

燃气调价通知

孝感汇
2026-03-25 16:38:10
杀死中国大使?日本军官再次独走,中方撂下一句狠话,手段不简单

杀死中国大使?日本军官再次独走,中方撂下一句狠话,手段不简单

说历史的老牢
2026-03-25 13:00:26
农用无人机载客!大疆:吊销“驾照”

农用无人机载客!大疆:吊销“驾照”

热点科技
2026-03-26 11:30:59
最新空难! 特朗普发声! 撞击视频曝光, 2死41伤现场惨烈…

最新空难! 特朗普发声! 撞击视频曝光, 2死41伤现场惨烈…

华人星光
2026-03-25 12:24:29
周恩来晚年含泪揭秘,当年若非毛主席深夜提灯来,历史或将改写

周恩来晚年含泪揭秘,当年若非毛主席深夜提灯来,历史或将改写

鹤羽说个事
2026-03-18 21:47:42
岛国女老师不科学身材大赏:巨灯细腰 TOP10,美到极致

岛国女老师不科学身材大赏:巨灯细腰 TOP10,美到极致

碧波万览
2026-03-26 01:20:03
萨巴伦卡赢郑钦文后吃100美元汉堡 顶奢!鱼子酱+金箔碎她说超好吃

萨巴伦卡赢郑钦文后吃100美元汉堡 顶奢!鱼子酱+金箔碎她说超好吃

劲爆体坛
2026-03-26 08:10:23
75岁港星花百万在中山买房,住了两年称生活素质高,后悔搬来太晚

75岁港星花百万在中山买房,住了两年称生活素质高,后悔搬来太晚

树娃
2026-03-24 12:28:41
婚礼上婆婆逼我上交工资,不然不喝敬茶,老公逼我表态我拿起话筒

婚礼上婆婆逼我上交工资,不然不喝敬茶,老公逼我表态我拿起话筒

生命之泉的奥秘
2026-03-26 08:42:40
有没有人敢爆自己的瓜?网友:确定玩这么大吗?

有没有人敢爆自己的瓜?网友:确定玩这么大吗?

夜深爱杂谈
2026-02-18 20:55:58
柯文哲案今天下午一审宣判,若判十年以上有期徒刑将失“大选”资格

柯文哲案今天下午一审宣判,若判十年以上有期徒刑将失“大选”资格

海峡导报社
2026-03-26 07:09:02
教育彻底变天!2026届初中生注意,这是最后一届只拼分数的一届

教育彻底变天!2026届初中生注意,这是最后一届只拼分数的一届

老特有话说
2026-03-25 15:22:58
逼杜锋裁掉麦考尔!广东队被曝出现内讧,陈家政狂轰生涯最强一战

逼杜锋裁掉麦考尔!广东队被曝出现内讧,陈家政狂轰生涯最强一战

绯雨儿
2026-03-26 12:19:37
印度想拿中国尿素救春耕?先把欠中企百亿欠款还了,否则一粒不售

印度想拿中国尿素救春耕?先把欠中企百亿欠款还了,否则一粒不售

达文西看世界
2026-03-26 12:05:42
太突然!董事长汤建,因心梗意外去世

太突然!董事长汤建,因心梗意外去世

每日经济新闻
2026-03-25 18:21:26
《浪姐7》糊咖扎堆,大牌只有两位,3人成流量担当,4人有黑马相

《浪姐7》糊咖扎堆,大牌只有两位,3人成流量担当,4人有黑马相

八卦南风
2026-03-25 17:32:20
曝马英九完全不见他!萧旭岑:很多事长辈忘了、质疑能怎么办?

曝马英九完全不见他!萧旭岑:很多事长辈忘了、质疑能怎么办?

新时光点滴
2026-03-25 11:32:56
为啥没第二人称射击游戏,因为玩过的人都疯了

为啥没第二人称射击游戏,因为玩过的人都疯了

街机时代
2026-03-25 16:55:54
特斯拉车主被售后暖到,15 万元电池免费换,还送带 FSD 的 Model 3 代步!

特斯拉车主被售后暖到,15 万元电池免费换,还送带 FSD 的 Model 3 代步!

新浪财经
2026-03-25 01:53:52
张雪峰生前忠告:普通学生不要碰的20个专业,大家千万别忘记!

张雪峰生前忠告:普通学生不要碰的20个专业,大家千万别忘记!

教育导向分享
2026-03-25 22:28:37
2026-03-26 14:23:00
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12602文章数 142593关注度
往期回顾 全部

科技要闻

Meta高管狂分百亿期权,700名员工却下岗

头条要闻

伊朗议长和外长暂被移出美以清除名单 时限4到5天

头条要闻

伊朗议长和外长暂被移出美以清除名单 时限4到5天

体育要闻

35岁替补门将,凭什么入选英格兰队?

娱乐要闻

张雪峰家人首发声 不设追思会丧事从简

财经要闻

黄仁勋:芯片公司的时代已经结束了

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

家居
数码
本地
公开课
军事航空

家居要闻

傍海而居 静观蝴蝶海

数码要闻

Intel史上最先进!酷睿Ultra 300系列vPro平台发布

本地新闻

春日吃花第三站——广东

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

担心特朗普突然停战 以总理下令48小时尽力摧毁伊设施

无障碍浏览 进入关怀版