网易首页 > 网易号 > 正文 申请入驻

Parallel-Probe问世,并行推理效率提升35.8%

0
分享至



当大模型推理进入Parallel Thinking时代,一个关键问题随之出现:

模型在并行推理的过程中,究竟发生了什么?多条推理路径同时展开,看似为模型带来了更强的能力,却也引入了一个长期被忽视的问题——大量计算是否正在被浪费在已经「没有必要继续」的思考上?

为了回答这一问题,来自马里兰大学、圣路易斯华盛顿大学、北卡罗来纳大学教堂山分校等机构的研究团队提出了Parallel-Probe。不同于直接从算法设计出发,该研究首先通过引入2D Probing,对 online 并行推理过程中的全局动态性进行了系统性刻画。研究发现,并行推理并非一个「算得越多越好」的过程:全局共识往往在所有分支结束之前就已提前稳定,而少数冗长的长尾路径却持续占据大量计算资源,成为并行推理效率的主要瓶颈。

基于这些关键发现,研究团队进一步提出了一个 training-free 的并行推理控制算法 Parallel-Probe,能够在不牺牲核心准确率的前提下,显著减少无效计算,将推理延迟降低35.8%,总 token 成本降低25.8%。



  • 论文名称:Parallel-Probe: Towards Efficient Parallel Thinking via 2D Probing
  • 论文链接:
  • https://arxiv.org/pdf/2602.03845
  • Code:
  • https://github.com/zhengkid/Parallel-Probe
  • Online Judge:
  • https://huggingface.co/spaces/EfficientReasoning/efficient_reasoning_online_judgement

核心痛点:孤立的

「并行路径」到底带来了什么?

目前的并行推理方法(如多数投票机制)存在一个显著缺陷:各推理分支彼此独立。这意味着,即使大部分分支已经达成了共识,系统仍需等待所有分支(包括那些冗余的长尾路径)全部生成完毕。



研究人员提出,这种「局部视角」导致了严重的效率低下。通过系统2D 探测接口,研究团队揭示了并行推理的三大底层动态特征:

  • 非单调缩放:准确率并非随着算力投入单调增加,而是取决于「宽度」与「深度」的精细平衡(Figure (a))。
  • 路径长度不均:并行分支的生成长度差异极大,计算资源往往被少数「长尾」路径占据(Figure (b))。
  • 共识提早稳定:全局共识往往在所有分支结束前就已经达成(平均共识达成率仅为 0.31)(Figure (c))。

技术突破:基于全局信号的

「外科手术式」 2D Budget Control

即插即用:Parallel-Probe 是一种模型无关的方法,可直接适配各种现成的开源或闭源大语言模型。



针对上述发现,Parallel-Probe采用了一种 Training-Free 的轻量级控制器,通过两个核心机制优化同时从宽度和深度优化在线并行思考:

  • 基于共识的早期停止(Consensus-based Early Stopping):该机制周期性地从各分支中提取中间结果。一旦探测到全局多数答案在连续几个周期内保持稳定,控制器将直接终止整组推理,避免后续冗余步骤。

  • 基于偏差的分支剪枝(Deviation-based Branch Pruning):实时监控每一条路径。如果某条路径显著偏离了当前的全局大趋势(即出现异常),系统会果断对其进行「剔除」,将资源倾注在更有潜力的路径上。

实验结果:刷新帕累托前

研究团队在Qwen3系列模型(0.6B 至 8B)上进行了广泛测试,涵盖了 AIME 2024/2025 和 HMMT 2025 等高难度竞赛题库。



实验结果表明,Parallel-Probe 在性能、成本效率和延迟效率之间建立了更优的平衡点,系统性地优于现有的 ESC 和 SC 等基准方法。

基础设施贡献:SCOUT 测试床

为了推动该领域的持续研究,团队还推出了SCOUT(顺序与并发离线利用测试床)。该平台实现了推理生成与控制策略的解耦,允许开发者在极低开销下模拟各种缩放策略,极大提升了测试效率。



代码及 Online Judge 平台已开源:

  • GitHub:
  • https://github.com/zhengkid/Parallel-Probe
  • 平台:Efficient Reasoning Online Judge

本文作者

郑童,马里兰大学计算机科学系二年级博士生,研究方向聚焦于Reasoning尤其是Parallel Thinking(并行思考)。他的研究关注如何打破传统顺序推理在效率与鲁棒性上的瓶颈,使大语言模型能够以更结构化、更高效的方式进行并行推理。代表性工作包括Parallel-R1,该工作首次提出基于强化学习的框架,在真实世界推理任务中自适应地激励并行思考行为;以及MoT(Mixture of Thoughts),系统性地构建多推理模态的并行思考机制,在训练与推理阶段统一整合自然语言、代码与符号推理等不同模态,从而实现更高效、更具表达力的并行推理。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
出海更难了!俄朝图们江公路大桥合拢,预计今年6月正式通车

出海更难了!俄朝图们江公路大桥合拢,预计今年6月正式通车

全城探秘
2026-04-22 16:41:13
我有罪,大导演昆汀花1万美金,在包房舔脚半小时,直到皮肤起皱

我有罪,大导演昆汀花1万美金,在包房舔脚半小时,直到皮肤起皱

西楼知趣杂谈
2026-04-20 08:40:47
任泽平退款731万,恒大高管们开始退钱了

任泽平退款731万,恒大高管们开始退钱了

互联网大观
2026-04-22 13:44:17
伊朗“宫斗”分出胜负?12小时就改口要谈判,改革派重新占据上风

伊朗“宫斗”分出胜负?12小时就改口要谈判,改革派重新占据上风

民间胡扯老哥
2026-04-22 05:07:48
腾讯与阿里巴巴洽谈投资DeepSeek 估值超过200亿美元

腾讯与阿里巴巴洽谈投资DeepSeek 估值超过200亿美元

财联社
2026-04-22 19:24:36
日舰闯台海3天后,高市被逼辞职,岸田已扛旗,052D抵近奄美大岛

日舰闯台海3天后,高市被逼辞职,岸田已扛旗,052D抵近奄美大岛

古事寻踪记
2026-04-22 07:16:16
情侣约会求“刺激”,双双被抓,审讯时互相甩锅

情侣约会求“刺激”,双双被抓,审讯时互相甩锅

深圳晚报
2026-04-22 10:11:17
山西忻州市公务员局发布情况说明:杨某媛(女)与自媒体贴文中所分析的杨某媛并非同一人

山西忻州市公务员局发布情况说明:杨某媛(女)与自媒体贴文中所分析的杨某媛并非同一人

环球网资讯
2026-04-22 16:51:03
医院的专家号刚放出就瞬间“秒空”,上海三甲医院紧急报警!警方:对倒卖医院号源犯罪团伙的李某、郑某等人依法刑事拘留

医院的专家号刚放出就瞬间“秒空”,上海三甲医院紧急报警!警方:对倒卖医院号源犯罪团伙的李某、郑某等人依法刑事拘留

大风新闻
2026-04-22 15:12:13
深度 |大限到期,一日之内极限反转,特朗普为何延长停火?伊朗为何不领情?

深度 |大限到期,一日之内极限反转,特朗普为何延长停火?伊朗为何不领情?

上观新闻
2026-04-22 17:19:03
乌克兰没钱打俄罗斯了!国库见底外援青黄不接,普通人积蓄一夜缩水民不聊生

乌克兰没钱打俄罗斯了!国库见底外援青黄不接,普通人积蓄一夜缩水民不聊生

网易新闻出品
2026-04-22 18:42:46
朝鲜发声痛批日本,要求日本向中国道歉:针对中国驻日使馆的连环恐怖威胁,是对国际法的粗暴违反与公然挑衅

朝鲜发声痛批日本,要求日本向中国道歉:针对中国驻日使馆的连环恐怖威胁,是对国际法的粗暴违反与公然挑衅

大风新闻
2026-04-22 18:42:23
央视曝光:“哪吒”造车3年亏损183亿,多地国资投资难追回,倒贴式招商引资伤了谁?

央视曝光:“哪吒”造车3年亏损183亿,多地国资投资难追回,倒贴式招商引资伤了谁?

新京报政事儿
2026-04-21 23:04:31
演员王大陆一审被判刑

演员王大陆一审被判刑

极目新闻
2026-04-22 12:35:08
高99米,北京最高摩天轮欢乐谷“大眼京”预计6月28日运营

高99米,北京最高摩天轮欢乐谷“大眼京”预计6月28日运营

新京报
2026-04-22 13:06:20
2032奥运主办地确定,结果吃惊全球,奥运格局将重塑

2032奥运主办地确定,结果吃惊全球,奥运格局将重塑

天马幸福的人生
2026-04-22 06:41:59
英雄航天员陈冬肩章已更为少将军衔 系我国第二批航天员,在轨时长超400天

英雄航天员陈冬肩章已更为少将军衔 系我国第二批航天员,在轨时长超400天

红星新闻
2026-04-22 16:31:28
季后赛破5000分!杜兰特复出23+6仍输 下半场仅3分全场9失误

季后赛破5000分!杜兰特复出23+6仍输 下半场仅3分全场9失误

醉卧浮生
2026-04-22 13:17:43
爆料疯传!中南医院“王护士长”被扒,她到底有没有问题?

爆料疯传!中南医院“王护士长”被扒,她到底有没有问题?

坠入二次元的海洋
2026-04-22 10:14:47
5月1日起正式严打!8类灰色行为直接入刑,所有人务必警惕

5月1日起正式严打!8类灰色行为直接入刑,所有人务必警惕

另子维爱读史
2026-04-22 07:39:03
2026-04-22 19:56:49
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12831文章数 142633关注度
往期回顾 全部

科技要闻

对话梅涛:没有视频底座,具身智能走不远

头条要闻

朝鲜发声痛批日本 要求日本向中国道歉

头条要闻

朝鲜发声痛批日本 要求日本向中国道歉

体育要闻

网易传媒再度签约法国队和阿根廷队

娱乐要闻

复婚无望!baby黄晓明陪小海绵零交流

财经要闻

伊朗拒绝出席 特朗普宣布延长停火期限

汽车要闻

纯电续航301km+激光雷达 宋Pro DM-i飞驰版9.99万起

态度原创

时尚
亲子
旅游
教育
公开课

初夏穿赫本的白裤子,清新又高级!

亲子要闻

今起幼儿信息登记!登记后这两样保存好,后续报名都要用

旅游要闻

江苏两地入选!苏州再登“2025年游客满意十佳城市”

教育要闻

【媒体聚焦】南方工报 | 广东省教育研究院走进湛江开展教研帮扶

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版