网易首页 > 网易号 > 正文 申请入驻

Parallel-Probe问世,并行推理效率提升35.8%

0
分享至



当大模型推理进入Parallel Thinking时代,一个关键问题随之出现:

模型在并行推理的过程中,究竟发生了什么?多条推理路径同时展开,看似为模型带来了更强的能力,却也引入了一个长期被忽视的问题——大量计算是否正在被浪费在已经「没有必要继续」的思考上?

为了回答这一问题,来自马里兰大学、圣路易斯华盛顿大学、北卡罗来纳大学教堂山分校等机构的研究团队提出了Parallel-Probe。不同于直接从算法设计出发,该研究首先通过引入2D Probing,对 online 并行推理过程中的全局动态性进行了系统性刻画。研究发现,并行推理并非一个「算得越多越好」的过程:全局共识往往在所有分支结束之前就已提前稳定,而少数冗长的长尾路径却持续占据大量计算资源,成为并行推理效率的主要瓶颈。

基于这些关键发现,研究团队进一步提出了一个 training-free 的并行推理控制算法 Parallel-Probe,能够在不牺牲核心准确率的前提下,显著减少无效计算,将推理延迟降低35.8%,总 token 成本降低25.8%。



  • 论文名称:Parallel-Probe: Towards Efficient Parallel Thinking via 2D Probing
  • 论文链接:
  • https://arxiv.org/pdf/2602.03845
  • Code:
  • https://github.com/zhengkid/Parallel-Probe
  • Online Judge:
  • https://huggingface.co/spaces/EfficientReasoning/efficient_reasoning_online_judgement

核心痛点:孤立的

「并行路径」到底带来了什么?

目前的并行推理方法(如多数投票机制)存在一个显著缺陷:各推理分支彼此独立。这意味着,即使大部分分支已经达成了共识,系统仍需等待所有分支(包括那些冗余的长尾路径)全部生成完毕。



研究人员提出,这种「局部视角」导致了严重的效率低下。通过系统2D 探测接口,研究团队揭示了并行推理的三大底层动态特征:

  • 非单调缩放:准确率并非随着算力投入单调增加,而是取决于「宽度」与「深度」的精细平衡(Figure (a))。
  • 路径长度不均:并行分支的生成长度差异极大,计算资源往往被少数「长尾」路径占据(Figure (b))。
  • 共识提早稳定:全局共识往往在所有分支结束前就已经达成(平均共识达成率仅为 0.31)(Figure (c))。

技术突破:基于全局信号的

「外科手术式」 2D Budget Control

即插即用:Parallel-Probe 是一种模型无关的方法,可直接适配各种现成的开源或闭源大语言模型。



针对上述发现,Parallel-Probe采用了一种 Training-Free 的轻量级控制器,通过两个核心机制优化同时从宽度和深度优化在线并行思考:

  • 基于共识的早期停止(Consensus-based Early Stopping):该机制周期性地从各分支中提取中间结果。一旦探测到全局多数答案在连续几个周期内保持稳定,控制器将直接终止整组推理,避免后续冗余步骤。

  • 基于偏差的分支剪枝(Deviation-based Branch Pruning):实时监控每一条路径。如果某条路径显著偏离了当前的全局大趋势(即出现异常),系统会果断对其进行「剔除」,将资源倾注在更有潜力的路径上。

实验结果:刷新帕累托前

研究团队在Qwen3系列模型(0.6B 至 8B)上进行了广泛测试,涵盖了 AIME 2024/2025 和 HMMT 2025 等高难度竞赛题库。



实验结果表明,Parallel-Probe 在性能、成本效率和延迟效率之间建立了更优的平衡点,系统性地优于现有的 ESC 和 SC 等基准方法。

基础设施贡献:SCOUT 测试床

为了推动该领域的持续研究,团队还推出了SCOUT(顺序与并发离线利用测试床)。该平台实现了推理生成与控制策略的解耦,允许开发者在极低开销下模拟各种缩放策略,极大提升了测试效率。



代码及 Online Judge 平台已开源:

  • GitHub:
  • https://github.com/zhengkid/Parallel-Probe
  • 平台:Efficient Reasoning Online Judge

本文作者

郑童,马里兰大学计算机科学系二年级博士生,研究方向聚焦于Reasoning尤其是Parallel Thinking(并行思考)。他的研究关注如何打破传统顺序推理在效率与鲁棒性上的瓶颈,使大语言模型能够以更结构化、更高效的方式进行并行推理。代表性工作包括Parallel-R1,该工作首次提出基于强化学习的框架,在真实世界推理任务中自适应地激励并行思考行为;以及MoT(Mixture of Thoughts),系统性地构建多推理模态的并行思考机制,在训练与推理阶段统一整合自然语言、代码与符号推理等不同模态,从而实现更高效、更具表达力的并行推理。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
马季徒孙李寅飞,爆料:岳云鹏成名之前,李菁、栾云平,都挤兑他

马季徒孙李寅飞,爆料:岳云鹏成名之前,李菁、栾云平,都挤兑他

离离言几许
2026-03-07 17:28:09
国民党在花莲选情稳了?民进党拟不自提县长人选,反傅势力难整合

国民党在花莲选情稳了?民进党拟不自提县长人选,反傅势力难整合

海峡导报社
2026-03-09 07:14:02
执掌苏宁30年,从江苏首富到资产清零!张近东经历了什么?

执掌苏宁30年,从江苏首富到资产清零!张近东经历了什么?

新浪财经
2026-03-05 21:16:23
中国古代历史上“最牛”的地方割据势力,传承29世,割据724年!

中国古代历史上“最牛”的地方割据势力,传承29世,割据724年!

小豫讲故事
2026-03-07 06:00:06
芬兰总理:来故宫才明白,中国不是大国崛起,只是在重回历史巅峰

芬兰总理:来故宫才明白,中国不是大国崛起,只是在重回历史巅峰

近史谈
2026-03-06 13:57:51
新领袖接棒,公开叫板美国!通胀风暴来袭,全球资产将如何重估?

新领袖接棒,公开叫板美国!通胀风暴来袭,全球资产将如何重估?

柏年说政经
2026-03-09 18:01:00
第二批栽在黄金里的人醒了!3月9日暴跌后才懂:全是“贪”惹的祸

第二批栽在黄金里的人醒了!3月9日暴跌后才懂:全是“贪”惹的祸

说故事的阿袭
2026-03-10 07:40:37
42岁王宝强形象大变!为配学霸女友不惜整容,戴金框眼镜撞脸汪小菲

42岁王宝强形象大变!为配学霸女友不惜整容,戴金框眼镜撞脸汪小菲

八卦王者
2026-03-08 11:16:11
惊魂24小时!美企中东大撤退:数据中心被炸,百亿投资说扔就扔

惊魂24小时!美企中东大撤退:数据中心被炸,百亿投资说扔就扔

蓝色海边
2026-03-09 13:15:43
看上海外婆,再看北京姥姥,我悟了:老了尽量少戴黄金、穿老年装

看上海外婆,再看北京姥姥,我悟了:老了尽量少戴黄金、穿老年装

孤傲何妨初
2026-03-03 14:35:38
6家房企老板长居香港,是为拯救企业,还是另有打算?

6家房企老板长居香港,是为拯救企业,还是另有打算?

帅真商业
2026-03-09 18:52:41
营收增速超迪士尼20倍,新中式乐园凭什么火遍全国?

营收增速超迪士尼20倍,新中式乐园凭什么火遍全国?

Tech星球
2026-03-09 11:24:58
旅游院长戴斌谈景区大门越修越远,不让私家车进:为了卖观光车票

旅游院长戴斌谈景区大门越修越远,不让私家车进:为了卖观光车票

阿昌走遍中国
2026-03-09 11:20:57
2026年清明节不一般,扫墓要推迟?提醒大家4件事早做准备!

2026年清明节不一般,扫墓要推迟?提醒大家4件事早做准备!

有范又有料
2026-03-07 14:14:16
中国2000多个县城的生存现状:除了性生活就是打麻将!

中国2000多个县城的生存现状:除了性生活就是打麻将!

谈史论天地
2026-03-03 18:02:29
回顾:嫂子放风月片勾引小叔,两人缠绵过后,小叔子活活掐死了她

回顾:嫂子放风月片勾引小叔,两人缠绵过后,小叔子活活掐死了她

谈史论天地
2026-03-09 10:18:22
“化橘红”火了,这个小果子怎么吃?有啥用?

“化橘红”火了,这个小果子怎么吃?有啥用?

大象新闻
2026-03-10 08:19:15
54岁杨钰莹近况曝光:定居深圳,每天打理菜园子,生活平淡

54岁杨钰莹近况曝光:定居深圳,每天打理菜园子,生活平淡

小徐讲八卦
2025-11-17 07:29:28
四川女人被拐山东,生下女儿后逃走,女儿长大后骑行10年千里寻母

四川女人被拐山东,生下女儿后逃走,女儿长大后骑行10年千里寻母

叹为观止易
2026-03-09 20:27:00
湖人拍摄全家福!东契奇搞怪把名字贴额头 詹姆斯布朗尼笑容满面

湖人拍摄全家福!东契奇搞怪把名字贴额头 詹姆斯布朗尼笑容满面

罗说NBA
2026-03-10 06:29:24
2026-03-10 08:55:00
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12452文章数 142579关注度
往期回顾 全部

科技要闻

OpenClaw更新,"养虾"再也不会犯健忘症了

头条要闻

牛弹琴:特朗普放风要停战 伊朗称正为美国准备"惊喜"

头条要闻

牛弹琴:特朗普放风要停战 伊朗称正为美国准备"惊喜"

体育要闻

36连胜终结!大魔王也是可以战胜的

娱乐要闻

薛之谦老婆怀二胎,现身产检心情愉快

财经要闻

"养虾"生意经:有人卖铲,有人做保镖

汽车要闻

对标奔驰小号G级 路虎小型卫士最新消息曝光

态度原创

游戏
家居
时尚
旅游
手机

《风之马传说》Steam特别好评 当个古代快递员

家居要闻

独栋独院 精致亲子墅

今年最流行的5条半裙,怎么搭都好看!

旅游要闻

中国入境游活力迸发

手机要闻

苹果发布iOS 26.4开发者预览版Beta 4:可关闭液态玻璃刺眼高亮效果

无障碍浏览 进入关怀版