网易首页 > 网易号 > 正文 申请入驻

Parallel-Probe问世,并行推理效率提升35.8%

0
分享至



当大模型推理进入Parallel Thinking时代,一个关键问题随之出现:

模型在并行推理的过程中,究竟发生了什么?多条推理路径同时展开,看似为模型带来了更强的能力,却也引入了一个长期被忽视的问题——大量计算是否正在被浪费在已经「没有必要继续」的思考上?

为了回答这一问题,来自马里兰大学、圣路易斯华盛顿大学、北卡罗来纳大学教堂山分校等机构的研究团队提出了Parallel-Probe。不同于直接从算法设计出发,该研究首先通过引入2D Probing,对 online 并行推理过程中的全局动态性进行了系统性刻画。研究发现,并行推理并非一个「算得越多越好」的过程:全局共识往往在所有分支结束之前就已提前稳定,而少数冗长的长尾路径却持续占据大量计算资源,成为并行推理效率的主要瓶颈。

基于这些关键发现,研究团队进一步提出了一个 training-free 的并行推理控制算法 Parallel-Probe,能够在不牺牲核心准确率的前提下,显著减少无效计算,将推理延迟降低35.8%,总 token 成本降低25.8%。



  • 论文名称:Parallel-Probe: Towards Efficient Parallel Thinking via 2D Probing
  • 论文链接:
  • https://arxiv.org/pdf/2602.03845
  • Code:
  • https://github.com/zhengkid/Parallel-Probe
  • Online Judge:
  • https://huggingface.co/spaces/EfficientReasoning/efficient_reasoning_online_judgement

核心痛点:孤立的

「并行路径」到底带来了什么?

目前的并行推理方法(如多数投票机制)存在一个显著缺陷:各推理分支彼此独立。这意味着,即使大部分分支已经达成了共识,系统仍需等待所有分支(包括那些冗余的长尾路径)全部生成完毕。



研究人员提出,这种「局部视角」导致了严重的效率低下。通过系统2D 探测接口,研究团队揭示了并行推理的三大底层动态特征:

  • 非单调缩放:准确率并非随着算力投入单调增加,而是取决于「宽度」与「深度」的精细平衡(Figure (a))。
  • 路径长度不均:并行分支的生成长度差异极大,计算资源往往被少数「长尾」路径占据(Figure (b))。
  • 共识提早稳定:全局共识往往在所有分支结束前就已经达成(平均共识达成率仅为 0.31)(Figure (c))。

技术突破:基于全局信号的

「外科手术式」 2D Budget Control

即插即用:Parallel-Probe 是一种模型无关的方法,可直接适配各种现成的开源或闭源大语言模型。



针对上述发现,Parallel-Probe采用了一种 Training-Free 的轻量级控制器,通过两个核心机制优化同时从宽度和深度优化在线并行思考:

  • 基于共识的早期停止(Consensus-based Early Stopping):该机制周期性地从各分支中提取中间结果。一旦探测到全局多数答案在连续几个周期内保持稳定,控制器将直接终止整组推理,避免后续冗余步骤。

  • 基于偏差的分支剪枝(Deviation-based Branch Pruning):实时监控每一条路径。如果某条路径显著偏离了当前的全局大趋势(即出现异常),系统会果断对其进行「剔除」,将资源倾注在更有潜力的路径上。

实验结果:刷新帕累托前

研究团队在Qwen3系列模型(0.6B 至 8B)上进行了广泛测试,涵盖了 AIME 2024/2025 和 HMMT 2025 等高难度竞赛题库。



实验结果表明,Parallel-Probe 在性能、成本效率和延迟效率之间建立了更优的平衡点,系统性地优于现有的 ESC 和 SC 等基准方法。

基础设施贡献:SCOUT 测试床

为了推动该领域的持续研究,团队还推出了SCOUT(顺序与并发离线利用测试床)。该平台实现了推理生成与控制策略的解耦,允许开发者在极低开销下模拟各种缩放策略,极大提升了测试效率。



代码及 Online Judge 平台已开源:

  • GitHub:
  • https://github.com/zhengkid/Parallel-Probe
  • 平台:Efficient Reasoning Online Judge

本文作者

郑童,马里兰大学计算机科学系二年级博士生,研究方向聚焦于Reasoning尤其是Parallel Thinking(并行思考)。他的研究关注如何打破传统顺序推理在效率与鲁棒性上的瓶颈,使大语言模型能够以更结构化、更高效的方式进行并行推理。代表性工作包括Parallel-R1,该工作首次提出基于强化学习的框架,在真实世界推理任务中自适应地激励并行思考行为;以及MoT(Mixture of Thoughts),系统性地构建多推理模态的并行思考机制,在训练与推理阶段统一整合自然语言、代码与符号推理等不同模态,从而实现更高效、更具表达力的并行推理。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
半场:墨西哥2-0厄瓜多尔,基尼奥内斯传射,劳尔-希门尼斯建功

半场:墨西哥2-0厄瓜多尔,基尼奥内斯传射,劳尔-希门尼斯建功

懂球帝
2026-07-01 10:55:13
Shams:骑士前锋迪恩-韦德4年3900万美元加盟76人

Shams:骑士前锋迪恩-韦德4年3900万美元加盟76人

懂球帝
2026-07-01 10:55:14
杯子离开视线千万别喝!100mg“伟哥”下肚,比你想象的更可怕!

杯子离开视线千万别喝!100mg“伟哥”下肚,比你想象的更可怕!

宝哥精彩赛事
2026-07-01 02:17:07
别再自嗨了!人家4架飞机64枚隐身弹,已经摸到你家门口了

别再自嗨了!人家4架飞机64枚隐身弹,已经摸到你家门口了

戗词夺理
2026-06-30 19:46:53
35岁男子收到岗位被 AI 取代通知,拒绝大幅降薪后被单位开除。

35岁男子收到岗位被 AI 取代通知,拒绝大幅降薪后被单位开除。

HR蔷薇
2026-06-30 16:03:56
莱昂纳德重回多伦多!快船猛龙达成1换7交易 莺歌迪克奔赴洛城

莱昂纳德重回多伦多!快船猛龙达成1换7交易 莺歌迪克奔赴洛城

罗说NBA
2026-07-01 03:59:21
优必选全尺寸超仿生机器人11.98万元起:仅限成年人购买

优必选全尺寸超仿生机器人11.98万元起:仅限成年人购买

PChome电脑之家
2026-06-30 18:07:08
全新宝马X5将于6月30日全球首发!网友:内饰给到夯

全新宝马X5将于6月30日全球首发!网友:内饰给到夯

汽车网评
2026-06-30 22:35:50
法拉利被当滑梯后续:4名家长只愿赔五百,警方介入车主硬气维权

法拉利被当滑梯后续:4名家长只愿赔五百,警方介入车主硬气维权

米果说识
2026-06-30 14:23:02
花20万为娃办借读,学籍是假的、体育成绩是假的、中考准考证都是假的,孩子无缘中考;家长报警

花20万为娃办借读,学籍是假的、体育成绩是假的、中考准考证都是假的,孩子无缘中考;家长报警

大风新闻
2026-07-01 06:22:03
没有并列!姆巴佩同样打入6球,但世界杯金靴之争已领先梅西

没有并列!姆巴佩同样打入6球,但世界杯金靴之争已领先梅西

全景体育V
2026-07-01 07:48:21
巴西总统:感谢安帅没换下卡塞米罗,我和身边人都说把他换下

巴西总统:感谢安帅没换下卡塞米罗,我和身边人都说把他换下

懂球帝
2026-07-01 09:31:15
Shams:肯纳德2年1300万美元签约太阳,第二年球员选项

Shams:肯纳德2年1300万美元签约太阳,第二年球员选项

懂球帝
2026-07-01 09:53:22
千里偏航到泌阳,“虹吸执法”:没有最荒诞,只有更荒诞 | 何兰生

千里偏航到泌阳,“虹吸执法”:没有最荒诞,只有更荒诞 | 何兰生

农见度
2026-07-01 10:20:16
成都突发车祸致3死1伤!警方通报:女司机驾车撞电动车后又撞桥墩

成都突发车祸致3死1伤!警方通报:女司机驾车撞电动车后又撞桥墩

听心堂
2026-06-30 22:37:52
WTT美国大满贯乱了:随着佐藤瞳3-0,3大世界前十的名将已经出局

WTT美国大满贯乱了:随着佐藤瞳3-0,3大世界前十的名将已经出局

侧身凌空斩
2026-07-01 09:46:45
第86分钟绝杀!哈兰德3场5球紧追梅西,挪威2:1挺进16强约战巴西

第86分钟绝杀!哈兰德3场5球紧追梅西,挪威2:1挺进16强约战巴西

阿超他的体育圈
2026-07-01 03:02:09
南非“清算日”临近:持砍刀民兵挨家清场,南非正在变成人间地狱

南非“清算日”临近:持砍刀民兵挨家清场,南非正在变成人间地狱

热点大放送
2026-07-01 03:53:46
2年1300万!神射手肯纳德签约太阳 詹姆斯后湖人又损失一大主力

2年1300万!神射手肯纳德签约太阳 詹姆斯后湖人又损失一大主力

醉卧浮生
2026-07-01 10:01:32
世界杯超保真死亡之组!4队全死完了:3队进32强 短短2天都被淘汰

世界杯超保真死亡之组!4队全死完了:3队进32强 短短2天都被淘汰

风过乡
2026-07-01 07:11:43
2026-07-01 11:28:49
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
13405文章数 142685关注度
往期回顾 全部

科技要闻

美国放行,Anthropic两款顶级模型将恢复

头条要闻

美伊双方代表前往多哈 谈判方式出现“重大倒退”

头条要闻

美伊双方代表前往多哈 谈判方式出现“重大倒退”

体育要闻

德国足球,脸都不要了

娱乐要闻

罗晋大孤山素颜照,秃顶白发引热议

财经要闻

新氧贷款:宣传年化15%,实际顶格24%

汽车要闻

奇瑞风云A9探店 五个理由一定来看看

态度原创

教育
时尚
旅游
本地
健康

教育要闻

UKCISA最新调查:英语考试选择太多反成留学生的困扰?

Meiinpsn的穿衣风格,清新又叛逆

旅游要闻

避暑之都点亮避暑经济|一张票根撬动全城消费!贵阳票根经济探秘

本地新闻

贵州小城的新目标:举办“村超”世界杯!

狂吃“糯叽叽”小心肠梗阻!

无障碍浏览 进入关怀版