网易首页 > 网易号 > 正文 申请入驻

Parallel-Probe问世,并行推理效率提升35.8%

0
分享至



当大模型推理进入Parallel Thinking时代,一个关键问题随之出现:

模型在并行推理的过程中,究竟发生了什么?多条推理路径同时展开,看似为模型带来了更强的能力,却也引入了一个长期被忽视的问题——大量计算是否正在被浪费在已经「没有必要继续」的思考上?

为了回答这一问题,来自马里兰大学、圣路易斯华盛顿大学、北卡罗来纳大学教堂山分校等机构的研究团队提出了Parallel-Probe。不同于直接从算法设计出发,该研究首先通过引入2D Probing,对 online 并行推理过程中的全局动态性进行了系统性刻画。研究发现,并行推理并非一个「算得越多越好」的过程:全局共识往往在所有分支结束之前就已提前稳定,而少数冗长的长尾路径却持续占据大量计算资源,成为并行推理效率的主要瓶颈。

基于这些关键发现,研究团队进一步提出了一个 training-free 的并行推理控制算法 Parallel-Probe,能够在不牺牲核心准确率的前提下,显著减少无效计算,将推理延迟降低35.8%,总 token 成本降低25.8%。



  • 论文名称:Parallel-Probe: Towards Efficient Parallel Thinking via 2D Probing
  • 论文链接:
  • https://arxiv.org/pdf/2602.03845
  • Code:
  • https://github.com/zhengkid/Parallel-Probe
  • Online Judge:
  • https://huggingface.co/spaces/EfficientReasoning/efficient_reasoning_online_judgement

核心痛点:孤立的

「并行路径」到底带来了什么?

目前的并行推理方法(如多数投票机制)存在一个显著缺陷:各推理分支彼此独立。这意味着,即使大部分分支已经达成了共识,系统仍需等待所有分支(包括那些冗余的长尾路径)全部生成完毕。



研究人员提出,这种「局部视角」导致了严重的效率低下。通过系统2D 探测接口,研究团队揭示了并行推理的三大底层动态特征:

  • 非单调缩放:准确率并非随着算力投入单调增加,而是取决于「宽度」与「深度」的精细平衡(Figure (a))。
  • 路径长度不均:并行分支的生成长度差异极大,计算资源往往被少数「长尾」路径占据(Figure (b))。
  • 共识提早稳定:全局共识往往在所有分支结束前就已经达成(平均共识达成率仅为 0.31)(Figure (c))。

技术突破:基于全局信号的

「外科手术式」 2D Budget Control

即插即用:Parallel-Probe 是一种模型无关的方法,可直接适配各种现成的开源或闭源大语言模型。



针对上述发现,Parallel-Probe采用了一种 Training-Free 的轻量级控制器,通过两个核心机制优化同时从宽度和深度优化在线并行思考:

  • 基于共识的早期停止(Consensus-based Early Stopping):该机制周期性地从各分支中提取中间结果。一旦探测到全局多数答案在连续几个周期内保持稳定,控制器将直接终止整组推理,避免后续冗余步骤。

  • 基于偏差的分支剪枝(Deviation-based Branch Pruning):实时监控每一条路径。如果某条路径显著偏离了当前的全局大趋势(即出现异常),系统会果断对其进行「剔除」,将资源倾注在更有潜力的路径上。

实验结果:刷新帕累托前

研究团队在Qwen3系列模型(0.6B 至 8B)上进行了广泛测试,涵盖了 AIME 2024/2025 和 HMMT 2025 等高难度竞赛题库。



实验结果表明,Parallel-Probe 在性能、成本效率和延迟效率之间建立了更优的平衡点,系统性地优于现有的 ESC 和 SC 等基准方法。

基础设施贡献:SCOUT 测试床

为了推动该领域的持续研究,团队还推出了SCOUT(顺序与并发离线利用测试床)。该平台实现了推理生成与控制策略的解耦,允许开发者在极低开销下模拟各种缩放策略,极大提升了测试效率。



代码及 Online Judge 平台已开源:

  • GitHub:
  • https://github.com/zhengkid/Parallel-Probe
  • 平台:Efficient Reasoning Online Judge

本文作者

郑童,马里兰大学计算机科学系二年级博士生,研究方向聚焦于Reasoning尤其是Parallel Thinking(并行思考)。他的研究关注如何打破传统顺序推理在效率与鲁棒性上的瓶颈,使大语言模型能够以更结构化、更高效的方式进行并行推理。代表性工作包括Parallel-R1,该工作首次提出基于强化学习的框架,在真实世界推理任务中自适应地激励并行思考行为;以及MoT(Mixture of Thoughts),系统性地构建多推理模态的并行思考机制,在训练与推理阶段统一整合自然语言、代码与符号推理等不同模态,从而实现更高效、更具表达力的并行推理。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
第一个帮助中国的日本企业,不留余力提供技术!如今怎么样了?

第一个帮助中国的日本企业,不留余力提供技术!如今怎么样了?

博览历史
2025-10-07 17:13:05
万万没想到,一个母亲节,就将郭麒麟的尴尬处境暴露无遗

万万没想到,一个母亲节,就将郭麒麟的尴尬处境暴露无遗

凛若秋霜
2026-05-11 14:03:53
一旦战争,美军敢用战斧导弹打中国吗?张召忠:能令它掉头打美国

一旦战争,美军敢用战斧导弹打中国吗?张召忠:能令它掉头打美国

阿嘵田侃故事
2026-05-12 05:28:47
英国的大变化:就连苏格兰也坐不住了

英国的大变化:就连苏格兰也坐不住了

寰宇大观察
2026-05-11 17:57:41
高芙救赛点逆转约维奇进八强,卡林首败奥胖拒绝握手引发争议

高芙救赛点逆转约维奇进八强,卡林首败奥胖拒绝握手引发争议

网球之家
2026-05-11 23:58:34
两天新增超2000套!南京学区房,彻底变天

两天新增超2000套!南京学区房,彻底变天

地产锐评
2026-05-11 18:34:09
根本卖不掉!连续6个一字跌停,封单超百万手,有人已亏91万

根本卖不掉!连续6个一字跌停,封单超百万手,有人已亏91万

财经智多星
2026-05-11 15:26:15
西汉姆联就挑战PGMOL做出重大法律决定 | 西汉姆联新闻

西汉姆联就挑战PGMOL做出重大法律决定 | 西汉姆联新闻

绿茵情报局
2026-05-11 22:20:05
日经亚洲突然爆出重磅消息!中国给国内所有芯片厂下一道"死命令"

日经亚洲突然爆出重磅消息!中国给国内所有芯片厂下一道"死命令"

阿七说史
2026-05-11 15:23:09
油价飙升,莫迪呼吁全民:居家办公、别买黄金、取消海外婚礼

油价飙升,莫迪呼吁全民:居家办公、别买黄金、取消海外婚礼

红星新闻
2026-05-11 12:09:16
利好曼联!世界级中场亲承加盟,5 年合同接近谈妥

利好曼联!世界级中场亲承加盟,5 年合同接近谈妥

澜归序
2026-05-12 02:35:37
穿极简风的夏天,是真高级!

穿极简风的夏天,是真高级!

Yuki女人故事
2026-05-11 23:07:08
彻底崩了!伊朗开火了!

彻底崩了!伊朗开火了!

大嘴说天下
2026-05-11 19:19:45
深圳航空再接收一架“最赚钱飞机”

深圳航空再接收一架“最赚钱飞机”

Thurman在昆明
2026-05-11 18:09:54
没有外援就拔刀相向?神权杖硬刚枪杆子,塔利班进入内斗阶段!

没有外援就拔刀相向?神权杖硬刚枪杆子,塔利班进入内斗阶段!

寰球经纬所
2026-05-10 10:55:10
两年服役8艘盾舰,吊打美俄、接近中国,印度啥时候这么神速了?

两年服役8艘盾舰,吊打美俄、接近中国,印度啥时候这么神速了?

咸鱼金脑袋
2026-05-12 05:53:34
中国大学“校史虚构大赛”:谁在争抢“第一”?

中国大学“校史虚构大赛”:谁在争抢“第一”?

深度报
2026-05-09 23:35:25
45岁独身男子病逝,73岁叔叔称每天陪伴侄子治疗却无法继承房产和15万存款,“被告知不属于法定继承人”;已起诉民政局要求分割遗产

45岁独身男子病逝,73岁叔叔称每天陪伴侄子治疗却无法继承房产和15万存款,“被告知不属于法定继承人”;已起诉民政局要求分割遗产

都市快报橙柿互动
2026-05-11 00:20:38
《陈翔六点半》人走茶凉,赚不到钱球球退出,根本原因早就注定了

《陈翔六点半》人走茶凉,赚不到钱球球退出,根本原因早就注定了

汪巗的创业之路
2026-05-06 12:26:17
苹果iOS/iPadOS 26.5正式版发布

苹果iOS/iPadOS 26.5正式版发布

IT之家
2026-05-12 01:45:58
2026-05-12 07:47:00
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12970文章数 142648关注度
往期回顾 全部

科技要闻

黄仁勋:你们赶上了一代人一次的大机会

头条要闻

女子连上20多天瑜伽课被教练踢出群聊:天天来 不累吗

头条要闻

女子连上20多天瑜伽课被教练踢出群聊:天天来 不累吗

体育要闻

梁靖崑:可能是最后一届了,想让大家记住这个我

娱乐要闻

“孕妇坠崖案”王暖暖称被霸凌协商解约

财经要闻

宗馥莉罢免销售负责人 部分业务将外包

汽车要闻

吉利银河“TT”申报图曝光 电动尾翼+激光雷达

态度原创

家居
艺术
房产
手机
游戏

家居要闻

多元生活 此处无声

艺术要闻

人民币78岁了!你见没见过的人民币,都在这里!

房产要闻

产业赋能教育!翰林府与北师大的这场签约,绝不那么简单!

手机要闻

苹果iOS/iPadOS 26.5发布 RCS 端到端加密上线 新增彩虹墙纸与地图推荐

计划报废?玩家质疑为什么PS5越更新画质越差!

无障碍浏览 进入关怀版