网易首页 > 网易号 > 正文 申请入驻

登顶SuperCLUE DeepSearch,openPangu-R-72B深度搜索能力跃升

0
分享至

机器之心发布

机器之心编辑部

随着大模型推理和 Agent 工具调用能力的快速发展,其通过反复搜索处理复杂信息需求的效果愈发受到业界关注。近日,第三方评测机构 SuperCLUE 发布 11 月 DeepSearch 评测报告,国产大模型 openPangu-R-72B 凭借在长链推理、复杂信息检索领域的卓越表现,在模型榜单中名列第一,体现了基于国产昇腾算力的大模型研发实力。



这款 MoE 架构模型,究竟藏着哪些技术秘密,能在激烈竞争中脱颖而出?

硬核技术底座:

MoE 架构下的效率与性能平衡术

openPangu-R-72B 为考虑效率和性能平衡,重新设计了模型底座架构。作为基于昇腾集群训练的 MoE(混合专家)模型,它采用 80 选 8 的专家选择机制,在 74B 总参数量的基础上,将激活参数量控制在 15B,既保留了大模型的复杂推理能力,又有效降低了计算开销。24T tokens 的训练数据与 128k 长序列处理能力,为其处理深度搜索任务中的长文本信息奠定了基础。

为实现稳定收敛与效果提升,openPangu 团队在预训练技术上完成了以下优化。



图. openPangu-R-72B 模型架构

1)注意力机制层面引入参数式 Sink Token 技术:有效缓解了极大激活值问题,不仅提升了训练过程的稳定性,也对后续量化更加亲和;

2)采用 K-Norm 与 Depth-Scaled Sandwich-Norm 组合的架构,其中 K-Norm 仅对 attention 的 key 施加 RMS Norm,在达到与 QK-Norm 相当稳定性的同时,降低计算开销,还保留了 Query 更灵活的表达能力。

3)注意力架构的优化兼顾了精度与效率:通过增加 Query 头数和注意力头维度,让模型能从更多角度捕获细粒度语义关系;引入 Partial RoPE 机制,仅对 Query 和 Key 中 1/3 维度应用位置编码。通过将 KV 组数量减半,在 Key 头维度增加的情况下,仍实现了 37.5% 的 KV cache 缩减,平衡了推理阶段的显存占用、速度与模型效果。

4)Adaptive Aux Free 负载优化技术:Aux free 升级版本,通过自适应调整各个专家负载 bias 的更新幅度,有效减少均衡震荡,让专家负载分布更均衡。

DeepSearch 专项突破:

三大优化破解复杂搜索难题

如果说技术底座是基础,那么针对深度搜索任务的后训练优化则是 openPangu-R-72B 登顶的关键。深度搜索作为大模型访问互联网获取深度信息的核心能力,其长链推理与工具调用水平直接决定模型的实用价值。openPangu-R-72B 通过后训练阶段进行长链难题合成、非索引信息处理、快慢思考融合三大策略,显著提升了模型 DeepSearch 能力。



图.openPangu-R-72B 模型深度搜索任务执行流程,该流程同时用于模型训练和评测

1)在长链 QA 难题合成方面,openPangu 团队在 DeepDiver-V2 和 WebExplorer 技术基础上,通过 query 条件模糊化将问题平均难度提升 10%,同时借鉴《Pushing Test-Time Scaling Limits of Deep Search with Asymmetric Verification》工作的思想,引入 verification agent,大幅提升用于训练问答对的准确性,让模型在复杂推理场景中 “见多识广”。

2)针对传统搜索引擎难以覆盖的非索引知识问答 —— 如官网附件中的财务数据、学术论文引文信息获取等场景,模型训练过程中注入了 “Planner 聚焦关键 URL+ URL_crawler 爬取网页 + Document_QA 识别下一步浏览链接” 的循环工作流,通过同一站点内的多跳浏览实现了深度信息搜集,突破了传统搜索引擎的信息边界。

3)步骤级快慢融合策略则让模型的 “思考” 更具效率。DeepSearch 的 ReACT 执行过程中,不同步骤的思考强度差异显著 ——Document_QA 需分析海量网页数据与表格,对推理精度要求更高;而普通工具调用步骤更侧重效率。为此,模型为不同步骤匹配不同思考模式:Document_QA 启用慢思考保障精度,其他步骤采用快思考提升速度,实现了精度与效率的平衡。

国产算力赋能:

openPangu 系列模型彰显集群优势

此次 SuperCLUE DeepSearch 评测登顶,不仅是 openPangu-R-72B 模型能力的体现,也彰显了国产算力与大模型研发深度融合的成效。作为基于昇腾集群训练的代表模型,openPangu-R-72B 证明了国产算力平台在支撑大参数量、高复杂度模型研发方面的坚实能力。

值得关注的是,openPangu-R-72B 的兄弟模型openPangu-718B在同期 SuperCLUE 通用榜单中斩获第二名,展现了该系列在不同任务场景下的全面实力。从深度搜索的 “单点突破” 到通用能力的 “全面开花”,openPangu 系列正以昇腾算力为根基,为国产大模型生态注做出更多贡献。

随着大模型在企业服务、学术研究、政务处理等领域的深度落地,深度搜索能力将成为模型实用化的核心竞争力。未来,随着 openPangu 系列模型的持续迭代,我们期待国产大模型在更多全球顶级评测中绽放光彩。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
越南副主席黄文欢,因不满反华被判死刑,投奔中国后,结局如何?

越南副主席黄文欢,因不满反华被判死刑,投奔中国后,结局如何?

近史谈
2026-02-15 07:41:48
对俄制裁30轮,结果自己损失万亿!高市早苗还在硬撑什么?

对俄制裁30轮,结果自己损失万亿!高市早苗还在硬撑什么?

范赊舍长
2026-02-15 19:53:14
春节还剩3天,社会上却出现这个“反常现象”,今年过年大变样?

春节还剩3天,社会上却出现这个“反常现象”,今年过年大变样?

不写散文诗
2026-02-14 16:56:37
欧洲富婆来中国旅游,回国一周后哭诉:瑞士跟中国差距一目了然

欧洲富婆来中国旅游,回国一周后哭诉:瑞士跟中国差距一目了然

而长终
2026-02-12 18:01:30
内蒙古一200斤男子欠5000万不还,被债主装进铁笼沉入80米水库,谁料,2年后才被捞出...

内蒙古一200斤男子欠5000万不还,被债主装进铁笼沉入80米水库,谁料,2年后才被捞出...

品读时刻
2026-02-11 17:18:30
在七千多的养老院住了一年才明白:再贵的养老院,也买不来这3样

在七千多的养老院住了一年才明白:再贵的养老院,也买不来这3样

小马达情感故事
2026-02-10 11:50:09
女孩当小姐,一晚要提供4到5次上门服务,2015年被亲人点到不赴约

女孩当小姐,一晚要提供4到5次上门服务,2015年被亲人点到不赴约

汉史趣闻
2025-11-08 09:27:32
iPhone17ProMax价格崩了,这次我是真想买

iPhone17ProMax价格崩了,这次我是真想买

3C毒物
2026-02-14 19:41:04
分手14年,释小龙何洁境遇天差地别,一个身家过亿,一个养不起娃

分手14年,释小龙何洁境遇天差地别,一个身家过亿,一个养不起娃

查尔菲的笔记
2026-01-09 22:17:44
陶阳大婚,郭德纲一家四口现身,王惠体重超200斤

陶阳大婚,郭德纲一家四口现身,王惠体重超200斤

菲儿爱蛋糕
2026-02-12 17:49:48
伊能静现身春晚彩排,打扮超级年轻,就是脸部有点浮肿不太自然

伊能静现身春晚彩排,打扮超级年轻,就是脸部有点浮肿不太自然

君笙的拂兮
2026-02-15 02:13:14
AI 开始网暴人类了!OpenClaw 被拒后怒发「小作文」开撕,网友:我站 AI

AI 开始网暴人类了!OpenClaw 被拒后怒发「小作文」开撕,网友:我站 AI

AppSo
2026-02-14 13:09:31
周总理当了27年总理,有四人先后担任第一副总理

周总理当了27年总理,有四人先后担任第一副总理

文史茶馆2020
2025-12-28 11:15:51
存起来,大年初一发朋友圈,就用这几句,喜庆又高级

存起来,大年初一发朋友圈,就用这几句,喜庆又高级

风起见你
2026-02-15 01:36:10
截胡曼城!阿森纳豪掷 9500 万抢人,阿尔特塔钦点纽卡王牌

截胡曼城!阿森纳豪掷 9500 万抢人,阿尔特塔钦点纽卡王牌

澜归序
2026-02-15 04:27:50
越来越乱!贝克汉姆或将迎来第一个长孙,但不是儿子的亲生血脉

越来越乱!贝克汉姆或将迎来第一个长孙,但不是儿子的亲生血脉

她不倾国倾城
2026-02-08 15:21:22
45岁富哥“北京肖哥”去世,前一天还晒老婆,死因曝光仇人都惋惜

45岁富哥“北京肖哥”去世,前一天还晒老婆,死因曝光仇人都惋惜

嫹笔牂牂
2025-12-31 07:07:52
回忆十八年前往事!曼联功勋铁卫:梅西不是最难防的

回忆十八年前往事!曼联功勋铁卫:梅西不是最难防的

臻体育
2026-02-15 21:37:26
终于有人管了!河南重磅发声:严禁换车头作秀 合规油车必须放行

终于有人管了!河南重磅发声:严禁换车头作秀 合规油车必须放行

原广工业
2026-02-15 11:13:38
等不了了?赖清德三军异动,中方定调:敢在春节动手,定不轻饶!

等不了了?赖清德三军异动,中方定调:敢在春节动手,定不轻饶!

观察者小海风
2026-02-13 11:42:55
2026-02-15 22:19:00
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12310文章数 142567关注度
往期回顾 全部

科技要闻

发春节红包的大厂都被约谈了

头条要闻

小米YU7刚交付20分钟传出一声巨响 车主看到裂痕崩溃

头条要闻

小米YU7刚交付20分钟传出一声巨响 车主看到裂痕崩溃

体育要闻

最戏剧性的花滑男单,冠军为什么是他?

娱乐要闻

河南春晚被骂上热搜!大量广告满屏AI

财经要闻

谁在掌控你的胃?起底百亿"飘香剂"江湖

汽车要闻

奔驰中国换帅:段建军离任,李德思接棒

态度原创

艺术
房产
数码
家居
手机

艺术要闻

159米!北京CBD最被低估的建筑:设计很能打,存在感却不高

房产要闻

三亚新机场,又传出新消息!

数码要闻

机械革命无界14 2026预热:Lunar Lake集成内存,无惧内存涨价

家居要闻

中古雅韵 乐韵伴日常

手机要闻

荣耀宣布推出旗下六款热门笔记本机型延长宝服务优化

无障碍浏览 进入关怀版