网易首页 > 网易号 > 正文 申请入驻

登顶SuperCLUE DeepSearch,openPangu-R-72B深度搜索能力跃升

0
分享至

机器之心发布

机器之心编辑部

随着大模型推理和 Agent 工具调用能力的快速发展,其通过反复搜索处理复杂信息需求的效果愈发受到业界关注。近日,第三方评测机构 SuperCLUE 发布 11 月 DeepSearch 评测报告,国产大模型 openPangu-R-72B 凭借在长链推理、复杂信息检索领域的卓越表现,在模型榜单中名列第一,体现了基于国产昇腾算力的大模型研发实力。



这款 MoE 架构模型,究竟藏着哪些技术秘密,能在激烈竞争中脱颖而出?

硬核技术底座:

MoE 架构下的效率与性能平衡术

openPangu-R-72B 为考虑效率和性能平衡,重新设计了模型底座架构。作为基于昇腾集群训练的 MoE(混合专家)模型,它采用 80 选 8 的专家选择机制,在 74B 总参数量的基础上,将激活参数量控制在 15B,既保留了大模型的复杂推理能力,又有效降低了计算开销。24T tokens 的训练数据与 128k 长序列处理能力,为其处理深度搜索任务中的长文本信息奠定了基础。

为实现稳定收敛与效果提升,openPangu 团队在预训练技术上完成了以下优化。



图. openPangu-R-72B 模型架构

1)注意力机制层面引入参数式 Sink Token 技术:有效缓解了极大激活值问题,不仅提升了训练过程的稳定性,也对后续量化更加亲和;

2)采用 K-Norm 与 Depth-Scaled Sandwich-Norm 组合的架构,其中 K-Norm 仅对 attention 的 key 施加 RMS Norm,在达到与 QK-Norm 相当稳定性的同时,降低计算开销,还保留了 Query 更灵活的表达能力。

3)注意力架构的优化兼顾了精度与效率:通过增加 Query 头数和注意力头维度,让模型能从更多角度捕获细粒度语义关系;引入 Partial RoPE 机制,仅对 Query 和 Key 中 1/3 维度应用位置编码。通过将 KV 组数量减半,在 Key 头维度增加的情况下,仍实现了 37.5% 的 KV cache 缩减,平衡了推理阶段的显存占用、速度与模型效果。

4)Adaptive Aux Free 负载优化技术:Aux free 升级版本,通过自适应调整各个专家负载 bias 的更新幅度,有效减少均衡震荡,让专家负载分布更均衡。

DeepSearch 专项突破:

三大优化破解复杂搜索难题

如果说技术底座是基础,那么针对深度搜索任务的后训练优化则是 openPangu-R-72B 登顶的关键。深度搜索作为大模型访问互联网获取深度信息的核心能力,其长链推理与工具调用水平直接决定模型的实用价值。openPangu-R-72B 通过后训练阶段进行长链难题合成、非索引信息处理、快慢思考融合三大策略,显著提升了模型 DeepSearch 能力。



图.openPangu-R-72B 模型深度搜索任务执行流程,该流程同时用于模型训练和评测

1)在长链 QA 难题合成方面,openPangu 团队在 DeepDiver-V2 和 WebExplorer 技术基础上,通过 query 条件模糊化将问题平均难度提升 10%,同时借鉴《Pushing Test-Time Scaling Limits of Deep Search with Asymmetric Verification》工作的思想,引入 verification agent,大幅提升用于训练问答对的准确性,让模型在复杂推理场景中 “见多识广”。

2)针对传统搜索引擎难以覆盖的非索引知识问答 —— 如官网附件中的财务数据、学术论文引文信息获取等场景,模型训练过程中注入了 “Planner 聚焦关键 URL+ URL_crawler 爬取网页 + Document_QA 识别下一步浏览链接” 的循环工作流,通过同一站点内的多跳浏览实现了深度信息搜集,突破了传统搜索引擎的信息边界。

3)步骤级快慢融合策略则让模型的 “思考” 更具效率。DeepSearch 的 ReACT 执行过程中,不同步骤的思考强度差异显著 ——Document_QA 需分析海量网页数据与表格,对推理精度要求更高;而普通工具调用步骤更侧重效率。为此,模型为不同步骤匹配不同思考模式:Document_QA 启用慢思考保障精度,其他步骤采用快思考提升速度,实现了精度与效率的平衡。

国产算力赋能:

openPangu 系列模型彰显集群优势

此次 SuperCLUE DeepSearch 评测登顶,不仅是 openPangu-R-72B 模型能力的体现,也彰显了国产算力与大模型研发深度融合的成效。作为基于昇腾集群训练的代表模型,openPangu-R-72B 证明了国产算力平台在支撑大参数量、高复杂度模型研发方面的坚实能力。

值得关注的是,openPangu-R-72B 的兄弟模型openPangu-718B在同期 SuperCLUE 通用榜单中斩获第二名,展现了该系列在不同任务场景下的全面实力。从深度搜索的 “单点突破” 到通用能力的 “全面开花”,openPangu 系列正以昇腾算力为根基,为国产大模型生态注做出更多贡献。

随着大模型在企业服务、学术研究、政务处理等领域的深度落地,深度搜索能力将成为模型实用化的核心竞争力。未来,随着 openPangu 系列模型的持续迭代,我们期待国产大模型在更多全球顶级评测中绽放光彩。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
张一鸣登顶,雷军排第十,2026富豪榜大洗牌:十年河东十年河西

张一鸣登顶,雷军排第十,2026富豪榜大洗牌:十年河东十年河西

大卫聊科技
2026-02-02 12:37:28
女孩当小姐,一晚要提供4到5次上门服务,2015年被亲人点到不赴约

女孩当小姐,一晚要提供4到5次上门服务,2015年被亲人点到不赴约

汉史趣闻
2025-11-08 09:27:32
大快人心!明家才刚走,白家后脚跟上,春节前全部要送走的节奏啊

大快人心!明家才刚走,白家后脚跟上,春节前全部要送走的节奏啊

火山诗话
2026-02-02 12:32:32
春运首日 全社会跨区域人员流动量超1.8亿人次

春运首日 全社会跨区域人员流动量超1.8亿人次

环球网资讯
2026-02-02 19:25:18
1969年,苏联为何放弃用核武器轰炸中国?多年以后,叛逃的苏方高层终于说出了缘由

1969年,苏联为何放弃用核武器轰炸中国?多年以后,叛逃的苏方高层终于说出了缘由

史海孤雁
2026-01-23 15:26:12
朝鲜战争期间:美军原本已接近击败中国,却碰上中国决死的指挥官

朝鲜战争期间:美军原本已接近击败中国,却碰上中国决死的指挥官

千秋文化
2026-01-31 21:14:51
丹尼-格林:就因为是詹姆斯和湖人夺冠,外界长期黑园区冠军

丹尼-格林:就因为是詹姆斯和湖人夺冠,外界长期黑园区冠军

懂球帝
2026-02-02 18:11:06
西媒:特狮肌肉受伤,或返回巴萨

西媒:特狮肌肉受伤,或返回巴萨

体坛周报
2026-02-02 19:42:11
A股午评:三大指数均跌超1%,全市场3500只股票下跌,黄金、贵金属、石油石化等概念走弱

A股午评:三大指数均跌超1%,全市场3500只股票下跌,黄金、贵金属、石油石化等概念走弱

界面新闻
2026-02-02 11:34:20
中国下达禁令,委内瑞拉石油遇冷,特朗普看情况不对,向中国喊话

中国下达禁令,委内瑞拉石油遇冷,特朗普看情况不对,向中国喊话

铁锤简科
2026-02-02 15:30:28
田华:一路好走,一家四口都是癌症,却拒绝200万广告代言

田华:一路好走,一家四口都是癌症,却拒绝200万广告代言

潘蠸旅行浪子
2026-01-14 03:43:09
1975年毛主席与儿女见面时,江青提议让李讷暂任北京市委书记,最终结果怎样?

1975年毛主席与儿女见面时,江青提议让李讷暂任北京市委书记,最终结果怎样?

寄史言志
2026-01-20 13:57:07
迪拜最帅王子哈曼丹:43岁颜值大滑坡,身高不足1.7米又矮又邋遢

迪拜最帅王子哈曼丹:43岁颜值大滑坡,身高不足1.7米又矮又邋遢

墨印斋
2026-02-01 21:49:28
李小璐写真生图高清

李小璐写真生图高清

翩翩明星
2025-11-14 09:39:36
山西一城中村原村长、书记贪腐细节曝光,非法获利5300余万元

山西一城中村原村长、书记贪腐细节曝光,非法获利5300余万元

朔州那些事儿
2026-02-02 18:36:43
前女友举报孙宇晨,再曝其与谷爱凌恋爱

前女友举报孙宇晨,再曝其与谷爱凌恋爱

小椰的奶奶
2026-02-02 15:02:05
中国老年痴呆人数全球第一:茶喝的越多,痴呆的就越多,真的吗?

中国老年痴呆人数全球第一:茶喝的越多,痴呆的就越多,真的吗?

蜉蝣说
2026-01-22 11:57:36
“好标准的技校脸”,技校女生大合照火了,网友:能把老实人打傻

“好标准的技校脸”,技校女生大合照火了,网友:能把老实人打傻

妍妍教育日记
2026-01-30 20:54:12
55年,潘汉年在北京饭店被秘密逮捕,陈毅怒斥:糊涂,不可饶恕

55年,潘汉年在北京饭店被秘密逮捕,陈毅怒斥:糊涂,不可饶恕

大运河时空
2026-02-01 12:25:03
当年计划生育标语,为何成了现在的“真理”?

当年计划生育标语,为何成了现在的“真理”?

深度报
2026-02-01 22:42:39
2026-02-02 21:35:00
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12238文章数 142562关注度
往期回顾 全部

科技要闻

阿里筑墙,腾讯寄生,字节偷家

头条要闻

捧红王菲、那英的袁惟仁走了 曾被陶晶莹公开调侃

头条要闻

捧红王菲、那英的袁惟仁走了 曾被陶晶莹公开调侃

体育要闻

澳网男单决赛,属于阿尔卡拉斯的加冕仪式

娱乐要闻

57岁音乐人袁惟仁去世,家属发文悼念

财经要闻

金银暴跌 全球股市遭遇“黑色星期一”

汽车要闻

雷克萨斯LC500将于今年底停产 "最美雷克萨斯"谢幕

态度原创

房产
艺术
旅游
公开课
军事航空

房产要闻

狂卖1548亿后,海南又上演疯狂抢地!

艺术要闻

马斯克花5万买的折叠屋,是预制住宅的未来吗?

旅游要闻

雪域同心·青春融情——记台青冬令营新疆之旅

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

委内瑞拉外长会见美外交使团团长

无障碍浏览 进入关怀版