一个28岁的年轻人,能在三个月内重建一家万亿市值公司的AI基础设施吗?腾讯混元Hy3 preview的发布,给出了一个初步答案。
4月23日,这款被定义为"混元重建后训练的第一个模型"正式开源。2950亿总参数、210亿激活参数、256K上下文长度——数字背后是一场从根上推倒重来的工程冒险。而主导这场冒险的,正是去年才加入腾讯的姚顺雨。
![]()
「慢了9个月到1年」之后
把时间拨回四个月前。今年年会上,马化腾罕见地公开承认腾讯AI"动作慢了",慢了9个月到1年。总裁刘炽平的复盘更刺耳:混元像高中生背题应考,成绩单好看,一上真实考场就露馅。
数据印证着焦虑。字节豆包月活已达3.45亿,阿里千问1.66亿,而腾讯元宝约5700万。差距不仅没缩小,还在拉大。
在这个背景下,姚顺雨的任命被外界解读为唯一信号:腾讯要动真格了。前OpenAI研究员、清华姚班出身、中国互联网最受瞩目的天才少年——这些标签叠加在28岁的他身上,既是光环也是压力。
四个月后,Hy3 preview上线。交卷时刻到了。
推倒重来:一个月重建基础设施
Hy3 preview不是常规迭代。用腾讯自己的话说,这是"底层工程的重构"。
2月,混元重建了预训练和强化学习的基础设施。原有的训练框架没有沿用,姚顺雨到任后在一个月内完成了整个基础设施的重建。
重建的方向被提炼为三个原则:能力体系化、评测真实性、性价比追求。翻译过来就是:不做"偏科生",不刷榜,不让模型变成烧钱的无底洞。
「不做偏科生」这条尤其值得展开。Hy3 preview从研发之初就围绕智能体场景做了针对性设计。姚顺雨的判断是,即便是代码智能体的单一应用,也涉及推理、长文、指令、对话、代码、工具等多种能力的深度协同。
你不能让模型只会写代码却看不懂文档,或者能聊天但调不了API。这种"全栈能力"的要求,直接推翻了过去"单项冠军"式的训练思路。
同时,姚顺雨指出,过去的混元过度追逐榜单成绩,将打榜语料放入训练集导致数据被污染,影响了真实场景表现。他要求团队「以后不要打榜」,主动跳出易被刷榜的公开榜单,通过自建题目、最新考试、人工评测、产品众测等多种方式来评估模型的「真实战斗力」。
从研发节奏来看,Hy3 preview于2026年1月底正式启动训练,从训练到上线用了不到三个月。腾讯内部将其定义为混元大模型从「读万卷书」走向「行万里路」、尝试解决真实世界复杂问题的开端。
不到三个月,重建基础设施、定方向、训模型、开源发布。这个速度放在大厂体系里,相当激进。
快慢思考:让模型自己决定「用不用脑」
Hy3 preview最核心的技术理念是「快慢思考融合」。
这个概念对应的是认知科学中的双系统理论:系统1(快思考)是快速、自动、直觉式的反应;系统2(慢思考)是缓慢、深度、需要调用大量计算资源的推理。传统大模型在设计时通常两条路只能选一条,要么快但能力有限,要么强但响应慢。
Hy3 preview的做法是让模型根据任务难度自动选择思考模式:简单任务用快思考,复杂任务切换到慢思考,在速度和能力之间找一个最优平衡点。
工程上,这套机制依赖混合专家(MoE)架构来实现。2950亿的总参数中,每次推理只激活210亿,激活占比约7.1%。这意味着实际计算量远小于一个2950亿的稠密模型。
慢思考任务会激活更多专家、调用更多计算资源,快思考任务则只激活少数专家、节省算力。快慢思考的切换不是简单叠加两个模型,而是在一个模型内部根据任务自适应分配计算量。
这个设计思路并不新鲜,但能在不到三个月里完成架构选型、训练和上线,背后的工程能力确实不容小觑。
对腾讯这种手握微信、QQ、腾讯文档等海量用户产品的公司来说,推理成本的可控性很大程度上决定了模型能否真正进入产品。Hy3 preview的架构选择,正因具备了这种现实的商业考量。
自建考场:不打榜之后怎么证明自己
既然说「不打榜」,评估体系就得自己建。
腾讯混元提出了CL-bench和CL-bench-Life两套评测框架,重点考察模型在长而杂乱的上下文中理解信息、遵循复杂规则并完成任务的能力。这两套框架对应的正是许多真实生产和生活场景里最常见、也最难被传统榜单覆盖的问题。
在具体性能表现上,Hy3 preview在几个关键基准测试中取得了有竞争力的结果。在编程基准SWE-Bench Verified中,Hy3 preview得分74.4%,相比前代Hy2的53.0%提升超过40%,已接近GLM-4.7的水平。
在复杂推理任务上,Hy3 preview在FrontierScience-Olympiad、IMOAnswerBench等高难度理工科推理任务中表现突出,全国中学生生物学联赛(CHSBO 2025)等高难度推理
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.