网易首页 > 网易号 > 正文 申请入驻

腾讯官宣开源新模型!姚顺雨发声

0
分享至

腾讯大动作。

4月23日,腾讯混元Hy3 preview语言模型发布并开源。这是一个快慢思考融合的混合专家模型,总参数295B,激活参数21B,最大支持256K上下文长度。这是混元重建后训练的第一个模型,也是混元迄今最智能的模型,在复杂推理、指令遵循、上下文学习、代码、智能体等能力及推理性能上实现了大幅的提升。

据介绍,2026年2月,腾讯混元重建了预训练和强化学习的基础设施,以及模型追求实用性的三个原则:

1.能力体系化:不推崇“偏科”,因为即使是代码智能体的单一应用,也涉及推理、长文、指令、对话、代码、工具等多种能力的深度协同。

2.评测真实性:主动跳出易被“刷榜”的公开榜单,通过自建题目、最新考试、人工评测、产品众测等多种方式评估和改进模型的“真实战斗力”。

3.性价比追求:实用性离不开商业合理性,深度协同模型架构和推理框架的设计,大幅降低任务成本,让智能用得起、用得好。

Hy3 preview可以视为混元快速探索实用性大模型、解决真实世界问题的一个开端。对此,腾讯首席AI科学家姚顺雨表示,Hy3 preview是混元大模型重建的第一步。我们希望通过这次开源和发布,获得来自开源社区和用户的真实反馈,帮助我们提升 Hy3 正式版的实用性。与此同时,我们也在继续扩大预训练和强化学习的规模,提升模型的智能上限,并通过与腾讯众多产品的深度Co-Design,持续提升模型在真实场景中的综合表现,并开始探索特色模型能力。

新模型主打全面实用性

目前,Hy3 preview已在腾讯云、元宝、ima、CodeBuddy、WorkBuddy、QQ、QQ浏览器、腾讯文档、腾讯乐享等首发上线,微信公众号、和平精英、腾讯新闻、腾讯自选股、腾讯客服、微信读书等多个主线产品也在陆续上线。另外,Hy3 preview支持接入流行的开源智能体产品,如OpenClaw、OpenCode、KiloCode等,并已上架腾讯云大模型服务平台TokenHub。

腾讯方面表示,多个测评结果显示,Hy3 preview模型能力全面提升。

一是出色的上下文学习和指令遵循能力。

在各种真实的生产与生活场景,理解杂乱冗长的上下文并遵从复杂多变的规则是模型的首要挑战。基于腾讯业务场景的灵感,腾讯混元提出了CL-bench和CL-bench-Life来创新性地评估模型的上下文学习能力,并在Hy3 preview显著地提升了模型上下文学习和指令遵循能力。

二是复杂推理能力突出,清华数学博士资格考试国内分数最高。

复杂推理能力是模型解决各种问题的基础。Hy3 preview在 FrontierScience-Olympiad、IMOAnswerBench 等高难度理工科推理任务中表现突出,并在最新的清华大学求真书院数学博资考(26春)和 全国中学生生物学联赛(CHSBO 2025) 中取得优异成绩,展现了可泛化的强推理能力。

三是代码与智能体提升最为显著,展现出高性价比。

代码和智能体是Hy3 preview提升最为显著的方向。得益于预训练及强化学习框架的重建和强化学习任务规模的提升,腾讯混元以较快的速度在SWE-Bench Verified、Terminal-Bench 2.0等主流代码智能体基准以及BrowseComp、WideSearch等主流搜索智能体基准中取得了有竞争力的结果。

据介绍,在数字世界中,代码关注的是模型在开发环境中的执行能力,搜索则聚焦于开放信息空间中的检索、筛选与整合能力,两者共同决定了模型在复杂智能体场景(例如 OpenClaw)中是否真正具备可用性。Hy3 preview在 ClawEval 和 WildClawBench 等评测中表现突出,表明我们的智能体能力正在稳步走向全面与实用。

除了公开榜单,腾讯混元还进一步构建了多个内部的评测集,对模型在真实开发场景中的表现进行评估。结果表明,无论是在后端工程任务集Hy-Backend,贴近真实用户开发交互的Hy-Vibe Bench,还是高难度软件工程开发任务集Hy-SWE Max上,Hy3 preview均体现出了强竞争力。

比较各个开源模型的大小与智能体综合表现,Hy3 preview展现出高性价比。据介绍,得益于模型和推理框架上的深度协同,以及在推理框架、算子性能、量化算法等全方面优化,整体推理效率提升40%,Hy3 preview的成本相比上一代模型大幅下降。

在腾讯云大模型服务平台TokenHub上,Hy3 preview输入价格最低1.2元/百万tokens,输入命中缓存价格0.4元/百万tokens,输出价格最低4元/百万tokens。同时,腾讯云联合混元推出定制的Hy3 preview Token Plan套餐,个人版定价最低28元/月,为Agent开发和打造“龙虾”应用的提供更具性价比选择。

腾讯核心业务已全面接入

正式上线之前,Hy3 preview在腾讯主要AI 业务进行了产品测试,获得明显正收益。

在元宝端,混元与元宝进行了深度Co-Design。一方面,针对性地提升了模型在意图理解精准度、文本创作质量、深度搜索等硬核指标上的表现;另一方面,对文风、文笔、情商、内容组织和内容专业度上进行了精细化调优。模型与产品的深度协同,为用户带来了更智能且更具“活人感”的交互体验。

在ima知识库问答和通用问答两个场景下,测试结果显示,Hy3 preview处理长文的能力出色,特别是检索类任务,在回答信息的准确性、覆盖度和全面性上表现较好。

在CodeBuddy、WorkBuddy产品上,Hy3 preview首token延迟降低54%、端到端时长降低47%、成功率提升至99.99%+。实际用户环境中,Hy3 preview已稳定驱动最长495步的复杂Agent工作流,覆盖文档处理、数据分析、知识检索、MCP工具链编排等多样化办公场景。

在公众号AI分身和AI客服的场景专项评测中,Hy3 preview展现出相比Hy2更全面的能力升级。新模型在用户意图理解、复杂上下文承接和知识信息组织方面表现更成熟,面对模糊提问、短句追问和多轮对话时,能够更准确地把握用户诉求,并输出更清晰、更稳定的回复。结合知识库、用户记忆与上下文生成回答时更贴合AI分身和AI客服的角色,过度脑补、主观代入和情绪化表达显著减少,使整体交互体验更贴近“可信、自然、高效”的回复目标。

在和平精英AINPC场景评测中,和平精英团队第一时间在Hy3 preview上线后基于AINPC场景中完成接入并开展评测,整体表现令人印象深刻。在游戏局外的人设扮演场景中,Hy3 preview不仅能够精准理解角色设定,还能针对开放性问题输出高度关联、富有增量价值的内容,带来了更加真实、自然、沉浸的对话体验。而在游戏局内的复杂对战场景中,模型回复节奏贴近真实玩家聊天体验,展现出优秀的稳定性与出色的拟人化扮演能力,整体效果表现亮眼。

在腾讯文档AI PPT场景,较上一版本(Hy2)取得了显著进步:生成成功率提升20%,评测得分提升10%,同时生成耗时缩短20%。整体而言,新模型在评测场景中表现优异,在模版选择、色彩匹配、生成大纲、补充内容多个阶段,均体现出优秀的表现,无幻觉,契合主题,视觉效果好。

在QQAI助手小Q产品评测中,较上一版本,在长文本首字节时延、整体响应速度与流式输出效率方面显著优化;核心能力上,数学推理表现提升尤为明显,多场景指令遵循与泛化能力进一步增强;在工具调用推理及多轮指代消解方面表现更稳定高效,在OpenClaw官方PinchBenchQQ智能体场景测试中取得突出效果,综合体验实现明显跃升。

责编:李丹

校对:陶谦

证券时报各平台所有原创内容,未经书面授权,任何单位及个人不得转载。我社保留追究相关行为主体法律责任的权利。

转载与合作可联系证券时报小助理,微信ID:SecuritiesTimes

" Type="normal"@@-->

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
全面压制!美日菲七国军演拉开帷幕,中国双航母战斗群冲向南海!

全面压制!美日菲七国军演拉开帷幕,中国双航母战斗群冲向南海!

阿龙聊军事
2026-04-22 15:02:44
全程未遭遇抵抗30万吨伊朗油轮巨轮被美军俘虏190万桶石油要栽了

全程未遭遇抵抗30万吨伊朗油轮巨轮被美军俘虏190万桶石油要栽了

阿振观点
2026-04-23 05:43:07
解放战争期间最惨痛的战斗:五名军级干部阵亡,幸存者55年授少将

解放战争期间最惨痛的战斗:五名军级干部阵亡,幸存者55年授少将

浩渺青史
2026-04-23 02:29:19
广东1男子卖猪肉45年,家徒四壁,谁料,外面养着1000多个孩子

广东1男子卖猪肉45年,家徒四壁,谁料,外面养着1000多个孩子

芭比衣橱
2026-04-23 18:10:16
皇马再遭暴击!两人赛季报销,居莱尔训练受伤,米利唐再度伤缺

皇马再遭暴击!两人赛季报销,居莱尔训练受伤,米利唐再度伤缺

奥拜尔
2026-04-23 19:05:14
表态不满,赵继伟交易离队?正式确认,谁注意杨鸣的表态

表态不满,赵继伟交易离队?正式确认,谁注意杨鸣的表态

林子说事
2026-04-23 17:50:01
新款丰田卡罗拉渲染图:运动感全面升级

新款丰田卡罗拉渲染图:运动感全面升级

味健的汽车
2026-04-23 09:30:08
港独、骂中国人,如今却还想来内地捞金,这3位香港明星令人作呕

港独、骂中国人,如今却还想来内地捞金,这3位香港明星令人作呕

地理三体说
2026-04-21 22:28:02
“曝李小冉退出浪姐”冲上热搜!李小冉发文

“曝李小冉退出浪姐”冲上热搜!李小冉发文

陈意小可爱
2026-04-21 20:02:49
原来她早已去世,身高2米08,多次为国夺冠,24岁就退役终生未婚

原来她早已去世,身高2米08,多次为国夺冠,24岁就退役终生未婚

白面书誏
2026-04-23 19:19:24
烂醉如泥的赵总!

烂醉如泥的赵总!

仕道
2026-04-23 08:37:01
这张照片是2014年张雪峰和他的妻子李丽婧,在清华大学拍的结婚照

这张照片是2014年张雪峰和他的妻子李丽婧,在清华大学拍的结婚照

喜欢历史的阿繁
2026-04-11 06:47:10
队史首次闯进季后赛!宁波男篮官宣:与NBL场均20+8内线完成签约

队史首次闯进季后赛!宁波男篮官宣:与NBL场均20+8内线完成签约

狼叔评论
2026-04-23 16:08:07
格力回应铝线电机争议:相关工程机已停产,海信称靠多三两铜多500元时代已终结

格力回应铝线电机争议:相关工程机已停产,海信称靠多三两铜多500元时代已终结

红星资本局
2026-04-21 20:40:16
再见了,开拓者,赛季离队第一人,杨瀚森更难了!

再见了,开拓者,赛季离队第一人,杨瀚森更难了!

体育新角度
2026-04-23 15:51:56
涉破坏耕地、非法开采等,两部门通报违法违规典型问题

涉破坏耕地、非法开采等,两部门通报违法违规典型问题

界面新闻
2026-04-23 11:19:04
金融圈突发!涉嫌严重违纪违法,张文被查

金融圈突发!涉嫌严重违纪违法,张文被查

中国基金报
2026-04-23 12:23:24
广东1男子卖猪肉45年,家徒四壁,谁料,外面养着1000多个孩子

广东1男子卖猪肉45年,家徒四壁,谁料,外面养着1000多个孩子

社会日日鲜
2026-04-23 08:32:28
耀兵沧海,乌克兰扫雷舰队将赴波斯湾,英国“游骑兵”亮剑乌东

耀兵沧海,乌克兰扫雷舰队将赴波斯湾,英国“游骑兵”亮剑乌东

史政先锋
2026-04-22 20:53:11
炸弹落下时,他在克鲁斯堡打斯诺克

炸弹落下时,他在克鲁斯堡打斯诺克

热血体育社
2026-04-22 19:02:50
2026-04-23 21:20:49
证券时报 incentive-icons
证券时报
运营主体:深圳证券时报社有限公司
901276文章数 239015关注度
往期回顾 全部

科技要闻

马斯克喊出"史上最大产品",但量产难预测

头条要闻

特朗普"狂怒"称灭掉了伊朗军队 美国官员:不 并没有

头条要闻

特朗普"狂怒"称灭掉了伊朗军队 美国官员:不 并没有

体育要闻

莱斯特城降入英甲,一场亏麻了的豪赌

娱乐要闻

王大陆因涉黑讨债被判 女友也一同获刑

财经要闻

关于AI算力链"瓶颈" 这是高盛的最新看法

汽车要闻

令人惊艳的奇瑞车 风云A9可不只是样子货

态度原创

艺术
手机
亲子
公开课
军事航空

艺术要闻

她辞掉高管,花20年自费100万:这本书,救了山西“正在消失的壁画”

手机要闻

REDMI双旗舰新品同台发布,让天玑9500坐实「性能魔王」称号

亲子要闻

我宣布:我再也不怕喝牛奶了!

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

人民海军成立77周年 主力舰艇亮相上海

无障碍浏览 进入关怀版