4月23日,腾讯混元Hy3 preview语言模型发布并开源。
这是混元重建后训练的第一个模型,也是混元迄今最智能的模型,在复杂推理、指令遵循、上下文学习、代码、智能体等能力及推理性能上实现了大幅的提升。
去年底,腾讯官宣姚顺雨加入腾讯,成为腾讯首席AI科学家,本次混元Hy3 preview也是他在腾讯的“首秀”。
姚顺雨表示,Hy3 preview是混元大模型重建的第一步,“我们希望通过这次开源和发布,获得来自开源社区和用户的真实反馈,帮助我们提升Hy3正式版的实用性。”
与此同时,腾讯也在继续扩大预训练和强化学习的规模,提升模型的智能上限,并通过与腾讯众多产品的深度Co-Design,持续提升模型在真实场景中的综合表现,并开始探索特色模型能力。
![]()
目前,Hy3 preview已在腾讯云、元宝、ima、CodeBuddy、WorkBuddy、QQ、QQ浏览器、腾讯文档、腾讯乐享等首发上线,微信公众号、和平精英、腾讯新闻、腾讯自选股、腾讯客服、微信读书等多个主线产品也在陆续上线。
此外,Hy3 preview支持接入流行的开源智能体产品,如OpenClaw、OpenCode、KiloCode等,并已上架腾讯云大模型服务平台TokenHub。
主打全面实用性,Agent能力大幅提升
腾讯混元Hy3 preview是一个快慢思考融合的混合专家模型,总参数295B,激活参数21B,最大支持256K上下文长度。
上下文学习和指令遵循能力:腾讯混元提出了CL-bench和 CL-bench-Life来创新性地评估模型的上下文学习能力,并在Hy3 preview显著地提升了模型上下文学习和指令遵循能力。
![]()
复杂推理能力:Hy3preview在FrontierScience-Olympiad、IMOAnswerBench等高难度理工科推理任务中表现突出,并在最新的清华大学求真书院数学博资考(26春)和全国中学生生物学联赛(CHSBO 2025)中取得优异成绩,展现了可泛化的强推理能力。
![]()
代码与智能体:得益于预训练及强化学习框架的重建和强化学习任务规模的提升,腾讯混元以较快的速度在SWE-Bench Verified、Terminal-Bench 2.0等主流代码智能体基准以及BrowseComp、WideSearch等评测中表现突出。
![]()
![]()
此外,无论是在后端工程任务集Hy-Backend,贴近真实用户开发交互的Hy-Vibe Bench,还是高难度软件工程开发任务集Hy-SWE Max上,Hy3preview均体现出了强竞争力。
![]()
腾讯核心业务已全面接入
正式上线之前,Hy3 preview在腾讯主要AI业务进行了产品测试,获得明显正收益。
在元宝端,混元与元宝进行了深度Co-Design,模型与产品的深度协同,为用户带来了更智能且更具“活人感”的交互体验。
在ima知识库问答和通用问答两个场景下,测试结果显示,Hy3 preview处理长文的能力出色,特别是检索类任务,在回答信息的准确性、覆盖度和全面性上表现较好。
在CodeBuddy、WorkBuddy产品上,Hy3 preview首token延迟降低54%、端到端时长降低47%、成功率提升至99.99%+。实际用户环境中,Hy3preview已稳定驱动最长495步的复杂Agent工作流。
在公众号AI分身和AI客服的场景专项评测中,Hy3 preview在用户意图理解、复杂上下文承接和知识信息组织方面表现更成熟,整体交互体验更贴近“可信、自然、高效”的回复目标。
在和平精英AI NPC场景评测中,Hy3 Preview能够精准理解角色设定,带来了更加真实、自然、沉浸的对话体验,展现出优秀的稳定性与出色的拟人化扮演能力。
在腾讯文档AIPPT场景,生成成功率提升20%,评测得分提升10%,同时生成耗时缩短20%。
在QQ AI助手小Q产品评测中,在长文本首字节时延、整体响应速度与流式输出效率方面显著优化;核心能力上,数学推理表现提升尤为明显,多场景指令遵循与泛化能力进一步增强。
此外,得益于模型和推理框架上的深度协同,以及在推理框架、算子性能、量化算法等全方面优化,整体推理效率提升40%,Hy3 preview的成本相比上一代模型大幅下降。
![]()
“重建混元”
据了解,2026年2月,腾讯混元重建了预训练和强化学习的基础设施,以及模型追求实用性的三个原则:
能力体系化:不推崇“偏科”,因为即使是代码智能体的单一应用,也涉及推理、长文、指令、对话、代码、工具等多种能力的深度协同。
评测真实性:主动跳出易被“刷榜”的公开榜单,通过自建题目、最新考试、人工评测、产品众测等多种方式评估和改进模型的“真实战斗力”。
性价比追求:实用性离不开商业合理性,深度协同模型架构和推理框架的设计,大幅降低任务成本,让智能用得起、用得好。
Hy3 preview的推出可以视为混元快速探索实用性大模型、解决真实世界问题的一个开端。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.