网易首页 > 网易号 > 正文 申请入驻

腾讯混元开源首款混合推理MoE模型,主打Agent工具调用和长文理解

0
分享至

6月27日,腾讯混元宣布开源首个混合推理MoE模型 Hunyuan-A13B,总参数80B,激活参数仅13B,效果比肩同等架构领先开源模型,但是推理速度更快,性价比更高。这意味着,开发者可以用更低门槛的方式获得更好的模型能力。

即日起,模型已经在 Github 和 Huggingface 等开源社区上线,同时模型API也在腾讯云官网正式上线,支持快速接入部署。

这是业界首个13B级别的MoE开源混合推理模型,基于先进的模型架构,Hunyuan-A13B表现出强大的通用能力,在多个业内权威数据测试集上获得好成绩,并且在Agent工具调用和长文能力上有突出表现。

*加粗为最高分,下划线表示第二名,数据来源于模型各个公开的测试数据集得分

对于时下热门的大模型Agent能力,腾讯混元建设了一套多Agent数据合成框架,接入了MCP、沙箱、大语言模型模拟等多样的环境,并且通过强化学习让Agent在多种环境里进行自主探索与学习,进一步提升了Hunyuan-A13B的效果。

在长文方面,Hunyuan-A13B支持256K原生上下文窗口,在多个长文数据集中取得了优异的成绩。

在实际使用场景中,Hunyuan-A13B模型可以根据需要选择思考模式,快思考模式提供简洁、高效的输出,适合追求速度和最小计算开销的简单任务;慢思考涉及更深、更全面的推理步骤,如反思和回溯。这种融合推理模式优化了计算资源分配,使用户能够通过加think/no_think切换思考模式,在效率和特定任务准确性之间取得平衡。

Hunyuan-A13B模型对个人开发者较为友好,在严格条件下,只需要1张中低端GPU卡即可部署。目前,Hunyuan-A13B已经融入开源主流推理框架生态,无损支持多种量化格式,在相同输入输出规模上,整体吞吐是前沿开源模型的2倍以上。

Hunyuan-A13B 集合了腾讯混元在模型预训练、后训练等多个环节的创新技术,这些技术共同增强了其推理性能、灵活性和推理效率。

预训练环节,Hunyuan-A13B 训练了20T tokens的语料,覆盖了多个领域。高质量的语料显著提升了模型通用能力。此外,在模型架构上,腾讯混元团队通过系统性分析,建模与验证,构建了适用于 MoE 架构的 Scaling Law 联合公式。这一发现完善了MoE 架构的 Scaling Law 理论体系,并为 MoE 架构设计提供了可量化的工程化指导,也极大的提升了模型预训练的效果。

后训练环节,Hunyuan-A13B采用了多阶段的训练方式,提升了模型的推理能力,同时兼顾了模型创作、理解、Agent等通用能力。

图:Hunyuan-A13B后训练四个步骤

为更好的提升大语言模型能力,腾讯混元也开源了两个新的数据集,以填补行业内相关评估标准的空白。其中,ArtifactsBench用于弥合大语言模型代码生成评估中的视觉与交互鸿沟,构建了一个包含 1825个任务的新基准,涵盖了从网页开发、数据可视化到交互式游戏等九大领域,并按难度分级以全面评估模型的能力;C3-Bench针对Agent场景模型面临的三个关键挑战:规划复杂的工具关系、处理关键的隐藏信息以及动态路径决策,设计了1024条测试数据,以发现模型能力的不足。

Hunyuan-A13B模型是腾讯内部应用和调用量最大的大语言模型之一,有超过 400+ 业务用于精调或者直接调用,日均请求超1.3亿。本次进行升级更新并对外开源 ,是继混元large后混元大语言模型推出的又一重要开源模型,参数更小,但是性能和效果实现了大幅的提升。接下来,腾讯混元也将推出更多尺寸、更多特色的模型,将更多实践技术与社区共享,促进大模型开源生态的繁荣。

腾讯混元坚定拥抱开源,持续推进多尺寸、多场景的全系模型开源,旗下图像、视频、3D、文本等多种模态基础模型已全面开源。未来,混元计划推出多尺寸混合推理模型,从0.5B到32B的dense模型,以及激活13B的MoE模型,适配企业与端侧不同需求,混元图像、视频、3D等多模态基础模型及配套插件模型也将持续开源。

附项目相关链接

体验入口:
https://hunyuan.tencent.com/

API地址:
https://cloud.tencent.com/product/tclm

Github :https://github.com/Tencent-Hunyuan

HuggingFace:https://huggingface.co/tencent

C3-Bench:https://github.com/Tencent-Hunyuan/C3-Benchmark

ArtifactsBench:https://github.com/Tencent-Hunyuan/ArtifactsBenchmark

— 完 —

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
白宫:美代表团周六赴巴基斯坦 万斯将在国内待命

白宫:美代表团周六赴巴基斯坦 万斯将在国内待命

新京报
2026-04-25 07:18:13
1979年打越南,高层其实吵翻了天?叶剑英粟裕为何反对出兵?

1979年打越南,高层其实吵翻了天?叶剑英粟裕为何反对出兵?

热点一触即发
2026-04-23 21:32:27
身价百亿,坐拥北京一条街,出门私人飞机,京圈顶级富婆都有谁?

身价百亿,坐拥北京一条街,出门私人飞机,京圈顶级富婆都有谁?

君笙的拂兮
2026-04-25 03:53:22
创造历史! 英特尔股价飙升27% 突破26年前历史高点

创造历史! 英特尔股价飙升27% 突破26年前历史高点

每日经济新闻
2026-04-24 21:53:24
演员脱掉和服才向观众鞠躬致谢,本人回应:把这一层皮撕掉,因为它不属于我,做回真正中国人

演员脱掉和服才向观众鞠躬致谢,本人回应:把这一层皮撕掉,因为它不属于我,做回真正中国人

华商网
2026-04-24 14:10:02
知名教授疯狂压榨学生,反遭自己导师吐槽:你当年周末也出去撩妹 ...

知名教授疯狂压榨学生,反遭自己导师吐槽:你当年周末也出去撩妹 ...

超级数学建模
2026-04-24 22:31:28
华晨宇演唱会延期,场地开始拆了,华晨宇直播时忍不住声音哽咽

华晨宇演唱会延期,场地开始拆了,华晨宇直播时忍不住声音哽咽

韩小娱
2026-04-24 05:33:47
三大运营商的血条快打空了……

三大运营商的血条快打空了……

悲了伤的白犀牛
2026-04-24 18:52:39
上海退休,工龄42.42年,个人账户18.5万,退休金有多少钱?

上海退休,工龄42.42年,个人账户18.5万,退休金有多少钱?

爱下厨的阿酾
2026-04-24 18:32:27
5月1日新规落地!烟酒礼品全面管控,公职人员迎来全面约束

5月1日新规落地!烟酒礼品全面管控,公职人员迎来全面约束

罐头告诉猫迷
2026-04-24 03:40:10
湖南男子买烟炫富,致使一家三口被灭,2岁儿子在遗体边躺了两天

湖南男子买烟炫富,致使一家三口被灭,2岁儿子在遗体边躺了两天

莫地方
2026-04-24 00:10:03
少妇经常向丈夫朋友诉苦,两人忍不住发生关系,分手不成夫妻被杀

少妇经常向丈夫朋友诉苦,两人忍不住发生关系,分手不成夫妻被杀

丫头舫
2026-04-17 11:31:11
27岁姆巴佩左腿超负荷 丢单刀81分钟伤退 近7场1胜 时隔10年再0冠

27岁姆巴佩左腿超负荷 丢单刀81分钟伤退 近7场1胜 时隔10年再0冠

风过乡
2026-04-25 06:56:04
斯洛特:之前人们还在质疑现在又说欧冠资格稳了,绝不是这样

斯洛特:之前人们还在质疑现在又说欧冠资格稳了,绝不是这样

懂球帝
2026-04-25 06:27:09
扎心!刘晓宇下半场三分4中4爆砍18分最佳一战断送北控季后赛希望

扎心!刘晓宇下半场三分4中4爆砍18分最佳一战断送北控季后赛希望

狼叔评论
2026-04-24 22:12:27
加拿大女歌手北京演唱会取消:因抢不到五一高铁票,艺人不喜欢过多飞行

加拿大女歌手北京演唱会取消:因抢不到五一高铁票,艺人不喜欢过多飞行

观察者网
2026-04-24 11:45:37
中国91亿美元购新马设备,美进口跌至7年最低

中国91亿美元购新马设备,美进口跌至7年最低

心灵的触动a
2026-04-24 10:26:59
火湖G3大战一触即发,湖人迎来两大利好,詹姆斯一数据超新秀赛季

火湖G3大战一触即发,湖人迎来两大利好,詹姆斯一数据超新秀赛季

球盲百小易
2026-04-25 01:23:13
济南市市中区副区长许胜勇,被查

济南市市中区副区长许胜勇,被查

鲁中晨报
2026-04-24 16:40:06
叶新萍被查实!科室1.3亿收入账上只剩5964万,举报人悬赏一套房

叶新萍被查实!科室1.3亿收入账上只剩5964万,举报人悬赏一套房

社会日日鲜
2026-04-25 06:49:46
2026-04-25 07:48:49
量子位 incentive-icons
量子位
追踪人工智能动态
12528文章数 176457关注度
往期回顾 全部

科技要闻

DeepSeek V4牵手华为,价格依然"屠夫级"

头条要闻

两届奥运冠军、中国羽协主席张军"失联" 知情人士发声

头条要闻

两届奥运冠军、中国羽协主席张军"失联" 知情人士发声

体育要闻

上海男篮23连胜+主场全胜 姚明之后最强一季

娱乐要闻

停工16个月!赵露思证实接拍新剧

财经要闻

LG财阀内斗:百亿美元商业帝国争夺战

汽车要闻

零跑Lafa5 Ultra北京车展上市:11.88-12.48万

态度原创

亲子
数码
艺术
手机
公开课

亲子要闻

小狮子也只是个大宝宝呀,看到小朋友的车车满眼羡慕

数码要闻

宏碁掠夺者战斧9 / 10 Neo游戏本上架:搭载满功耗RTX 5060

艺术要闻

价值1.7亿的牡丹!

手机要闻

iQOO 15T首曝:天玑9500+144Hz 2K直屏+200MP主摄,主打一个堆料

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版