网易首页 > 网易号 > 正文 申请入驻

最新中文大模型测评报告公布,腾讯混元居国内第一

0
分享至

9月2日,中文大模型测评基准SuperCLUE发布《中文大模型基准测评2024年8月报告》,腾讯混元大模型凭借在多个核心任务上的出色表现,总得分居国内大模型第一名,成为榜单中进步最快的模型之一。

据SuperCLUE报告,在11个能力项的测评中,腾讯混元在其中 8 项核心任务上排名国内第一,综合来看,“腾讯混元整体能力不俗,是一个非常有竞争力的通用大模型。“

SuperCLUE本次测评的是腾讯混元新一代大语言模型预览版(Turbo-Preview),模型采用全新的混合专家模型(MoE)结构,从训练数据、模型架构、训练策略,训练框架,软硬件体系等方面实现了全链路自研,模型一方面在性能上实现大幅提升,另一方面也实现了推理成本的显著下降,有着较大的应用潜力。

作为独立的第三方中文大模型基准测评机构,SuperCLUE本次8月报告聚焦通用能力测评,测评方案由理科、文科和Hard三大维度构成。具体来看,理科能力包括计算、逻辑推理和代码能力;文科任务覆盖知识百科、语言理解、长文本、角色扮演、生成与创作、安全和工具使用七大维度;Hard任务则侧重精确指令遵循以及复杂任务高阶推理。

作为国内成绩最好的模型,腾讯混元在理科、文科均居于第一名。Hard任务上腾讯混元表现出色,取得74.33分,是国内唯一超过70分的大模型,仅与ChatGPT-4o有微小差距。

值得注意的是,随着大模型行业的蓬勃发展,以腾讯混元为代表的国产大模型正在加速进化,能力升级速度不断加快。测评报告数据显示,总体趋势上,国内第一名的大模型在中文领域的通用能力与国外领先模型差距持续缩小,从2023年5月的 30.12% 的缩小至 2024 年8月的1.29%,总分上仅有 1 分左右的微小差距。

自2023年9月正式亮相以来,腾讯混元通过在国内率先采用MoE结构,模型已扩展为万亿参数规模,总体性能不断升级,除了通用能力和文生文,在文生图、图生文以及视频生成等多模态能力上也有比较突出的表现。在此前发布的中文多模态大模型SuperCLUE-V基准榜单中,腾讯混元大模型凭借在多模态理解方面的卓越表现,国内大模型排名第一,稳居卓越领导者象限。

基于领先的模型能力积累,腾讯混元大模型正在积极推进应用落地,让大模型创造更多价值。目前腾讯内部近700个业务及场景已接入,包含腾讯元宝、腾讯云、QQ、微信读书、腾讯新闻、腾讯客服等。此前,腾讯旗下协作SaaS(软件即服务)产品全面接入腾讯混元大模型。

腾讯混元大模型在腾讯云上提供了多种尺寸的模型服务,通过API、专属模型、精调模型等接入和使用方式面向企业及个人开发者全量开放。目前,腾讯混元的云上版本包括Turbo-Preview、Pro,Standard,Lite等多个版本;在专属模型上开放了代码生成、角色扮演、Functioncall等;企业也可以通过腾讯云TI平台对腾讯混元进行精调。

基于多年深耕产业互联网经验和积累,腾讯云已联合行业头部企业,为20+行业输出了超过50个解决方案,提供一整套模型服务工具链,帮助企业高效率、高品质、低成本地创建和部署AI应用。

雷峰网

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
亡国灭种,断子绝孙?欧洲“反华先锋”立陶宛,正在从地图上消失

亡国灭种,断子绝孙?欧洲“反华先锋”立陶宛,正在从地图上消失

古史青云啊
2026-01-23 19:57:26
或许全世界都得感谢中国!若不是中国选择死战,特朗普不会妥协

或许全世界都得感谢中国!若不是中国选择死战,特朗普不会妥协

准备好了吗
2026-05-03 11:26:45
那些在东南亚摆烂的西方年轻人靠什么生存?

那些在东南亚摆烂的西方年轻人靠什么生存?

爱思考的卢师傅
2026-05-02 10:20:17
伦敦世乒赛:大爆冷!世界亚军首秀输球,申裕斌13无缘开门红

伦敦世乒赛:大爆冷!世界亚军首秀输球,申裕斌13无缘开门红

宝哥精彩赛事
2026-05-03 15:41:53
5月正式落地!老式机顶盒全面退场,以后看电视再也不用来回切换

5月正式落地!老式机顶盒全面退场,以后看电视再也不用来回切换

叮当当科技
2026-05-01 14:21:49
一周多达7次,31岁男子不幸猝死,妻子:多次劝说,他就是不听

一周多达7次,31岁男子不幸猝死,妻子:多次劝说,他就是不听

垚垚分享健康
2026-04-27 09:07:38
一把手是没有办法监督的

一把手是没有办法监督的

职场资深秘书
2026-05-02 12:02:19
和刘涛分手后,他常年定居上海,如今身价过亿,年过60却依旧单身

和刘涛分手后,他常年定居上海,如今身价过亿,年过60却依旧单身

一盅情怀
2026-04-28 12:22:02
不黑不吹,4个月才卖了11万辆,小米55万的年目标,有点难?

不黑不吹,4个月才卖了11万辆,小米55万的年目标,有点难?

互联网.乱侃秀
2026-05-03 11:54:17
董洁直播间炸了。几万人盯着一条裙子,没人喊321上链接一片寂静

董洁直播间炸了。几万人盯着一条裙子,没人喊321上链接一片寂静

蒂蒂茱家
2026-05-03 14:46:40
四川弑母案:法学女杀母分尸,指认现场,笑着说“肉好肥哦”

四川弑母案:法学女杀母分尸,指认现场,笑着说“肉好肥哦”

墨策史
2026-05-02 23:01:31
赵一鸣横扫县城,6000家店成山姆平替,利润暴涨500%!

赵一鸣横扫县城,6000家店成山姆平替,利润暴涨500%!

似水流年忘我
2026-04-29 23:48:32
未来三年被好运纠缠!开拓创新水到渠成,正财偏财切换的3生肖

未来三年被好运纠缠!开拓创新水到渠成,正财偏财切换的3生肖

毅谈生肖
2026-05-03 11:11:32
世乒赛全乱了!德国输法国,日本输德国,国乒输韩国,都在玩心机

世乒赛全乱了!德国输法国,日本输德国,国乒输韩国,都在玩心机

阿振观点
2026-05-03 09:36:23
太现实!苏州的相亲都快变成验资了,女方要验资,男方要验货!

太现实!苏州的相亲都快变成验资了,女方要验资,男方要验货!

风起见你
2026-05-02 11:53:22
“湖南一中学查询学生成绩需付费买App,一学期350元”,官方通报:情况属实,已叫停该推送行为

“湖南一中学查询学生成绩需付费买App,一学期350元”,官方通报:情况属实,已叫停该推送行为

大象新闻
2026-05-02 12:46:05
中年男人四件套,不信你没有!

中年男人四件套,不信你没有!

职场火锅
2026-04-27 10:37:49
A股:人民日报定调!节后行情迎来关键变局,务必提前做好应对

A股:人民日报定调!节后行情迎来关键变局,务必提前做好应对

云鹏叙事
2026-05-03 00:00:07
刚刚 | 下雨啦!今晚还有雨+8级风!随后直冲30℃!

刚刚 | 下雨啦!今晚还有雨+8级风!随后直冲30℃!

天津广播
2026-05-02 17:22:49
离谱!许家印只喝2700一瓶水 马桶必须喷香水 随身配备女按摩师

离谱!许家印只喝2700一瓶水 马桶必须喷香水 随身配备女按摩师

念洲
2026-04-28 11:37:39
2026-05-03 17:20:49
雷峰网 incentive-icons
雷峰网
关注智能与未来!
69241文章数 656123关注度
往期回顾 全部

科技要闻

库克罕见"拒答"!苹果正被AI供应链卡脖子

头条要闻

巴菲特正式“退役”伯克希尔新掌门阿贝尔股东会首秀

头条要闻

巴菲特正式“退役”伯克希尔新掌门阿贝尔股东会首秀

体育要闻

裁判准备下班,结果吴宜泽进了决赛

娱乐要闻

蔡卓妍婚后首现身 戴结婚戒指笑容不断

财经要闻

后巴菲特时代,首场股东会透露了啥

汽车要闻

同比大涨190% 方程豹4月销量29138台

态度原创

本地
手机
亲子
健康
公开课

本地新闻

用青花瓷的方式,打开西溪湿地

手机要闻

W17周新机销量盘点,华为是真牛!OPPO、小米也不错

亲子要闻

挺不错的看护中心,伙食挺棒,希望一直这样。

干细胞治烧烫伤面临这些“瓶颈”

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版