网易首页 > 网易号 > 正文 申请入驻

全球5万衍生模型,阿里通义造出开源雨林

0
分享至

阿里通义大模型又又又开源了。

2024云栖大会,通义发布新一代开源模型Qwen2.5并且首次公布开源生态数据。全球已有5万多个基于Qwen二次训练的衍生模型,仅次于美国开源模型Llama(7万左右衍生模型)。

进入开源世界一年多,中国大模型造出了自己的开源雨林。

Qwen2.5-72B,硬刚Llama3.1-405B

通义新一代开源模型Qwen2.5,又给AI圈带来一点小小震撼。

首先是性能水平。Qwen2.5旗舰模型Qwen2.5-72B刷新开源性能天花板,其指令跟随版本Qwen2.5-72B-Instruct在MMLU-redux、MATH、MBPP等基准测评中,以不到1/5的参数获得超越Llama3.1-405B的成绩。

在MMLU-redux等十多个基准测评中,Qwen2.5-72B表现超越Llama3.1-405B

两个月前Meta开源Llama3.1-405B,不仅贡献了性能无敌的巨无霸,更是制造了AI圈新共识:开源超越闭源。

Llama3.1-405B在很多任务中都可与GPT-4o、Claude 3.5 Sonnet等顶级闭源模型一战。

Qwen也有同样发展趋势。三个月前发布的Qwen2-72B,性能超越文心4.0、豆包pro、混元pro等中国闭源模型,也胜过了当时最先进开源模型Llama3-70B。

Qwen2-72B在Hugging Face的开源大模型榜单Open LLM Leaderboard一举登顶,Hugging Face联合创始人兼CEO Clem发文:“Qwen2是王者,中国在全球开源大模型领域处于领导地位。”

而这一次,Qwen2.5又比Qwen2更胜一筹,整体性能提升18%左右。Qwen2.5-72B对同级尺寸的Llama3-70B实现性能完胜,甚至直接“越级”硬刚405B。

开源两强相争,最高兴的是开发者。405B虽然强悍,但很少有小企业和个人开发者用得起。通义千问把顶级模型的使用成本打了下来。

百模上架,最小模型都学了18T数据

通义带来的第二重震撼是模型数量。Qwen2.5全系列涵盖多个尺寸的大语言、多模态、数学和代码模型,每个尺寸又有基础版本、指令跟随版本、多种量化版本,总计上架100多个模型,刷新业界纪录。

语言模型方面,Qwen2.5开源了7个尺寸,0.5B、1.5B、3B、7B、14B、32B、72B,全部都在18T tokens数据上进行预训练,数据量超过了Llama3的15T。这些模型在同等参数赛道都创造了业界最佳成绩。

通义团队介绍,Qwen2.5的型号设定充分考虑下游场景的不同需求,比如3B是适配手机等端侧设备的黄金尺寸;32B是最受开发者期待的“性价比之王”,可在性能和功耗之间获得最佳平衡,Qwen2.5-32B的整体表现超越了上一代的Qwen2-72B。

专项模型方面,代码模型Qwen2.5-Coder 在多达5.5T tokens 的编程相关数据上作了训练;数学模型Qwen2.5-Math支持使用思维链和工具集成推理(TIR) 解决中英双语的数学题,是迄今为止最先进的开源数学模型系列。

多模态模型方面,视觉语言模型Qwen2-VL-72B能识别不同分辨率和长宽比的图片,理解20分钟以上长视频,具备自主操作手机和机器人的视觉智能体能力。日前权威测评LMSYS Chatbot Arena Leaderboard发布最新一期的视觉模型性能测评结果,Qwen2-VL-72B成为全球得分最高的开源模型。

5万衍生模型,Qwen成了开发者首选

阿里云CTO周靖人公布了一张曲线图,全球三大开源模型家族Llama、Qwen、Mistral的衍生模型数量。截至9月中旬,Qwen系列的累计下载数据超过4000万,全世界的开发者又在Qwen的基础上二次训练了5万多个新模型,也就是Qwen的衍生模型。

排名第一的Llama拥有将近7万衍生模型,Mistral的数据是2.5万左右,排名第三。三个世界级模型群分别产自美国、中国、欧洲,与全球大模型的整体格局形成某种有趣的映照。

通义在开源大模型圈可以说是先发后至。

2023年8月通义首次开源,中国大模型市场处在“百模大战”时期,Qwen不过是平平无奇的“百模”之一,在海外的大模型核心竞争圈更是没有认知。

一年之后,“百模”战局趋于收敛,有人离场、有人停滞,有人继续逆水行舟。通义是为数不多仍在坚定开展基模攻坚的大模型团队。

一年间,通义的开源模型有过四次大型迭代,日拱一卒,从2023年12月的Qwen-72B开始,逐步走进世界大模型竞争腹地,成为众多权威榜单的“登顶”常客。

基模的下游是应用,在中国的应用市场,通义是开发者的首选模型。金沙江创投主管合伙人朱啸虎就曾在多个场合提到,“在很多场景下,国内开源模型不比闭源模型差,完全足够支撑中国AI应用的发展。阿里的通义千问比Llama 3要还强,所以很多创业公司都是拿它来训练自己的垂直模型。”

Qwen的这片生态雨林,可能就是中国大模型对开源社区和AI技术最重要的贡献。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
性资源分配不均带来的性压抑已经变态如斯!

性资源分配不均带来的性压抑已经变态如斯!

黯泉
2026-06-03 21:09:03
男篮第一尖刀!王俊杰18+14无惧强硬对抗 媒体人:独一档全能锋线

男篮第一尖刀!王俊杰18+14无惧强硬对抗 媒体人:独一档全能锋线

颜小白的篮球梦
2026-06-03 21:25:41
算力尽头是电力!除了华电辽能,高盛还重仓10家电力股,最低4元

算力尽头是电力!除了华电辽能,高盛还重仓10家电力股,最低4元

长风价值掘金
2026-06-03 17:11:18
运动员哪能这么白这么露?铁三女神冯竟爽再次夺冠,回击流言蜚语

运动员哪能这么白这么露?铁三女神冯竟爽再次夺冠,回击流言蜚语

杨华评论
2026-06-03 02:20:48
白天辉受贿被判死刑已执行,案件入选人民法院案例库,法院释明裁判理由:有重大立功表现,但属于罪行极其严重的犯罪分子,不足以从宽处罚

白天辉受贿被判死刑已执行,案件入选人民法院案例库,法院释明裁判理由:有重大立功表现,但属于罪行极其严重的犯罪分子,不足以从宽处罚

大风新闻
2026-06-03 16:50:43
最高院发布典型案例:被执行人通过近亲属账户逃避强制执行的,构成拒不执行判决、裁定罪

最高院发布典型案例:被执行人通过近亲属账户逃避强制执行的,构成拒不执行判决、裁定罪

新浪财经
2026-06-03 17:07:41
多位网友爆料:明年小米一家独大,被要求收着点卖,评论区猛打脸

多位网友爆料:明年小米一家独大,被要求收着点卖,评论区猛打脸

谭谈社会
2026-06-03 18:53:18
圣彼得堡经济论坛召开之际,乌克兰无人机来了

圣彼得堡经济论坛召开之际,乌克兰无人机来了

山河路口
2026-06-03 14:23:11
伊朗突袭美军第五舰队,42架战机损毁,特朗普吃惊不已

伊朗突袭美军第五舰队,42架战机损毁,特朗普吃惊不已

李橑在北漂
2026-06-03 20:24:05
日媒突然发现一个扎心事实:中国人的生活里,日本货快找不着了

日媒突然发现一个扎心事实:中国人的生活里,日本货快找不着了

互联鱼
2026-06-02 19:32:57
独家:原中国兵器工业集团董事长实际上是秘书出身!33岁就当集团办公厅主任  很优秀!

独家:原中国兵器工业集团董事长实际上是秘书出身!33岁就当集团办公厅主任  很优秀!

新浪财经
2026-06-03 02:10:08
王学成1983年驾机叛逃到台湾,邓丽君前去接见他时低声耳语

王学成1983年驾机叛逃到台湾,邓丽君前去接见他时低声耳语

唠叨说历史
2026-06-01 17:58:53
看不惯,凯文·加内特批评马刺队文班亚马在击败雷霆后落泪

看不惯,凯文·加内特批评马刺队文班亚马在击败雷霆后落泪

好火子
2026-06-03 23:28:35
抢回亚洲第一!中国男篮有望归化布朗,这可是全联盟最强得分机器

抢回亚洲第一!中国男篮有望归化布朗,这可是全联盟最强得分机器

绯雨儿
2026-06-03 15:10:21
官宣!霍伊伦5000万欧永久加盟那不勒斯,曼联完成高薪包袱清仓!

官宣!霍伊伦5000万欧永久加盟那不勒斯,曼联完成高薪包袱清仓!

田先生篮球
2026-06-03 20:44:45
今年高考很平静:只有985、211找得到好工作,其他80%都是销售相关工作

今年高考很平静:只有985、211找得到好工作,其他80%都是销售相关工作

老郭在学习
2026-06-03 13:31:11
彭博亿万富豪指数公布:字节跳动张一鸣以928亿美元身家跃升亚洲第二大富豪,全世界排名第21位

彭博亿万富豪指数公布:字节跳动张一鸣以928亿美元身家跃升亚洲第二大富豪,全世界排名第21位

台州交通广播
2026-06-03 21:22:38
“King Sir”钟景辉,今早睡梦中去世

“King Sir”钟景辉,今早睡梦中去世

南方都市报
2026-06-03 16:06:22
官方严厉表态,痛批综艺乱象,刘涛郑恺等8位艺人遭点名批评

官方严厉表态,痛批综艺乱象,刘涛郑恺等8位艺人遭点名批评

一盅情怀
2026-06-03 15:30:26
白嫖潮汕火锅失控!多位被坑商家再实锤,警方出手,坐牢只是开始

白嫖潮汕火锅失控!多位被坑商家再实锤,警方出手,坐牢只是开始

奇思妙想草叶君
2026-06-03 17:07:22
2026-06-04 02:07:00
开源中国 incentive-icons
开源中国
每天为开发者推送最新技术资讯
7793文章数 34544关注度
往期回顾 全部

科技要闻

传DeepSeek融资意向500亿:腾讯投100亿

头条要闻

男子不想上班辞职后上武当山当道士 8个月后选择下山

头条要闻

男子不想上班辞职后上武当山当道士 8个月后选择下山

体育要闻

选择中国品牌的库里,和他们的巨大野心

娱乐要闻

官方痛批乱象 刘涛郑恺等艺人遭点名

财经要闻

AI,开始偷懒了?

汽车要闻

专访蒋平:安全不做高低配 长安要让安全技术普惠

态度原创

艺术
房产
时尚
游戏
军事航空

艺术要闻

二十年前割麦的场景

房产要闻

突发!254亩调规,海口江东的超级学校真的快来了!

月经、初潮与生育真相,那些藏在动画片里的性启蒙

曝《塞尔达》传奇重制版将亮相!任天堂发布会下周见

军事要闻

媒体:美伊和谈以方却从中作梗 内塔尼亚胡有私人算计

无障碍浏览 进入关怀版