网易首页 > 网易号 > 正文 申请入驻

百亿次下载量之后,国产大模型迭代潮起

0
分享至

21世纪经济报道记者雷晨

近期,国内多家科技企业都密集完成开源大模型的迭代升级。本轮国产开源大模型迭代,覆盖了技术降本、工业级应用、专项能力突破、端侧适配等多个核心方向,实现了多维度的技术升级。全球最大的AI开源社区Hugging Face发布的2026年春季全球开源AI生态报告显示,过去一年,该平台上41%的大模型下载量来自中国研发的模型,中国已成为全球开源大模型供给最活跃、增长最快的地区之一。数据显示,国产开源大模型全球累计下载量突破100亿次,我国已成为全球人工智能专利最大拥有国,专利申请量全球占比达60%。

北京物联网智能技术应用协会副会长、中关村大数据产业联盟副秘书长颜阳向记者表示:“百亿次下载量背后,是中国大模型产业在有限条件下的生存突围。面对外部算力供给收紧,国内厂商无法依赖大规模GPU集群进行暴力试错,被迫在架构与工程优化上精打细算。MoE架构与端侧轻量化模型的爆发,体现的是以工程优化弥补算力短板的策略。”

MoE架构、长上下文与国产算力适配

2025年以来,国际先进算力获取通道持续收窄。在此背景下,国内大模型厂商转而聚焦架构创新与工程优化。混合专家架构(MoE)成为这一时期的技术主线。该架构的核心逻辑是“按需激活”——模型总参数可达万亿级,但每次推理只激活其中一部分,以降低计算成本。

DeepSeek-V4的发布验证了国产算力路径的可行性。2026年4月24日,DeepSeek发布新一代旗舰大模型DeepSeek-V4预览版,同步开源并上线官网、官方App及API服务。该模型总参数达到1.6万亿,首次将百万token上下文窗口设为标配,在超长上下文处理、实时知识检索、复杂逻辑推理等核心能力上实现了跨越式升级。据DeepSeek官方公告,该模型支持三档推理强度调节,并针对Agentic Coding(智能体编程)进行了专项优化。

按参数规模与定位,DeepSeek-V4预览版分为两个版本:DeepSeek-V4-Pro(对标顶级闭源模型),总参数1.6万亿,激活参数490亿;DeepSeek-V4-Flash(经济版),总参数2840亿,激活参数130亿。

2026年4月23日,腾讯混元发布Hy3 preview语言模型并同步开源。该模型为快慢思维融合的MoE架构,总参数2950亿,激活参数仅210亿,最大支持256K上下文长度。该模型是腾讯混元自2026年2月重构预训练与强化学习基础设施后训练的首个版本,聚焦于提升实际应用场景中的实用性。Hy3 preview已快速接入元宝、QQ、腾讯文档、腾讯乐享等十余款腾讯内部产品。

腾讯首席AI科学家姚顺雨表示,Hy3 preview是混元大模型重建的第一步,在复杂推理、指令遵循、代码与智能体等核心能力上实现了显著突破。混元团队主动选择不参与易被过度优化的公开榜单,以更真实地反映模型能力。姚顺雨同时指出,腾讯正在持续扩大预训练与强化学习的规模,提升模型智能上限,并希望获得来自开源社区和用户的反馈,以帮助提升Hy3正式版的实用性。混元团队在SWE-Bench Verified、Terminal-Bench 2.0等主流代码智能体基准测试中取得了具有竞争力的结果。此外,腾讯Robotics X实验室与混元团队还发布并开源了专为具身任务优化的多模态大模型HY-Embodied-0.5-X,进一步拓展了模型在机器人智能交互领域的应用边界。

阿里云Qwen3.6-27B则走稠密架构下的“小参数、强性能”路线。4月22日,阿里云通义千问团队开源了Qwen3.6-27B模型。该模型为270亿参数的稠密多模态模型,采用Apache 2.0开源协议。据官方介绍,在核心编程能力评测中,该模型以270亿的总参数量达到与千亿参数级别模型相当的性能。在SWE-bench Verified等反映真实智能体编程能力的权威基准测试中,Qwen3.6-27B表现突出,被定位为面向开发者与企业的新一代开源旗舰模型。

从本轮密集发布的技术路线来看,若干清晰趋势正在形成:其一,长上下文处理能力普惠化,百万token级别上下文正从旗舰配置变为标配;其二,推理成本持续下降,开源模型大幅降低了企业部署大模型的门槛;其三,智能体(Agent)能力全面升级,大模型从对话工具向可执行任务的智能体演进;其四,国产算力适配走向深入,自主可控的技术栈正在形成闭环。

开发者心智争夺

如果说技术突破是第一阶段的核心命题,那么2026年4月的密集发布潮已将竞赛推入第二阶段,即围绕开源生态与开发者心智的全面竞合。

DeepSeek-V4开源后,迅速引发产业链级联动适配。开源数小时内,百度千帆即宣布实现Day 0适配,对外API定价与DeepSeek官方保持一致;寒武纪基于vLLM推理框架完成对DeepSeek-V4-Pro与DeepSeek-V4-Flash的Day 0适配,并将适配代码开源至GitHub社区;摩尔线程携手智源众智FlagOS社区,在MTT S5000 GPU上完成对DeepSeek-V4-Flash的Day 0适配。华为昇腾亦同步宣布,旗下昇腾超节点全系列产品支持DeepSeek-V4系列模型,通过融合kernel与多流并行技术实现高吞吐、低延迟的推理部署。

颜阳指出:“开源不仅是技术理念的体现,也已成为头部厂商扩大市场影响力的重要手段。通过释放高性能开源模型,直接压缩了纯API服务模式的溢价空间,从而争夺开发者心智并带动云服务与算力销售。”

2024年之前,开源在中国大模型赛道中的角色更多体现为支持学术力量与小型创业团队开展公益性行动。但从2025年下半年起,百度、阿里、腾讯、字节跳动等头部厂商对开源的战略定位发生了根本性变化。

从数据来看,开源生态建设已在规模与深度上取得扎实进展。阿里旗下的ModelScope(魔搭社区)于2026年3月公布的数据显示,社区用户数已达2500万,九个月内增长逾千万;平台上的开源模型数量从7万增长至17万。其中仅千问(Qwen)系列模型便包含超过400个官方开源版本,开发者在魔搭社区基于Qwen开发的衍生模型数已超过3.4万个。

近期,小米集团宣布旗舰大模型MiMo-V2.5-Pro及全模态模型MiMo-V2.5正式全球开源,同步推出MiMo Orbit计划。该计划包含“百万亿Token创造者激励计划”与“Agent生态共建计划”两大板块:前者面向全球AI用户,计划30天内合计发放100万亿免费Token,通过规模化补贴快速扩大开发者生态;后者面向全球Agent框架团队,提供限时免费模型接入服务。值得关注的是,MiMo-V2.5-Pro在开源首日即完成与AWS、阿里平头哥、AMD、百度昆仑芯、燧原科技、沐曦及天数智芯等多家主流芯片厂商的深度适配,并同步完成SGLang及vLLM两大主流推理框架的Day 0适配。

与此同时,智能体(Agent)生态正在重构竞争格局。2026年,OpenClaw使AI首次具备了真正的“动手能力”,能够自主调用工具、操作软件、执行任务。随后,各大厂商围绕开发者生态与Agent落地场景展开了新一轮竞争。

在累计下载量突破百亿的时代,开源大模型的版图仍在持续演化与扩张。


特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
王心凌在深圳演出中遇意外:舞台镭射激光设备失控,强光直射王心凌腿部;网友反映激光长时间大面积扫射观众席,致手机相机镜头等设备损坏

王心凌在深圳演出中遇意外:舞台镭射激光设备失控,强光直射王心凌腿部;网友反映激光长时间大面积扫射观众席,致手机相机镜头等设备损坏

洪观新闻
2026-05-06 12:06:56
墨菲警告英政府:中国人15年里给斯诺克砸了太多钱 赶紧抄作业吧

墨菲警告英政府:中国人15年里给斯诺克砸了太多钱 赶紧抄作业吧

风过乡
2026-05-06 07:19:53
0-1北京!广东输在哪?数据一目了然,2人在拖后腿,板凳对比辣眼

0-1北京!广东输在哪?数据一目了然,2人在拖后腿,板凳对比辣眼

后仰大风车
2026-05-06 21:37:47
有没有哪个国家从低生育率回升到更替水平?

有没有哪个国家从低生育率回升到更替水平?

何亚福
2026-05-06 11:58:20
妹子,你露个大白胸脯,在这儿干什么呢?

妹子,你露个大白胸脯,在这儿干什么呢?

飛娱日记
2026-04-18 10:48:09
把瑜伽裤穿成日常的松弛感美女

把瑜伽裤穿成日常的松弛感美女

只要高兴就好
2026-04-13 14:30:30
11年前优衣库男女主现状曝光,他们还在一起生了两个孩子

11年前优衣库男女主现状曝光,他们还在一起生了两个孩子

半糖甜而不腻
2026-04-06 12:09:15
5天百万内地人涌向香港,并看到了香港的另一面

5天百万内地人涌向香港,并看到了香港的另一面

港你知
2026-05-06 21:44:51
伊朗突然改变态度的原因

伊朗突然改变态度的原因

杨兴文
2026-05-06 20:56:15
欧冠疯狂一夜!登贝莱破门 裁判惹争议!巴黎6-5击败拜仁杀入决赛

欧冠疯狂一夜!登贝莱破门 裁判惹争议!巴黎6-5击败拜仁杀入决赛

郝小小看体育
2026-05-07 05:29:58
王皓无奈马龙挠头!梁靖崑回应0-3完败:一直陷入自我怀疑 不能躲

王皓无奈马龙挠头!梁靖崑回应0-3完败:一直陷入自我怀疑 不能躲

风过乡
2026-05-06 19:48:00
女邻居让我帮她接电线,黑暗中我们抱到了一起,但她没有松手

女邻居让我帮她接电线,黑暗中我们抱到了一起,但她没有松手

千秋文化
2026-05-04 18:34:54
浙江36岁宝妈突发脑梗!从没“三高”的她,自行用家中筋膜枪按摩放松颈部,致左侧椎动脉夹层

浙江36岁宝妈突发脑梗!从没“三高”的她,自行用家中筋膜枪按摩放松颈部,致左侧椎动脉夹层

台州交通广播
2026-05-07 00:45:40
老人财产转给独生子女:3个最佳时间,早知道少走弯路

老人财产转给独生子女:3个最佳时间,早知道少走弯路

小鹿姐姐情感说
2026-05-05 10:43:52
国家杰青被举报 Nature 子刊论文造假,中山大学回应

国家杰青被举报 Nature 子刊论文造假,中山大学回应

生物学霸
2026-05-06 17:19:09
5月1日起,抽烟,买烟全变天!违规直接重罚,烟民、商家必看

5月1日起,抽烟,买烟全变天!违规直接重罚,烟民、商家必看

王二哥老搞笑
2026-05-05 21:10:10
天花板藏“不速之客”,大兴区一居民家厨房里摘出15斤重大蜂巢

天花板藏“不速之客”,大兴区一居民家厨房里摘出15斤重大蜂巢

新京报
2026-05-06 20:58:26
段鹏79岁临终前说出隐情:和尚死在黑云寨,是因为和尚知道了……

段鹏79岁临终前说出隐情:和尚死在黑云寨,是因为和尚知道了……

呆子的故事
2026-02-10 14:44:11
女演员高圆圆现身沈阳早市摆摊卖辣白菜,被网友封“辣白菜西施”

女演员高圆圆现身沈阳早市摆摊卖辣白菜,被网友封“辣白菜西施”

半岛晨报
2026-05-06 12:37:16
输北京队8分!揪出1个表现最差之人,坑惨了广东队

输北京队8分!揪出1个表现最差之人,坑惨了广东队

体育哲人
2026-05-06 21:42:17
2026-05-07 06:07:00
21世纪经济报道 incentive-icons
21世纪经济报道
中国商业新闻领导者
246443文章数 744220关注度
往期回顾 全部

科技要闻

“马斯克不懂AI”:OpenAI当庭戳老底

头条要闻

伊朗:美动用所有军事手段也无法开通霍尔木兹海峡

头条要闻

伊朗:美动用所有军事手段也无法开通霍尔木兹海峡

体育要闻

活塞1比0骑士:坎宁安不再是一个人了

娱乐要闻

谢娜演唱会暗藏惊喜 何炅瞒天过海现身

财经要闻

估值450亿美元 大基金被曝将投资DeepSeek

汽车要闻

领克10/领克10+ 无论能源形式 领克都要快乐

态度原创

数码
游戏
健康
旅游
房产

数码要闻

三星宣布在中国大陆停售家电产品:手机业务不受影响 仍正常销售

LPL第二赛段:滔搏排名迅速滑落!JDG三局战胜TES

干细胞治烧烫伤面临这些“瓶颈”

旅游要闻

“旅游兴趣班”开启文旅经济新赛道

房产要闻

遥遥领先!这个澄迈顶流红盘,凭什么持续霸榜

无障碍浏览 进入关怀版