网易首页 > 网易号 > 正文 申请入驻

中国AI模型是否已超越全球同行?斯坦福报告绘制中国开源AI全景图

0
分享至

2025 年末,一份来自斯坦福大学人本人工智能研究院(Stanford Institute for Human-Centered Artificial Intelligence,简称 HAI)与 DigiChina 项目联合发布了一项政策简报,对中国开放权重 AI 模型的全球崛起这一在硅谷引发热议却鲜少被系统分析的话题进行了深入解读。

这份题为《超越 DeepSeek:中国多元化的开放权重 AI 生态系统及其政策影响》的报告,发布于 12 月初,由 Caroline Meinhardt、Sabina Nong、Graham Webster 等五位研究者联合撰写。

报告试图厘清一个现实:当 DeepSeek 在今年 1 月以一款推理模型震惊全球投资者、让英伟达市值单日蒸发近千亿美元时,这家杭州初创公司并非中国 AI 领域的唯一选手。它只是一个更庞大、更多元生态系统的冰山一角。

从追赶到领跑

报告援引的多项数据指向一个明确结论:在开源大模型领域,中国已从追赶者变为领跑者。所谓开放权重,指的是模型的参数权重可供下载、使用和修改,开发者能够在官方应用或 API 之外独立运行这些模型,并根据自身需求进行调整。

根据 Hugging Face 平台的下载统计,阿里巴巴旗下的 Qwen(通义千问)模型系列在 2025 年 9 月正式超越 Meta 的 Llama,成为该平台下载量最高的大语言模型家族。截至 12 月中旬,Qwen 累计下载量已达约 3.85 亿次,而 Llama 约为 3.46 亿次。另一组数据同样值得关注:2024 年 8 月至 2025 年 8 月间,中国开发者的模型下载量占 Hugging Face 总下载量的 17.1%,首次超过美国的 15.8%。这组数据由麻省理工学院与 Hugging Face 联合追踪,经 ATOM 项目分析后公布。

衍生模型的增长曲线更能说明问题。自 2025 年 1 月起,基于 Qwen 和 DeepSeek 的衍生模型上传数量持续攀升,到 9 月份时,中国模型的衍生版本已占 Hugging Face 当月新增衍生模型的 63%。这意味着全球开发者社区正在以前所未有的速度围绕中国模型构建应用生态。

报告重点剖析了四个具有代表性的中国模型家族。

Qwen 由阿里云开发,定位于多语言和多模态能力最强的通用模型,支持 119 种语言,采用 Apache 2.0 许可证开源;DeepSeek-R1 以推理能力见长,在数学和复杂问题求解方面表现突出,同时也提供了多个蒸馏版本供资源受限的开发者使用;月之暗面(Moonshot AI)的 Kimi K2 聚焦于代码生成和智能体任务,强调快速推理;智谱 AI(现更名为 Z.ai)的 GLM-4.5 则走均衡路线,通过多专家训练整合推理、编程和视觉能力。

芯片受限下的效率优先策略

从技术架构看,这些模型普遍采用了混合专家(Mixture of Experts,MoE)架构。MoE 的核心优势在于效率,它能让模型在有限的计算资源下获得更好的性能,训练和推理速度都更快。这并非巧合。

由于美国自 2022 年起对先进 AI 芯片实施出口管制,中国开发者被迫在算力受限的条件下寻找替代方案。DeepSeek 在 2024 年底和 2025 年初发布的模型,正是 MoE 架构的标杆应用。以 DeepSeek-V3 为例,虽然总参数量高达 6,710 亿,但单次推理仅激活 370 亿参数,既保证了性能,又大幅降低了运行成本。

另一个值得关注的转变是许可证条款的自由化。

2024 年发布的 Qwen 2.5 曾对最小和最大规格的模型施加了研究用途限制,同期的 DeepSeek V3 也限制了商业使用和再分发。但到了 2025 年,Qwen3 和 DeepSeek R1 全部采用了最宽松的开源许可证,前者是 Apache 2.0,后者是 MIT License。这种转变的背后,既有吸引全球开发者社区的商业考量,也有中国开发者希望借开放姿态在国际 AI 圈建立学术信誉的诉求。

有意思的是,这场开放潮流甚至影响了此前坚持闭源路线的玩家。百度 CEO 李彦宏曾是中国科技圈里最坚定的闭源拥趸,他多次公开强调私有模型的商业优势。然而到了 2025 年 6 月,百度还是向市场妥协,将旗舰产品文心一言(ERNIE)4.5 以开放权重形式发布。用李彦宏自己的话说:“当模型开源时,人们出于好奇自然想尝试一下。”

政策支持与商业模式

报告作者们特别指出,中国官方在开放权重 AI 发展中扮演的角色复杂而微妙。顶层设计的支持确实存在:早在 2017 年的《新一代人工智能发展规划》中,“开源”和“开放”就被明确列为推动国家创新战略的关键词汇。

2023 年 10 月发布的《全球人工智能治理倡议》和 2025 年 7 月发布的《全球人工智能治理行动计划》,则将开源 AI 提升至国际话语权争夺的高度,强调“平等的 AI 发展和使用权”,与美国的出口管制形成对比。

但报告同时也提醒读者警惕过度简化。DeepSeek 的成功似乎与政府扶持关系不大,这家公司脱胎于私募量化基金幻方,直到 V3 发布引发广泛关注后,其创始人梁文锋才进入更广泛的公众视野。

换句话说,中国开放权重 AI 的繁荣更多是市场竞争、人才积累和工程文化共同作用的结果,而非自上而下的规划产物。

当然,政府的角色也并非完全缺席。地方政府正在为参与开源社区的 AI 组织和项目提供定向财政支持;学术机构被鼓励将开源贡献纳入科研绩效考核;算力基础设施的建设也得到了国家层面的资源倾斜。据不完全统计,已有不少地方公共服务部门将 DeepSeek 模型的本地化版本集成到相关系统中,这些系统通常由数据管理部门与技术伙伴负责部署和微调。

从商业模式角度看,中国开放权重模型开发者正在探索多元化的变现路径,但长期的规模化兑现与可持续性仍有待市场检验。

阿里巴巴作为云服务提供商,将 Qwen 定位为“AI 操作系统”,试图通过企业和政府客户对模型的采用带动云计算业务增长,HP、阿斯利康据称已成为其客户。新加坡国家 AI 计划选择基于 Qwen3 构建旗舰模型,可能为阿里云带来东南亚市场的商业流量。

DeepSeek 和智谱则走轻资产路线,没有自建大规模云基础设施,而是采取协作部署策略,为不同云和算力提供商的客户提供本地化服务。总体而言,与西方同行类似,中国开发者目前仍依赖间接变现:通过广泛采用的开放模型培育用户基础,再将其引导至付费产品和服务。

老调子还没唱完

报告最后用相当篇幅讨论了政策影响,归纳为四个维度:全球获取与依赖性、AI 治理、AI 安全、地缘政治竞争,毫无疑问的又是美国智库讨论中国技术议题时的标准模板。

关于技术获取,报告指出高性能中国模型的广泛可用,为资源有限的低收入和中等收入国家提供了获取先进 AI 能力的新路径。当模型性能趋同于前沿水平时,这些国家的采用者可能更看重负担得起、稳定可靠的服务,而非追逐最高基准分数。

中国模型“够好用”、许可证宽松、使用成本低,恰好契合这一需求。这一逻辑在发达国家同样适用:Airbnb CEO Brian Chesky 在 11 月透露,公司倾向于使用 Qwen 而非 ChatGPT 为客服聊天机器人供电,原因很简单:“又快又便宜”。

治理和安全维度则再次搬出了那些熟悉的论调。报告声称使用中国模型可能“继承内置的内容审查逻辑”,数据“可能物理传输至中国”,面临“被政府或商业竞争对手获取的风险”。在安全层面,报告引用美国政府 AI 测试中心 CAISI 的评估称 DeepSeek 模型被越狱攻击突破的概率是美国同类模型的 12 倍。

最后一个维度依旧是地缘政治竞争。DeepSeek R1 的发布直接改变了美国对开放权重 AI 的政策态度。特朗普总统称其为“警醒时刻”,白宫 AI 事务负责人 David Sacks 则将其作为推行联邦层面 AI 去监管政策的依据。

2025 年 7 月,白宫发布《美国 AI 行动计划》,将开放权重模型提升为战略资产,同时强调加强对中国等对手的出口管制。一个月后,OpenAI 时隔近六年首次发布开放权重模型,采用 Apache 2.0 许可证——Sam Altman 在与记者的晚餐中坦承,中国开源模型的竞争是促使他们做出这一决定的重要因素:“如果我们不这么做,世界将主要建立在中国开源模型之上。这确实是我们决策中的一个重要考量。”

当然,尽管这份报告离不开这些模板化的框架,但其价值仍在于它提供了一个相对完整的图景:中国开放权重 AI 生态系统的参与者多元,包括 DeepSeek、阿里巴巴这样的明星,也包括智谱、月之暗面、百川、零一万物等一众“小巨头”,以及北京智源人工智能研究院这样的非营利机构;它们的技术路线各有侧重,许可证策略趋向宽松,商业模式仍在摸索;政府支持确实存在,但并非唯一驱动力;全球扩散已成事实,政策影响正在显现。

对于那些仍将 DeepSeek 视为“中国 AI 的全部故事”的观察者而言,这份报告是一次必要的校准。而对于那些试图以简单的“赶超”或“落后”叙事框定中美 AI 竞争的人来说,它提供了更多需要消化的复杂性:当模型能力差距缩小,真正的竞争会越来越像生态竞争、工程竞争、成本竞争与合规竞争叠加的系统战。把这些变量看清楚,才更接近“中文模型是否超越全球同行”这个问题在产业层面的真实答案。

参考资料:

1.https://hai.stanford.edu/policy/beyond-deepseek-chinas-diverse-open-weight-ai-ecosystem-and-its-policy-implications

运营/排版:何晨龙

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
黄金时代腕表的悖论:标准答案早有了,却兜了30年圈子

黄金时代腕表的悖论:标准答案早有了,却兜了30年圈子

灰度测试中
2026-07-03 00:15:32
斯卡洛尼:我们总要看到积极的一面,这支球队永不言弃

斯卡洛尼:我们总要看到积极的一面,这支球队永不言弃

懂球帝
2026-07-04 09:05:07
昆明试验列车撞人致11死2伤,调查报告公布

昆明试验列车撞人致11死2伤,调查报告公布

界面新闻
2026-07-03 17:46:55
1换3!湖人达成交易!NBA三状元正式联手

1换3!湖人达成交易!NBA三状元正式联手

篮球教学论坛
2026-07-04 09:11:35
0-3温网大冷门,世界第9遭世界第74掀翻,梅德韦杰夫止步32强

0-3温网大冷门,世界第9遭世界第74掀翻,梅德韦杰夫止步32强

俯身冲顶
2026-07-04 00:08:08
7月主线已经换了,资金正在涌入这些新方向!

7月主线已经换了,资金正在涌入这些新方向!

亿通电子游戏
2026-07-03 21:04:12
人过80岁,哪怕身体再健康,也要记住这四句话,晚年远离病痛

人过80岁,哪怕身体再健康,也要记住这四句话,晚年远离病痛

观星赏月
2026-07-03 12:03:48
《澎湖海战》被媒体集体放弃,施琅精神被吐槽,基本盘也不买账了

《澎湖海战》被媒体集体放弃,施琅精神被吐槽,基本盘也不买账了

眼光很亮
2026-07-02 09:46:26
事发早高峰!上海高架发生离奇事故,网友: 怎能撞成这样…原因找到了!

事发早高峰!上海高架发生离奇事故,网友: 怎能撞成这样…原因找到了!

新浪财经
2026-07-04 08:38:27
华南理工大学再次向中山大学“输送”校长!中央批准:唐洪武同志任中山大学校长(副部长级)

华南理工大学再次向中山大学“输送”校长!中央批准:唐洪武同志任中山大学校长(副部长级)

矿材网
2026-07-04 02:33:44
3换1!湖人交易艾顿!三大状元重磅联手

3换1!湖人交易艾顿!三大状元重磅联手

篮球实战宝典
2026-07-04 02:13:52
西安赛格事件最新!所有商户消费款项,统一流入运营账户,引热议

西安赛格事件最新!所有商户消费款项,统一流入运营账户,引热议

火山詩话
2026-07-03 12:26:19
中俄空中挂弹战略巡航最近距东京仅700公里日本很紧张,炒作“武力威胁”

中俄空中挂弹战略巡航最近距东京仅700公里日本很紧张,炒作“武力威胁”

每日经济新闻
2026-07-02 20:18:52
离婚传闻真相大白后,罗晋近况曝光,原来他和辛柏青的处境一样

离婚传闻真相大白后,罗晋近况曝光,原来他和辛柏青的处境一样

说历史的老牢
2026-07-03 09:13:04
德黑兰国葬!中方人员定了,规格不及俄罗斯,却派到伊朗心坎上了

德黑兰国葬!中方人员定了,规格不及俄罗斯,却派到伊朗心坎上了

军机Nova
2026-07-02 23:33:12
韩红要崩溃了!央视重温播放《天路》,是原唱巴桑版本,评论炸锅

韩红要崩溃了!央视重温播放《天路》,是原唱巴桑版本,评论炸锅

曹莽看世界
2026-07-04 10:05:14
即将对阵梅西?萨拉赫:阿根廷比赛还没踢,必须尊重对手

即将对阵梅西?萨拉赫:阿根廷比赛还没踢,必须尊重对手

懂球帝
2026-07-04 06:25:21
世界杯第23日:佛得角爆冷阿根廷?亚洲独苗出场 16强将全部产生

世界杯第23日:佛得角爆冷阿根廷?亚洲独苗出场 16强将全部产生

云隐南山
2026-07-03 21:23:07
半年销量不足3万,高颜值阿维塔为何卖不动

半年销量不足3万,高颜值阿维塔为何卖不动

摸鱼算法
2026-07-04 02:18:13
独家|娃哈哈一茶饮检出甜蜜素,遭美国FDA“进口警报” ,后续进入美国将遭扣留;娃哈哈知情人士回应:系经销商私自出口行为

独家|娃哈哈一茶饮检出甜蜜素,遭美国FDA“进口警报” ,后续进入美国将遭扣留;娃哈哈知情人士回应:系经销商私自出口行为

每日经济新闻
2026-07-03 16:35:02
2026-07-04 10:36:49
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技评论独家合作
16920文章数 515076关注度
往期回顾 全部

科技要闻

iPhone 18 Pro泄密影响恶劣,印度调查塔塔

头条要闻

阿根廷加时赛3-2绝杀佛得角 世界杯最大黑马昂首出局

头条要闻

阿根廷加时赛3-2绝杀佛得角 世界杯最大黑马昂首出局

体育要闻

今夏最动人告别!世界从此记住佛得角

娱乐要闻

海来阿木孕期出轨指控掀起全网热议

财经要闻

韩国股市杠杆失控:450亿美元资金狂飙

汽车要闻

方程豹钛9内饰曝光 用上了长联屏设计/下半年上市

态度原创

手机
数码
本地
健康
公开课

手机要闻

iPhone 18系列或涨价 两项iOS 27新AI功能仍缺席

数码要闻

消息称Apple Watch Series 12表带内嵌传感器,支持血糖监测等

本地新闻

国内足球之旅?这座小城给你高分答案

听说少吃点能抗衰老?专家讲解!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版