网易首页 > 网易号 > 正文 申请入驻

中国AI模型是否已超越全球同行?斯坦福报告绘制中国开源AI全景图

0
分享至

2025 年末,一份来自斯坦福大学人本人工智能研究院(Stanford Institute for Human-Centered Artificial Intelligence,简称 HAI)与 DigiChina 项目联合发布了一项政策简报,对中国开放权重 AI 模型的全球崛起这一在硅谷引发热议却鲜少被系统分析的话题进行了深入解读。

这份题为《超越 DeepSeek:中国多元化的开放权重 AI 生态系统及其政策影响》的报告,发布于 12 月初,由 Caroline Meinhardt、Sabina Nong、Graham Webster 等五位研究者联合撰写。


图丨相关报告(来源:HAI)

报告试图厘清一个现实:当 DeepSeek 在今年 1 月以一款推理模型震惊全球投资者、让英伟达市值单日蒸发近千亿美元时,这家杭州初创公司并非中国 AI 领域的唯一选手。它只是一个更庞大、更多元生态系统的冰山一角。

从追赶到领跑

报告援引的多项数据指向一个明确结论:在开源大模型领域,中国已从追赶者变为领跑者。所谓开放权重,指的是模型的参数权重可供下载、使用和修改,开发者能够在官方应用或 API 之外独立运行这些模型,并根据自身需求进行调整。

根据 Hugging Face 平台的下载统计,阿里巴巴旗下的 Qwen(通义千问)模型系列在 2025 年 9 月正式超越 Meta 的 Llama,成为该平台下载量最高的大语言模型家族。截至 12 月中旬,Qwen 累计下载量已达约 3.85 亿次,而 Llama 约为 3.46 亿次。另一组数据同样值得关注:2024 年 8 月至 2025 年 8 月间,中国开发者的模型下载量占 Hugging Face 总下载量的 17.1%,首次超过美国的 15.8%。这组数据由麻省理工学院与 Hugging Face 联合追踪,经 ATOM 项目分析后公布。


图丨开源模型的累积下载量(来源:HAI)

衍生模型的增长曲线更能说明问题。自 2025 年 1 月起,基于 Qwen 和 DeepSeek 的衍生模型上传数量持续攀升,到 9 月份时,中国模型的衍生版本已占 Hugging Face 当月新增衍生模型的 63%。这意味着全球开发者社区正在以前所未有的速度围绕中国模型构建应用生态。

报告重点剖析了四个具有代表性的中国模型家族。

Qwen 由阿里云开发,定位于多语言和多模态能力最强的通用模型,支持 119 种语言,采用 Apache 2.0 许可证开源;DeepSeek-R1 以推理能力见长,在数学和复杂问题求解方面表现突出,同时也提供了多个蒸馏版本供资源受限的开发者使用;月之暗面(Moonshot AI)的 Kimi K2 聚焦于代码生成和智能体任务,强调快速推理;智谱 AI(现更名为 Z.ai)的 GLM-4.5 则走均衡路线,通过多专家训练整合推理、编程和视觉能力。


(来源:HAI)

芯片受限下的效率优先策略

从技术架构看,这些模型普遍采用了混合专家(Mixture of Experts,MoE)架构。MoE 的核心优势在于效率,它能让模型在有限的计算资源下获得更好的性能,训练和推理速度都更快。这并非巧合。

由于美国自 2022 年起对先进 AI 芯片实施出口管制,中国开发者被迫在算力受限的条件下寻找替代方案。DeepSeek 在 2024 年底和 2025 年初发布的模型,正是 MoE 架构的标杆应用。以 DeepSeek-V3 为例,虽然总参数量高达 6,710 亿,但单次推理仅激活 370 亿参数,既保证了性能,又大幅降低了运行成本。

另一个值得关注的转变是许可证条款的自由化。

2024 年发布的 Qwen 2.5 曾对最小和最大规格的模型施加了研究用途限制,同期的 DeepSeek V3 也限制了商业使用和再分发。但到了 2025 年,Qwen3 和 DeepSeek R1 全部采用了最宽松的开源许可证,前者是 Apache 2.0,后者是 MIT License。这种转变的背后,既有吸引全球开发者社区的商业考量,也有中国开发者希望借开放姿态在国际 AI 圈建立学术信誉的诉求。

有意思的是,这场开放潮流甚至影响了此前坚持闭源路线的玩家。百度 CEO 李彦宏曾是中国科技圈里最坚定的闭源拥趸,他多次公开强调私有模型的商业优势。然而到了 2025 年 6 月,百度还是向市场妥协,将旗舰产品文心一言(ERNIE)4.5 以开放权重形式发布。用李彦宏自己的话说:“当模型开源时,人们出于好奇自然想尝试一下。”

政策支持与商业模式

报告作者们特别指出,中国官方在开放权重 AI 发展中扮演的角色复杂而微妙。顶层设计的支持确实存在:早在 2017 年的《新一代人工智能发展规划》中,“开源”和“开放”就被明确列为推动国家创新战略的关键词汇。

2023 年 10 月发布的《全球人工智能治理倡议》和 2025 年 7 月发布的《全球人工智能治理行动计划》,则将开源 AI 提升至国际话语权争夺的高度,强调“平等的 AI 发展和使用权”,与美国的出口管制形成对比。

但报告同时也提醒读者警惕过度简化。DeepSeek 的成功似乎与政府扶持关系不大,这家公司脱胎于私募量化基金幻方,直到 V3 发布引发广泛关注后,其创始人梁文锋才进入更广泛的公众视野。

换句话说,中国开放权重 AI 的繁荣更多是市场竞争、人才积累和工程文化共同作用的结果,而非自上而下的规划产物。

当然,政府的角色也并非完全缺席。地方政府正在为参与开源社区的 AI 组织和项目提供定向财政支持;学术机构被鼓励将开源贡献纳入科研绩效考核;算力基础设施的建设也得到了国家层面的资源倾斜。据不完全统计,已有不少地方公共服务部门将 DeepSeek 模型的本地化版本集成到相关系统中,这些系统通常由数据管理部门与技术伙伴负责部署和微调。

从商业模式角度看,中国开放权重模型开发者正在探索多元化的变现路径,但长期的规模化兑现与可持续性仍有待市场检验。

阿里巴巴作为云服务提供商,将 Qwen 定位为“AI 操作系统”,试图通过企业和政府客户对模型的采用带动云计算业务增长,HP、阿斯利康据称已成为其客户。新加坡国家 AI 计划选择基于 Qwen3 构建旗舰模型,可能为阿里云带来东南亚市场的商业流量。

DeepSeek 和智谱则走轻资产路线,没有自建大规模云基础设施,而是采取协作部署策略,为不同云和算力提供商的客户提供本地化服务。总体而言,与西方同行类似,中国开发者目前仍依赖间接变现:通过广泛采用的开放模型培育用户基础,再将其引导至付费产品和服务。

老调子还没唱完

报告最后用相当篇幅讨论了政策影响,归纳为四个维度:全球获取与依赖性、AI 治理、AI 安全、地缘政治竞争,毫无疑问的又是美国智库讨论中国技术议题时的标准模板。

关于技术获取,报告指出高性能中国模型的广泛可用,为资源有限的低收入和中等收入国家提供了获取先进 AI 能力的新路径。当模型性能趋同于前沿水平时,这些国家的采用者可能更看重负担得起、稳定可靠的服务,而非追逐最高基准分数。

中国模型“够好用”、许可证宽松、使用成本低,恰好契合这一需求。这一逻辑在发达国家同样适用:Airbnb CEO Brian Chesky 在 11 月透露,公司倾向于使用 Qwen 而非 ChatGPT 为客服聊天机器人供电,原因很简单:“又快又便宜”。

治理和安全维度则再次搬出了那些熟悉的论调。报告声称使用中国模型可能“继承内置的内容审查逻辑”,数据“可能物理传输至中国”,面临“被政府或商业竞争对手获取的风险”。在安全层面,报告引用美国政府 AI 测试中心 CAISI 的评估称 DeepSeek 模型被越狱攻击突破的概率是美国同类模型的 12 倍。

最后一个维度依旧是地缘政治竞争。DeepSeek R1 的发布直接改变了美国对开放权重 AI 的政策态度。特朗普总统称其为“警醒时刻”,白宫 AI 事务负责人 David Sacks 则将其作为推行联邦层面 AI 去监管政策的依据。

2025 年 7 月,白宫发布《美国 AI 行动计划》,将开放权重模型提升为战略资产,同时强调加强对中国等对手的出口管制。一个月后,OpenAI 时隔近六年首次发布开放权重模型,采用 Apache 2.0 许可证——Sam Altman 在与记者的晚餐中坦承,中国开源模型的竞争是促使他们做出这一决定的重要因素:“如果我们不这么做,世界将主要建立在中国开源模型之上。这确实是我们决策中的一个重要考量。”

当然,尽管这份报告离不开这些模板化的框架,但其价值仍在于它提供了一个相对完整的图景:中国开放权重 AI 生态系统的参与者多元,包括 DeepSeek、阿里巴巴这样的明星,也包括智谱、月之暗面、百川、零一万物等一众“小巨头”,以及北京智源人工智能研究院这样的非营利机构;它们的技术路线各有侧重,许可证策略趋向宽松,商业模式仍在摸索;政府支持确实存在,但并非唯一驱动力;全球扩散已成事实,政策影响正在显现。

对于那些仍将 DeepSeek 视为“中国 AI 的全部故事”的观察者而言,这份报告是一次必要的校准。而对于那些试图以简单的“赶超”或“落后”叙事框定中美 AI 竞争的人来说,它提供了更多需要消化的复杂性:当模型能力差距缩小,真正的竞争会越来越像生态竞争、工程竞争、成本竞争与合规竞争叠加的系统战。把这些变量看清楚,才更接近“中文模型是否超越全球同行”这个问题在产业层面的真实答案。

参考资料:

1.https://hai.stanford.edu/policy/beyond-deepseek-chinas-diverse-open-weight-ai-ecosystem-and-its-policy-implications

运营/排版:何晨龙

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
90年代,跟随吴学谦副总理8年的秘书调到地方工作,是什么级别?

90年代,跟随吴学谦副总理8年的秘书调到地方工作,是什么级别?

历史甄有趣
2026-01-31 07:10:07
世界5大禁片,全看完的人,心理素质堪比特种兵

世界5大禁片,全看完的人,心理素质堪比特种兵

i书与房
2026-01-26 15:07:05
金价大跳水后,男子斥资20多万元抄底买入200克,称“不在意短期涨跌”,还有人称“肯定会回调”,工行、农行、交行公告

金价大跳水后,男子斥资20多万元抄底买入200克,称“不在意短期涨跌”,还有人称“肯定会回调”,工行、农行、交行公告

每日经济新闻
2026-02-01 10:38:04
爱泼斯坦遗嘱把萝莉岛留给女友,还给女友5000万美元、一枚钻戒和多处房产

爱泼斯坦遗嘱把萝莉岛留给女友,还给女友5000万美元、一枚钻戒和多处房产

现代快报
2026-02-01 22:18:04
制霸攻防,艾伦23中16砍40分17板5助2断4帽0失误

制霸攻防,艾伦23中16砍40分17板5助2断4帽0失误

懂球帝
2026-02-02 13:04:24
比尔·克林顿被曝新照,爱泼斯坦同伙陪他庆生,疑受害少女也在场

比尔·克林顿被曝新照,爱泼斯坦同伙陪他庆生,疑受害少女也在场

译言
2026-02-01 08:23:33
美媒:第四架歼-36原型机试飞,作战半径4000公里,可携带霹雳-17

美媒:第四架歼-36原型机试飞,作战半径4000公里,可携带霹雳-17

爱吃醋的猫咪
2026-02-01 19:33:20
火箭客战步行者!伤病情况出炉:杜兰特+2老将伤缺,主队2人不打

火箭客战步行者!伤病情况出炉:杜兰特+2老将伤缺,主队2人不打

熊哥爱篮球
2026-02-02 13:18:28
大尺度和谐引玩家不满,任天堂开发商互相甩锅,宝可梦正式道歉

大尺度和谐引玩家不满,任天堂开发商互相甩锅,宝可梦正式道歉

叨叨游戏
2026-01-31 16:37:11
满载40吨黄金的日本“阿波丸”,中国打捞上岸后,所有人都愣住了

满载40吨黄金的日本“阿波丸”,中国打捞上岸后,所有人都愣住了

鉴史录
2026-01-23 10:46:34
中国为啥能迅速崛起,德国专家给出看法:中国没覆盖全民族的宗教

中国为啥能迅速崛起,德国专家给出看法:中国没覆盖全民族的宗教

兴趣知识
2025-12-13 03:31:06
1958年,毛主席批评周总理“离右派剩50米”,不久后总理提出辞职

1958年,毛主席批评周总理“离右派剩50米”,不久后总理提出辞职

海佑讲史
2026-01-26 07:45:05
杜兰特笑烂了!狂打25铁还能赢!火箭变天!?

杜兰特笑烂了!狂打25铁还能赢!火箭变天!?

柚子说球
2026-02-01 12:50:29
李娜与姜山:传奇落幕,唯有双向奔赴的爱意永存

李娜与姜山:传奇落幕,唯有双向奔赴的爱意永存

佳易博览
2026-01-30 12:11:33
新华社消息|伊朗总统:战争既不符合伊朗利益也不符合美国利益

新华社消息|伊朗总统:战争既不符合伊朗利益也不符合美国利益

新华社
2026-02-01 10:37:07
伊朗已被包围,美军开战在即,哈梅内伊进地堡,中方要做最坏打算

伊朗已被包围,美军开战在即,哈梅内伊进地堡,中方要做最坏打算

来科点谱
2026-01-29 08:55:35
武汉通报龙门吊倒塌事故:发生在拆除作业过程中,致1死1伤

武汉通报龙门吊倒塌事故:发生在拆除作业过程中,致1死1伤

南方都市报
2026-02-01 20:14:25
中日韩最大财团对比:三星3.2万亿,三菱21万亿,中国第一是谁?

中日韩最大财团对比:三星3.2万亿,三菱21万亿,中国第一是谁?

阿器谈史
2026-01-30 08:40:58
詹姆斯入选!东道主全部没进,NBA太奇怪了!

詹姆斯入选!东道主全部没进,NBA太奇怪了!

德译洋洋
2026-02-02 12:33:36
记住这两兄弟,他们犯了互联网历史上最大的错误!

记住这两兄弟,他们犯了互联网历史上最大的错误!

码农翻身
2025-12-10 09:04:46
2026-02-02 13:44:49
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技评论独家合作
16209文章数 514582关注度
往期回顾 全部

科技要闻

元宝发10亿红包,阿里千问:我跟30亿

头条要闻

外媒:伊朗正处于最弱时期 是推翻现有政权的最佳时机

头条要闻

外媒:伊朗正处于最弱时期 是推翻现有政权的最佳时机

体育要闻

澳网男单决赛,属于阿尔卡拉斯的加冕仪式

娱乐要闻

周杰伦带王俊凯陈奕迅聚餐 畅聊音乐

财经要闻

国六货车被迫"换头" 每次收费超200元

汽车要闻

雷克萨斯LC500将于今年底停产 "最美雷克萨斯"谢幕

态度原创

时尚
教育
数码
艺术
军事航空

普通人衣服没必要买太多,准备好这些单品,简单实用又耐看

教育要闻

这篇小学生的作文《我的爸爸》,真实了多少中年老父亲

数码要闻

消息称为REDMI K Pad 2小平板上半年登场,搭载正代旗舰芯

艺术要闻

马斯克花5万买的折叠屋,是预制住宅的未来吗?

军事要闻

委内瑞拉外长会见美外交使团团长

无障碍浏览 进入关怀版