网易首页 > 网易号 > 正文 申请入驻

来自中国的大模型成最大黑马,成本仅国外三十分之一,硅谷恐慌

0
分享至

1.25

知识分子

The Intellectual

图源:pixabay

撰文 |张天祁 李珊珊

“Meta的生成式AI部门正处于恐慌中。这一切始于 Deepseek,它使得 Llama 4 在基准测试中已经落后。雪上加霜的是:那个不知名的中国公司,仅有 550 万美元的训练预算。工程师们正在疯狂地剖析 Deepseek,并试图从中复制一切可能的东西……”

一位Meta的工程师在美国科技公司员工社区Blind中这样写道。

5天前,中国的一家AI大模型创业公司DeepSeek(深度求索)正式发布 DeepSeek-R1大模型。在发布声明中,DeepSeek表示, DeepSeek-R1在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版。这一消息震动了全球AI圈。

例如,在AIME 2024数学基准测试中,DeepSeek-R1的得分率为79.8%,而OpenAI-o1的得分率为79.2%。在MATH-500基准测试中,DeepSeek-R1的得分率为97.3%,而OpenAI-o1的得分率为96.4%。在编码任务中,DeepSeek-R1超过了96.3%的人类选手,而o1是96.6%。

01

一样好用,

但成本不到三十分之一

这个来自中国的大模型,虽然各项指标往往只是与国外的竞品“相当”,最多也只是“略强”,但它的低成本,以及在算力资源上的节省,仍然令国外同行在《自然》杂志上惊呼:“这太疯狂了,完全出乎意料”。

DeepSeek 现在尚未公布训练 R1 的完整成本,但它公布了API的定价,每百万输入 tokens 1 元(缓存命中)/ 4 元(缓存未命中),每百万输出 tokens 16 元。这个收费大约是 OpenAI o1运行成本的三十分之一。

在低价优质的基础上,DeepSeek-R1还实现了部分开源。官方声明同步开源了模型权重,允许研究者和开发者在自己的项目中自由使用该模型,或在其基础上进行进一步的研究和开发。DeepSeek-R1系列支持商业用途,并且允许用户对模型进行任何形式的修改和衍生创作。同时,DeepSeek-R1对用户开放思维链输出,这意味着我们能直接看到它以文本形式输出的“思考”过程。

去年 12 月底,DeepSeek发布的DeepSeek-V3已经引起过一次AI圈的震动。它的性能GPT-4o和Claude Sonnet 3.5等顶尖模型相近,但训练成本极低。整个训练在2048块英伟达H800 GPU集群上完成,仅花费约557.6万美元,不到其他顶尖模型训练成本的十分之一。

GPT-4o等模型的训练成本约为1亿美元,至少在万个GPU量级的计算集群上训练,而且使用的是性能更为优越的H100 GPU。例如,同为顶尖大模型,去年发布的Llama 3.1在训练过程中使用了16,384块H100 GPU,消耗了DeepSeek-V3 11倍的计算资源,成本超过6000万美元。

随着大模型的竞争越来越卷,去年OpenAI、Meta、Google以及马斯克的xAI,各大AI巨头都开始打造自己的万卡(GPU)集群,万卡集群似乎成了训练顶尖大模型的入场券。但DeepSeek却用不到十分之一的资源打造出性能相近的大模型,这让习惯了资源竞赛的硅谷AI界人士感到意外。

DeepSeek-V3发布后,英伟达高级研究科学家Jim Fan曾在社交媒体上表示,“DeepSeek是本年度开源大语言模型领域的最大黑马[1]”。

硅谷人工智能数据服务公司Scale AI的创始人亚历山大·王(Alexander Wang)则在社交媒体上直言不讳地表达了对中国科技界追赶美国的担忧。他认为DeepSeek-V3的发布,是中国科技界带给美国的苦涩教训。“当美国休息时,中国(科技界)在工作,以更低的成本、更快的速度和更强的实力赶上。”

而今年年初DeepSeek-R1发布后,硅谷科技界的评价依然很高。亚历山大·王认为“我们发现,DeepSeek……是表现最好的,或者大致与美国最好的模型相当.这个领域的竞争越来越激烈,而不是越来越少[2]”。

Jim Fan的评价更上一层楼,甚至讨论起了DeepSeek“接班”OpenAI的话题。相比依靠闭源构筑护城河的OpenAI,他在社交网站上表示“我们生活在这样一个时间线上,一家非美国公司正在维持 OpenAI 的原始使命——真正开放、前沿的研究,赋予所有人力量。这看似不合逻辑,但最有趣的结果往往最容易发生[3]”。

在基准测试中的得分未必能完全代表大模型的真实能力,科学家们对R1的能力持更为谨慎的态度。目前,科学家们已经开始对R1进行更深入的测试。

德国埃尔兰根马克斯·普朗克光学研究所人工智能科学家实验室负责人马里奥·克伦,让OpenAI o1和DeepSeek-R1两个竞争模型对3,000个研究想法按照其有趣程度进行排序,并将结果与人类的排序进行了比较。在这个评估标准上,R1的表现略逊于o1。然而,她指出R1在某些量子光学计算任务中表现优于o1[4]。

02

不走寻常路

引起AI圈好奇的,除了DeepSeek-R1性能表现和低成本,还有技术论文中展示的,DeepSeek团队对于AI训练方法的新尝试。

以往的模型在提升推理能力时,通常依赖于把监督微调(SFT)这个环节。在监督微调阶段,研究人员会使用大量已标注的数据对预训练的AI模型进行进一步训练。这些数据包含了问题及其对应的正确答案,以及如何建立思考步骤的范例。靠着这些模仿人类思维的“例题”和“答案”,大模型得以提升推理能力。

DeepSeek-R1训练过程中的DeepSeek-R1-Zero路线则直接将强化学习(RL)应用于基础模型。他们的目标是探索大模型在没有任何监督数据的情况下,通过纯强化学习过程进行自我进化,从而获得推理能力。

团队建立了两条最简单的奖励规则。一条是准确性奖励,对了加分错了减分。另一条是格式要求,模型要把思考过程写在标签之间,类似于考试中我们必须把答案写在答题框里。不靠“例题”,只让AI这个“学生”以自己的方式学会做推理。

从基准测试的成绩看,DeepSeek-R1-Zero 无需任何监督微调数据即可获得强大的推理能力。在AIME 2024基准测试里,使用多数投票机制时的DeepSeek-R1-Zero达到86.7%准确率,高过OpenAI o1。

在训练OpenAI o1这个级别的推理模型这个任务上,DeepSeek-R1是首个直接强化学习证明这一方法有效的模型。

艾伦人工智能研究所(Allen Institute for AI)的研究科学家内森·兰伯特(Nathan Lambert)在社交媒体上表示,R1的论文“是推理模型研究不确定性中的一个重要转折点”,因为“到目前为止,推理模型一直是工业研究的一个重要领域,但缺乏一篇具有开创性的论文[5]。”

中山大学集成电路学院助理教授王美琪解释称,直接强化学习方法与 DeepSeek 团队在多版模型迭代中的一系列工程优化技术(如简化奖惩模型设计等)相结合,有效降低了大模型的训练成本。直接强化学习避免了大量人工标注数据的工作,而奖惩模型的简化设计等则减少了对计算资源的需求。

DeepSeek-R1 的成果显示,大规模运用直接强化学习,而非依赖大模型经典训练范式(如采用预设思维链模版和监督微调)是可行的。这为大模型训练提供了更高效的思路,有望启发更多研究人员和工程师沿着这一方向进行复现与探索。DeepSeek 还开源模型并提供了详细技术报告,也有助于他人快速验证和拓展该方法。

“从核心原理上来讲,DeepSeek的大部分训练技巧在AI发展过程中都有迹可循,但其所揭示的直接强化学习的巨大潜力,以及训练过程中自反思和探索行为的涌现,对大模型高效训练乃至人类学习模式的探索都有很大启发意义。”王美琪说。

03

这个大模型能为中国的AI行业带来什么?

对于DeepSeek,《自然》杂志指出:尽管美国出口管制限制中国公司获得为人工智能处理而设计的最佳计算机芯片,但它还是成功制造了(DeepSeek的)R1。

在硅谷,人们将这个节省算力的中国大模型称作“来自东方的神秘力量”,从《纽约时报》到《连线》、《福布斯》几乎所有的媒体都在说:美国对先进半导体的出口管制旨在减缓中国人工智能的发展,但这可能无意中刺激了创新。”

那么,这样一个节省算力的大模型会成为中国针对AI芯片禁运的解法吗?

一位人工智能领域的专家告诉《知识分子》:最终,“还是需要把芯片搞上去。”

算力困境仍在,然而,这样一个极度节省算力的大模型的出现仍然给中国的大模型们带来了新的希望——除了算力,我们可以依靠的还有优化。正如《自然》杂志上引用的华盛顿西雅图的人工智能研究员 François Chollet 的评价:“这一事实表明,高效利用资源比单纯的计算规模更重要。”

《福布斯》则指出,它让世界认识到,“中国并未退出这场(人工智能的)竞赛。”

这个来自中国的大模型让人们看到了从构架、算法上进行优化的潜力,几乎是以一己之力扭转了全球大模型领域对算力的疯狂追逐,为无数的小公司带来了新的机会。

《自然》杂志说,DeepSeek的V3训练时只花了不到600万美元,而Meta训练其最新人工智能模型Llama 3.1 405B时所耗资金超过6000万,《纽约时报》说:“有600万美元资金的公司在数量上远远多于有1亿美元或10亿美元资金的公司”。

效率之外,DeepSeek另一个常被夸赞的亮点是开源。Reddit上,人们赞叹DeepSeek“开源、而且可以本地运行”,“我一定要下载一个到我的电脑上”。

开源,这意味着这个模型的研发者将不仅只与自己的同事合作,他们“其实在与世界各地最优秀的同行合作”,《纽约时报》说,“如果最好的开源技术来自中国,美国开发人员将在这些技术的基础上构建他们的系统。从长远来看,这可能会让中国成为研发人工智能的中心。”

当然,引领整个生态,那是遥远的未来,开源,更为直接的,肉眼可见的一个影响是:“一个开源又好用的AI,它会迅速占领学术界的”,前述人工智能相关专家告诉《知识分子》。

参考文献:

;1]Nature Publishing Group. (2025). China’s cheap, open AI model DeepSeek thrills scientists. Nature.

[2]Jiang, B. (2025, January 13). Meet DeepSeek: the Chinese start-up that is changing how AI models are trained. South China Morning Post.

[3]Field, H. (2025, January 23). Scale AI CEO says China has quickly caught the U.S. with the DeepSeek open-source model. CNBC.

[4]Nature Publishing Group. (2025b). China’s cheap, open AI model DeepSeek thrills scientists. Nature.

[5]Chowdhury, H. (2025, January 22). A Chinese startup just showed every American tech company how quickly it’s catching up in AI. Business Insider.

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
大家都难了吗?网传胖东来要降薪,成本会计3600工资竟来23人面试

大家都难了吗?网传胖东来要降薪,成本会计3600工资竟来23人面试

慧翔百科
2026-06-12 08:39:57
绝境两场轰81+26+18!FMVP榜单第一也被他绝杀!个人统治力的极限

绝境两场轰81+26+18!FMVP榜单第一也被他绝杀!个人统治力的极限

阿浪的篮球故事
2026-06-12 16:05:06
全场完成四次扑救,曼联旧将科瓦日世界杯首秀表现亮眼

全场完成四次扑救,曼联旧将科瓦日世界杯首秀表现亮眼

懂球帝
2026-06-12 14:30:34
陈竞任长沙市委书记

陈竞任长沙市委书记

大风新闻
2026-06-12 16:37:20
布伦特原油跌幅扩大至4%

布伦特原油跌幅扩大至4%

财联社
2026-06-12 16:13:04
为什么女性会有比男性更高的性快感,从进化论的角度分析?

为什么女性会有比男性更高的性快感,从进化论的角度分析?

宇宙时空
2026-05-29 18:00:14
中国电车产业将来最大敌人,可能不是特斯拉,而是看似掉队的他!

中国电车产业将来最大敌人,可能不是特斯拉,而是看似掉队的他!

蜉蝣说
2026-06-11 10:12:46
两油直线跳水,跌5%

两油直线跳水,跌5%

财闻
2026-06-12 16:34:04
别把灵活就业说得那么高大上,说白了就是下个月饭钱在哪都不知道

别把灵活就业说得那么高大上,说白了就是下个月饭钱在哪都不知道

今朝牛马
2026-06-12 17:50:36
特朗普警告内塔尼亚胡:再不接受停火,以色列将独自面对伊朗!

特朗普警告内塔尼亚胡:再不接受停火,以色列将独自面对伊朗!

阿龙聊军事
2026-06-09 15:05:11
曹云金能联系,李菁能打招呼,何云伟却被于谦冷处理,老江湖的尺子太狠了

曹云金能联系,李菁能打招呼,何云伟却被于谦冷处理,老江湖的尺子太狠了

科学发掘
2026-06-13 00:21:48
情商很高,但又不喜欢社交的三大星座,太过清醒,从不庸碌的活着

情商很高,但又不喜欢社交的三大星座,太过清醒,从不庸碌的活着

知书夜话
2026-06-12 04:48:17
央视首播,40集刑侦大剧来袭!真实案件改编,实力派阵容,要爆

央视首播,40集刑侦大剧来袭!真实案件改编,实力派阵容,要爆

动物奇奇怪怪
2026-06-11 13:02:38
在荷兰上班的华人感慨:不要信媒体,荷兰已经相当于我国二线城市

在荷兰上班的华人感慨:不要信媒体,荷兰已经相当于我国二线城市

九分看世界
2026-06-11 17:57:35
英国少年被刺死,引爆全球反印潮,为何新加坡第一个跳出来护短?

英国少年被刺死,引爆全球反印潮,为何新加坡第一个跳出来护短?

52赫兹实验室
2026-06-11 17:13:50
何猷君儿女正脸照曝光!儿子高度遗传奚梦瑶身高长相,女儿像四太

何猷君儿女正脸照曝光!儿子高度遗传奚梦瑶身高长相,女儿像四太

飘逸的云朵
2026-06-12 15:10:16
曼城要塌了!利物浦 + 曼联 + 阿森纳集体索赔,每家要拿 1 亿

曼城要塌了!利物浦 + 曼联 + 阿森纳集体索赔,每家要拿 1 亿

奶盖熊本熊
2026-06-12 01:55:10
幸存的戴笠专机飞行员回忆:飞机没问题,坠机原因当时不允许说

幸存的戴笠专机飞行员回忆:飞机没问题,坠机原因当时不允许说

史之铭
2026-06-12 12:43:25
利好来了!霍尔木兹海峡开放大消息,石油直线暴跌,全球股市拉升!

利好来了!霍尔木兹海峡开放大消息,石油直线暴跌,全球股市拉升!

中国基金报
2026-06-12 19:46:45
沉默45年,中国第二轮"严打"终于来了!目标改变总体战正式打响

沉默45年,中国第二轮"严打"终于来了!目标改变总体战正式打响

荐史
2026-05-03 13:48:04
2026-06-13 02:00:49
知识分子 incentive-icons
知识分子
关注科学、人文、思想
677文章数 1110关注度
往期回顾 全部

科技要闻

刚刚,人类历史上首位万亿美元富豪诞生!

头条要闻

美加墨世界杯第二场比赛就现空座 英媒:尴尬

头条要闻

美加墨世界杯第二场比赛就现空座 英媒:尴尬

体育要闻

欧洲恐韩?肉德维德?

娱乐要闻

一天4个瓜,肖战热巴最意外

财经要闻

万亿美元顺差背后,透露这些信号

汽车要闻

标配激光雷达/双动力可选 昊铂S600限时售17.99万起

态度原创

房产
手机
数码
亲子
公开课

房产要闻

海南最赚钱行业曝光!最快4年半,海口全款买三房!

手机要闻

vivo X Fold6再预热:天玑9500超能版+OriginOS 6 Fold

数码要闻

英国监管机构警告:亚马逊、eBay仍在售可能致命的假冒手机充电器

亲子要闻

给孩子报个幼儿园还要工资流水?难道这就是传说中的“因财施教”

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版