网易首页 > 网易号 > 正文 申请入驻

梁文锋登《自然》封面,曝DeepSeek增量训练成本仅29.4万美元!

0
分享至



文 / 汪淼

美编 / 顾青青

出品 / 网界

中国团队登上了《自然》封面。

9月18日,由DeepSeek团队研发、梁文锋担任通讯作者的DeepSeek-R1推理模型研究论文登上《自然》封面。

但比“登刊”更狠的是,他们干脆自曝家底,DeepSeek-R1的增量训练成本,只要29.4万美元



要知道,过去OpenAI、谷歌练个大模型,动不动烧掉几千万美元。而DeepSeek只用512张英伟达H800显卡、耗时80小时,就完成了核心训练。这笔账,相当于用买一辆跑车的钱,干出了别人盖工厂的活。

更关键的是,《自然》亲自下场盖章,在评论报道文章中用了“里程碑式论文揭示DeepSeekAI模型的秘密”、“创造历史”等词汇表达了对DeepSeek赞赏和肯定。这几乎是在打脸整个行业长期以来的“黑箱操作”。

01

29.4万美元背后

当DeepSeek在论文里写下“29.4万美元”这个数字时,很多人第一反应是:是不是少写了个零?

但数据是实的:512张H800显卡、80小时训练、每GPU小时租赁价2美元。而且,这还只是增量成本,是指在已经花掉600万美元开发的基座模型(DeepSeek-V3Base)之上,做强化学习的开销。

为什么这么便宜? 关键是他们用了“纯强化学习”框架(GRPO)。简单说,就是只告诉模型“答案对不对”,而不教它“步骤该怎么写”。模型自己琢磨怎么解题,答对了给奖励,答错了就调整。这种“放养式训练”反而逼出了它的推理能力。



但便宜也引来质疑。年初就有人猜:是不是偷偷用了OpenAI的GPT-4生成数据来做蒸馏? 否则怎么可能这么低成本达到高性能?

这次《自然》论文里,DeepSeek直接回应:训练数据全来自普通网页和电子书,虽然网上可能混了GPT-4生成的内容,但“绝非故意加入”。他们还补充了去污染流程,光数学题就删了600万条可能泄露测试答案的数据。

02

《自然》为什么破例?

AI论文登《自然》不稀奇,但AlphaGo、AlphaFold都是首发。而DeepSeek-R1的论文1月就发在arXiv上,现在却还能上封面,《自然》甚至为它配发社论,这几乎是从未有过的待遇。

原因很简单:它是第一个愿意被“扒光”的大模型。8位评审专家提了上百个问题,从“数据是否污染”到“推理步骤是不是瞎编的”,甚至抠到单词单复数用法。DeepSeek团队写了64页回复,几乎等于重写半篇论文。



比如评审问:“你说模型开源了,但‘开源’定义模糊,到底开了多少?”团队立刻补上数据链接和授权细节。

还有人担心:“模型会不会为了拿奖励乱写步骤?” 他们马上加实验证明“步骤与答案的一致性”。

这种透明,戳中了AI行业的痛点。过去大模型厂商总说自己“遥遥领先”,但测试数据不公开、训练方法遮遮掩掩。《自然》社论说得直接:AI宣传未经证实,可能对社会带来真实风险。

而DeepSeek把代码、数据、训练日志全摊开,等于告诉行业:以后想让人信你,先学我“晒数据”。

03

国产AI芯片的机会来了?

29.4万美元的成本,不仅打了欧美巨头的脸,还可能给国产芯片撕开一道口子。DeepSeek在论文里没提任何芯片公司,但明眼人都能算账:如果训练成本降到原来的十分之一,那是不是用性价比更高的国产芯片也能跑?

华为昇腾、寒武纪这些企业一直被卡在“生态不足”上,客户嫌性能不够稳,不敢大规模用。但如果算法能优化到DeepSeek这个程度,硬件压力会小很多。



DeepSeek创始人梁文锋

事实上,华为和浙大最近已经联合发了基于昇腾芯片的DeepSeek-R1-Safe模型,虽然这是另一个项目,但证明了一件事:国产芯片能扛住千亿级大模型训练。

不过业内人也提醒:这还只是“可能”,不是“必然”。国产芯片真要接住这波机会,还得在软件生态和稳定性上下硬功夫。

总结

开放、透明才是AI的未来

DeepSeek这次登上《自然》封面,不只是一个人的成功,也不只是一个公司的成功。它代表中国AI行业真正走到了世界前沿。

DeepSeek也证明了三件事:第一,大模型不一定靠烧钱,算法优化能大幅降低成本;第二,AI行业不能再闭门吹牛,必须接受同行评审的检验;第三,中国团队有能力从技术追随者变成规则制定者。

但DeepSeek的价值不止于“被膜拜”,《人民日报》说得好:“它的最大价值是被超越。”

如果后续国产模型都能用更低成本、更透明的方式练出来,如果国产芯片能借此打开市场,如果AI研发从此告别“黑箱”走向开放,那今天这篇论文,才会真正变成中国AI的转折点。

毕竟,梁文锋自己说过:“中国AI不能永远做跟随者。”现在,他们真的走到了前沿。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
特朗普不见高市,美军也撤了,解放军面朝日本,连续8天实弹演习

特朗普不见高市,美军也撤了,解放军面朝日本,连续8天实弹演习

时时有聊
2025-11-19 16:51:16
100米栏悲喜夜:3人打开13秒!吴艳妮第2夏思凝第4,广东名将夺冠

100米栏悲喜夜:3人打开13秒!吴艳妮第2夏思凝第4,广东名将夺冠

球场没跑道
2025-11-19 21:33:01
朝鲜代表联大发言炮轰日本:日本没有资格和理由觊觎安理会常任理事国席位;此前高市早苗在日本侵略战争、参拜靖国神社等问题上屡触碰红线

朝鲜代表联大发言炮轰日本:日本没有资格和理由觊觎安理会常任理事国席位;此前高市早苗在日本侵略战争、参拜靖国神社等问题上屡触碰红线

极目新闻
2025-11-19 13:18:23
国足受邀!俄罗斯将在美举办12国“小世界杯”:六大洲参赛

国足受邀!俄罗斯将在美举办12国“小世界杯”:六大洲参赛

邱泽云
2025-11-19 17:59:42
广东模特大赛冠军诞生后,我笑死在评论区

广东模特大赛冠军诞生后,我笑死在评论区

清书先生
2025-11-19 16:02:32
噩耗,广东美女陈俊玲去世,年仅33岁,入职体检时查出癌症

噩耗,广东美女陈俊玲去世,年仅33岁,入职体检时查出癌症

熠熠生辉的生活
2025-11-18 09:14:21
印共(毛主义)主要领导人被打死,印共(毛)是否到了穷途末路

印共(毛主义)主要领导人被打死,印共(毛)是否到了穷途末路

小院之观
2025-11-19 10:14:33
“漏X装”,火了!

“漏X装”,火了!

微微热评
2025-11-19 14:51:31
预算1.76亿的办公楼“未批先建”,市民质疑应罚10%,为啥只罚50万?律师说法

预算1.76亿的办公楼“未批先建”,市民质疑应罚10%,为啥只罚50万?律师说法

大风新闻
2025-11-19 16:31:04
喻恩泰和妻子婚内双出轨,聊天记录不堪入目,妻子约P喜欢大的

喻恩泰和妻子婚内双出轨,聊天记录不堪入目,妻子约P喜欢大的

社会酱
2025-11-19 17:42:35
10个月违法赚近9000万,最终被罚1.77亿!涉事人疑是DeepSeek创始人旗下公司核心员工

10个月违法赚近9000万,最终被罚1.77亿!涉事人疑是DeepSeek创始人旗下公司核心员工

可达鸭面面观
2025-11-19 08:59:19
遗憾!吴艳妮给自己打0分:跑出赛季最佳+只能拿第2 3战全运0金牌

遗憾!吴艳妮给自己打0分:跑出赛季最佳+只能拿第2 3战全运0金牌

风过乡
2025-11-19 22:05:53
日本炒作“击沉福建舰”,军事专家傅前哨:哪里来的底气?

日本炒作“击沉福建舰”,军事专家傅前哨:哪里来的底气?

南方都市报
2025-11-19 20:18:06
最担心的事情还是发生了,印度人疯狂涌入中国,未来会发生什么事

最担心的事情还是发生了,印度人疯狂涌入中国,未来会发生什么事

历史有些冷
2025-11-18 21:35:03
中组部:公职人员退休后未经批准经商(包括当律师)的,不再保留党政机关退休金等待遇

中组部:公职人员退休后未经批准经商(包括当律师)的,不再保留党政机关退休金等待遇

新浪财经
2025-11-18 12:46:38
出乎意料!继王曼昱后,陈梦也避开跟孙颖莎打比赛,放弃女单一号

出乎意料!继王曼昱后,陈梦也避开跟孙颖莎打比赛,放弃女单一号

侃球熊弟
2025-11-19 17:44:51
越来越多孩子得白血病?医生坦言:家里4样东西是祸根,趁早扔了

越来越多孩子得白血病?医生坦言:家里4样东西是祸根,趁早扔了

DrX说
2025-11-19 14:42:09
烟台一渣土车侧翻压死女老师,遇难者家属讲述: 学生纷纷悼念,肇事车经改装严重超载

烟台一渣土车侧翻压死女老师,遇难者家属讲述: 学生纷纷悼念,肇事车经改装严重超载

潇湘晨报
2025-11-19 20:32:25
沙俄让清朝损失的土地,面积达到330万平方公里,如今在哪些国家

沙俄让清朝损失的土地,面积达到330万平方公里,如今在哪些国家

兴趣知识
2025-11-17 15:39:26
我国古代4大旷世文章,一生必背的4篇千古奇文,谁能够排在第一?

我国古代4大旷世文章,一生必背的4篇千古奇文,谁能够排在第一?

掠影后有感
2025-11-18 11:14:38
2025-11-19 23:19:00
网界 incentive-icons
网界
科技互联网行业深度媒体。
223文章数 7关注度
往期回顾 全部

科技要闻

一夜封神,Gemini 3让谷歌找回“碾压感”

头条要闻

日媒:中方官员双手插兜 暗示"14亿中国人都很愤怒"

头条要闻

日媒:中方官员双手插兜 暗示"14亿中国人都很愤怒"

体育要闻

世界杯最小参赛国诞生!15万人岛国的奇迹

娱乐要闻

史林子出轨对方前妻放锤!

财经要闻

重磅!中金公司拟收购东兴与信达证券

汽车要闻

此刻价格不重要 第5代帝豪本身就是价值

态度原创

教育
健康
家居
数码
公开课

教育要闻

选对专业与学校,赢在起跑线:中国石油2025年招聘数据解密

警惕超声报告这六大"坑"

家居要闻

水岸美学 书香人文生活

数码要闻

华为擎云将发布鸿蒙电脑企业版及新一代鸿蒙电脑专为企业而生

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版