网易首页 > 网易号 > 正文 申请入驻

DeepSeek,打破历史!中国AI的“Nature时刻”

0
分享至

中国大模型,首登Nature封面。

9月17日,在最新一期的国际权威期刊Nature(自然)中,DeepSeek-R1推理模型研究论文登上了封面。该论文由DeepSeek团队共同完成,梁文锋担任通讯作者,首次公开了仅靠强化学习就能激发大模型推理能力的重要研究成果。这是中国大模型研究首次登上Nature封面,也是全球首个经过完整同行评审并发表于权威期刊的主流大语言模型研究,标志着中国AI技术在国际科学界获得最高认可。

Nature在其社论中评价道:“几乎所有主流的大模型都还没有经过独立同行评审,这一空白终于被DeepSeek打破。”

中国AI大模型的“Nature时刻”

自大模型浪潮席卷全球以来,技术发布、性能榜单层出不穷,但始终缺乏一个权威的“科学认证”机制。OpenAI、谷歌等巨头虽屡有突破,但其核心技术多以技术报告形式发布,未经独立同行评审。

DeepSeek以其公开性和透明性打破了这一局面。DeepSeek-R1模型的研究论文最早于今年年初发布在预印本平台arXiv上。自今年2月14日向Nature投递论文至今,历经半年,8位外部专家参与了同行评审,DeepSeek-R1推理模型研究论文终获发表,完成了从预印本到Nature封面的“学术跃迁”。审稿人不仅关注模型性能,更对数据来源、训练方法、安全性等提出严格质询,这一过程是AI模型迈向更高的透明度和可重复性的可喜一步。

因此,Nature也对DeepSeek的开放模式给予高度评价,在其社论中评价道:“几乎所有主流的大模型都还没有经过独立同行评审,这一空白终于被DeepSeek打破。”全球知名开源社区Hugging Face机器学习工程师Lewis Tunstall也是DeepSeek论文的审稿人之一,他强调:“这是一个备受欢迎的先例。如果缺乏这种公开分享大部分研发过程的行业规范,我们将很难评估这些系统的潜在风险。”

据了解,DeepSeek本次在Nature上发表的论文较今年年初的初版论文有较大的改动,全文64页,不仅首次披露了R1的训练成本,而且透露了更多模型训练的技术细节,包括对发布初期外界有关“蒸馏”方法的质疑作出了正面回应,提供了训练过程中减轻数据污染的详细流程,并对R1的安全性进行了全面评估。

其中,在训练成本方面,R1-Zero和R1都使用了512张H800GPU,分别训练了198个小时和80个小时,以H800每GPU小时2美元的租赁价格换算,R1的总训练成本为29.4万美元(约合人民币209万元)。不到30万美元的训练成本,与其他推理模型动辄上千万美元的花费相比,可谓实现了极大的降本。

关于R1发布最初时所受到的“蒸馏”质疑,DeepSeek介绍,其使用的数据全部来自互联网,虽然可能包含GPT-4生成的结果,但并非有意而为之,更没有专门的蒸馏环节。所谓“蒸馏”,简单理解就是用预先训练好的复杂模型输出的结果,作为监督信号再去训练另外一个模型。R1发布时,OpenAI称它发现DeepSeek使用了OpenAI专有模型来训练自己的开源模型的证据,但拒绝进一步透露其证据的细节。

R2何时问世引发关注

自今年年初发布R1以来,DeepSeek在全球树立了开源模型的典范,但过去数月,外界对于R2何时发布始终保持高度关注,相关传言一直不断。不过,R2的发布时间一再推迟,外界分析R2研发进程缓慢可能与算力受限有关。

值得注意的是,今年8月21日,DeepSeek正式发布DeepSeek-V3.1,称其为“迈向Agent(智能体)时代的第一步”。据DeepSeek介绍,V3.1主要包含三大变化:一是采用混合推理架构,一个模型同时支持思考模式与非思考模式;二是具有更高的思考效率,能在更短时间内给出答案;三是具有更强的智能体能力,通过后训练优化,新模型在工具使用与智能体任务中的表现有较大提升。

由于R1的基座模型为V3,V3.1的升级也引发了外界对于R2“在路上”的猜测。V3.1的升级更深刻的意义在于,DeepSeek强调DeepSeek-V3.1使用了UE8M0 FP8 Scale的参数精度,而UE8M0 FP8是针对即将发布的下一代国产芯片设计。这也表明未来基于DeepSeek模型的训练与推理有望更多应用国产AI芯片,助力国产算力生态加速建设。这一表态一度带动国产芯片算力股股价飙升。

中国银河证券研报指出,DeepSeek从V3版本就开始采用FP8参数精度验证了其训练的有效性,通过降低算力精度,使国产ASIC芯片能在成熟制程(12-28nm)上接近先进制程英伟达GPU的算力精度,DeepSeek-V3.1使用UE8M0 FP8 Scale参数精度,让软件去主动拥抱硬件更喜欢的数据格式,“软硬协同”的生态技术壁垒逐渐成为AI浪潮下新范式,未来国产大模型将更多拥抱FP8算力精度并有望成为一种新技术趋势,通过软硬件的协同换取数量级性能的提升,国产算力芯片将迎来变革。

责编:万健祎

校对:王朝全

版权声明

" Type="normal"@@-->

证券时报各平台所有原创内容,未经书面授权,任何单位及个人不得转载。我社保留追究相关行为主体法律责任的权利。

转载与合作可联系证券时报小助理,微信ID:SecuritiesTimes

" Type="normal"@@-->

END

" Type="normal"@@-->

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
票数大幅领先,国民党新主席已定?张亚中通告全岛,两岸是一家人

票数大幅领先,国民党新主席已定?张亚中通告全岛,两岸是一家人

文史风云
2025-09-19 23:52:12
我妈的闺蜜终生不婚,每周都来我家吃几顿饭,有一天我爸说漏了嘴

我妈的闺蜜终生不婚,每周都来我家吃几顿饭,有一天我爸说漏了嘴

黑猫故事所
2025-09-19 20:42:16
太心酸!9月MPV再迎大降价,最高让利36%,国产车成降价主力军!

太心酸!9月MPV再迎大降价,最高让利36%,国产车成降价主力军!

小怪吃美食
2025-09-20 00:23:57
浙江省公安厅党委专职副书记王建已任省委巡视组组长

浙江省公安厅党委专职副书记王建已任省委巡视组组长

澎湃新闻
2025-09-19 21:48:27
已经没人敢跟他拼价格了!开“穷鬼超市”,湖南老板一年卖500亿

已经没人敢跟他拼价格了!开“穷鬼超市”,湖南老板一年卖500亿

毒sir财经
2025-09-18 16:21:12
短短7天!金发科技市值突破620亿!宇树科技将上市,金发会突破1000亿?

短短7天!金发科技市值突破620亿!宇树科技将上市,金发会突破1000亿?

新浪财经
2025-09-19 17:22:23
“巨无霸”台风即将生成!中到大雨影响江苏!

“巨无霸”台风即将生成!中到大雨影响江苏!

最江阴
2025-09-20 00:10:48
“嘎子”谢孟伟快手账号被封,电影出品人:不再让他出演,已拍戏份换人重拍;曾有人穿假警服行骗被判刑

“嘎子”谢孟伟快手账号被封,电影出品人:不再让他出演,已拍戏份换人重拍;曾有人穿假警服行骗被判刑

极目新闻
2025-09-18 16:25:51
“小兵张嘎”谢孟伟被捕!目无法纪,坑蒙老百姓,道歉竟甩锅网友

“小兵张嘎”谢孟伟被捕!目无法纪,坑蒙老百姓,道歉竟甩锅网友

有范又有料
2025-09-18 09:54:50
宋伊人合租室友被扒,本人连夜删除上万条评论,疑已出国!

宋伊人合租室友被扒,本人连夜删除上万条评论,疑已出国!

古希腊掌管月桂的神
2025-09-17 09:23:42
10点,杨翰森NBA首秀,格林将亲自“调教”,开拓者能击败勇士?

10点,杨翰森NBA首秀,格林将亲自“调教”,开拓者能击败勇士?

体育新角度
2025-09-19 20:39:40
14:1碾压性优势,关键时刻被美国一票否决,中国对特朗普彻底失望

14:1碾压性优势,关键时刻被美国一票否决,中国对特朗普彻底失望

辉辉历史记
2025-09-20 01:14:25
转告父母:服用“他汀药”期间,不要碰这4物,建议放心上

转告父母:服用“他汀药”期间,不要碰这4物,建议放心上

泠泠说史
2025-09-19 13:56:30
云海肴创始人赵晗离世:仅40岁、妻子是其人大校友,2个月前被罚

云海肴创始人赵晗离世:仅40岁、妻子是其人大校友,2个月前被罚

温柔看世界
2025-09-19 16:45:22
重庆武隆赵云山网红悬崖栈道被永久性封闭 官方:本就禁入且存多重风险

重庆武隆赵云山网红悬崖栈道被永久性封闭 官方:本就禁入且存多重风险

冬天来旅游
2025-09-19 00:46:17
穆里尼奥:我离开费内巴切第2天,他们就签了5名球员

穆里尼奥:我离开费内巴切第2天,他们就签了5名球员

懂球帝
2025-09-19 10:14:41
没了退路的内塔尼亚胡,带领一千万以色列人,公然冒天下之大不韪

没了退路的内塔尼亚胡,带领一千万以色列人,公然冒天下之大不韪

梁讯
2025-09-17 09:15:36
盲人带导盲犬爬泰山,狗全程痛苦还被打,基地回应黑料被扒惹众怒

盲人带导盲犬爬泰山,狗全程痛苦还被打,基地回应黑料被扒惹众怒

寒士之言本尊
2025-09-18 17:22:28
严惩不贷!30年老店,老板竟放毒!四川某知名“毒凉糕”,已逮捕

严惩不贷!30年老店,老板竟放毒!四川某知名“毒凉糕”,已逮捕

毛起吃
2025-09-19 08:29:47
特朗普试图收回阿富汗空军基地,称“那里离中国造核导弹的地方近”,外交部:在地区渲染紧张、制造对抗不得人心

特朗普试图收回阿富汗空军基地,称“那里离中国造核导弹的地方近”,外交部:在地区渲染紧张、制造对抗不得人心

每日经济新闻
2025-09-19 19:44:21
2025-09-20 03:39:00
证券时报 incentive-icons
证券时报
运营主体:深圳证券时报社有限公司
799915文章数 238162关注度
往期回顾 全部

科技要闻

直击iPhone 17开售:消费者偏爱银色橙色

头条要闻

山东入室被抢男婴到15岁没见过汽车 养家从不让他出门

头条要闻

山东入室被抢男婴到15岁没见过汽车 养家从不让他出门

体育要闻

从轮椅到铜牌 他熬了7年:下个目标唱国歌!

娱乐要闻

全智贤被全面抵制!相关代言评论区沦陷

财经要闻

习近平同美国总统特朗普通电话

汽车要闻

对话周光:一个技术理想主义者的“蜕变”

态度原创

手机
旅游
数码
家居
公开课

手机要闻

小米 17 Pro 系列手机用上 L 型电池,背屏斥资 10 个亿打造

旅游要闻

热闻|清明假期将至,热门目的地有哪些?

数码要闻

750万小米空调升级10年免费包修:为用户节省15亿元

家居要闻

公共艺术 限时体验打造

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版