网易首页 > 网易号 > 正文 申请入驻

梁文峰在《自然》发表封面论文 DS成首个经过严格学术审查的大模型

0
分享至


中国杭州AI初创公司DeepSeek开发的R1模型近日在《自然》杂志发表了同行评议版本,成为首个经过严格学术审查的主要大语言模型。DeepSeek 创始人兼 CEO 梁文峰为该论文的通讯作者。《自然》杂志不但将该篇论文作为封面论文,还在评论报道文章中用里程碑式论文揭示 DeepSeek AI 模型的秘密


这一里程碑式事件不仅揭示了该公司如何以仅29.4万美元的训练成本创造出震撼全球AI产业的模型,更重要的是,它为整个人工智能行业树立了透明度和科学严谨性的新标准。

今年1月,当DeepSeek R1模型发布时,其卓越的推理能力和极低的开发成本瞬间引发全球科技股大幅下跌,纳斯达克指数单日暴跌超过3%,英伟达等AI龙头企业市值蒸发数千亿美元。如今,随着经过同行评议的正式论文发布,这家中国公司的技术路径得到了学术界的认可,同时也为其创新方法提供了更可靠的科学依据。


论文链接:

https://www.nature.com/articles/s41586-025-09422-z

突破性的强化学习方法改写AI训练范式

DeepSeek R1的核心创新在于采用了"纯强化学习"这一自动化试错方法。与传统依赖人工标注推理示例的训练方式不同,R1通过奖励模型达到正确答案的行为来学习推理策略,而非模仿人类预设的推理模式。这种方法使模型能够自主发展出诸如自我反思、验证和动态调整等高级推理能力。


俄亥俄州立大学AI研究员孙欢表示,DeepSeek的这一创新"在研究界极具影响力",并指出"2025年迄今为止几乎所有在大语言模型中进行强化学习的工作,都可能在某种程度上受到R1的启发"。

为提升效率,DeepSeek还采用了一种名为"群体相对策略优化"的技术,让模型自我评估尝试结果,而非依赖独立算法进行评分。这些技术创新使得R1不仅在推理任务上表现卓越,在成本控制方面也实现了突破。

根据《自然》杂志论文的补充材料首次披露,R1的训练成本仅为29.4万美元,加上构建基础模型的约600万美元,总投入远低于竞争对手动辄数千万美元的开发费用。更值得注意的是,DeepSeek主要使用英伟达H800芯片进行训练,这些芯片自2023年起被美国出口管制禁止向中国销售。

学术透明度开启AI发展新纪元

DeepSeek R1成为首个通过同行评议的主要大语言模型,这一先例在AI学术界引起广泛赞誉。机器学习工程师、论文评审员刘易斯·滕斯托尔称这是"非常值得欢迎的先例",强调"如果我们没有公开分享这一过程大部分内容的标准,就很难评估这些系统是否存在风险"。

在同行评议过程中,DeepSeek团队根据评审意见减少了对模型的拟人化描述,并增加了技术细节说明,包括模型训练数据类型和安全性考虑。这种严格的学术审查流程不仅验证了模型的有效性,也为其他AI公司树立了榜样。

论文发表后,DeepSeek明确否认了此前关于其使用OpenAI模型输出进行训练的指控。该公司在与评审员的交流中声明,R1并非通过复制其他大语言模型生成的推理示例来学习。虽然承认其基础模型像其他大语言模型一样在网络上训练,可能包含已存在的AI生成内容,但DeepSeek坚持其核心训练方法的原创性。

滕斯托尔表示,尽管无法百分之百确定R1未使用OpenAI示例进行训练,但其他实验室的复制尝试表明"DeepSeek的推理方法可能足够优秀,无需这样做"。他补充道:"现在的证据相当明确,仅使用纯强化学习就能获得极高性能。"

全球AI竞争格局的重新洗牌

DeepSeek的成功不仅仅是技术突破,更是对全球AI产业发展模式的深刻挑战。其开源策略使R1成为AI社区平台Hugging Face上最受欢迎的开放权重模型,下载量已达1090万次。这种开放模式与美国科技巨头的封闭生态系统形成鲜明对比,为全球AI研发提供了新的范式。

在科学任务完成挑战ScienceAgentBench中,R1虽然在准确性方面未居首位,但在平衡能力与成本方面表现出色,证明了其在实际应用中的竞争力。这一表现进一步证实了低成本高效能AI模型的可行性,对整个行业的资源配置策略产生深远影响。

目前,众多研究团队正尝试将DeepSeek的方法应用于改进现有大语言模型的推理能力,并将其扩展到数学和编程之外的其他领域。正如滕斯托尔所言,R1已经"启动了一场革命"。

DeepSeek的崛起标志着AI发展进入新阶段,其低成本高效能的技术路径、开源开放的发展理念,以及对学术透明度的坚持,正在重新定义人工智能产业的竞争规则。随着更多研究机构和企业开始关注并采用类似方法,全球AI技术发展有望迎来更加多元化和民主化的未来。这场由中国初创企业引发的技术革命,最终可能惠及全人类的科技进步。

阅读最新前沿科技趋势报告,请访问欧米伽研究所的“未来知识库”

https://wx.zsxq.com/group/454854145828


未来知识库是“ 欧米伽 未来研究所”建立的在线知识库平台,收藏的资料范围包括人工智能、脑科学、互联网、超级智能,数智大脑、能源、军事、经济、人类风险等等领域的前沿进展与未来趋势。目前拥有超过8000篇重要资料。每周更新不少于100篇世界范围最新研究资料。 欢迎扫描二维码或访问https://wx.zsxq.com/group/454854145828 进入。


特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
农村又要开始收费了!这次要交多少钱?12月31日前截止!新农合缴费一夜大改!新农合缴费新规执行...

农村又要开始收费了!这次要交多少钱?12月31日前截止!新农合缴费一夜大改!新农合缴费新规执行...

新浪财经
2025-09-19 04:49:57
包养10位情妇,睡觉翻牌生下11个私生子,75岁还在拼命生娃!

包养10位情妇,睡觉翻牌生下11个私生子,75岁还在拼命生娃!

削桐作琴
2025-09-08 15:05:36
买牛肉,聪明人专挑这3个部位,全是肉中精华,香味十足,还不贵

买牛肉,聪明人专挑这3个部位,全是肉中精华,香味十足,还不贵

简食记工作号
2025-09-19 00:21:53
中国偏偏不让出港口,19国军队堵门,导弹都架好了,倒逼中方让步

中国偏偏不让出港口,19国军队堵门,导弹都架好了,倒逼中方让步

一个有灵魂的作者
2025-07-26 08:38:25
生态环境部发布会上提到广东这条河,督察助力黑臭河变生态河

生态环境部发布会上提到广东这条河,督察助力黑臭河变生态河

南方都市报
2025-09-19 14:53:14
天津女排震撼土耳其!3-1击溃欧冠级强队,下一场恐再无李盈莹?

天津女排震撼土耳其!3-1击溃欧冠级强队,下一场恐再无李盈莹?

深析古今
2025-09-19 13:57:17
48:47,美国投票结果出炉,特朗普收到噩耗,他要支付351亿巨款

48:47,美国投票结果出炉,特朗普收到噩耗,他要支付351亿巨款

标体
2025-09-18 18:35:12
武大郎用生命告诫,没钱别玩高配;西门庆用生命告诫,有钱也不能乱来;潘金莲告诉我们……

武大郎用生命告诫,没钱别玩高配;西门庆用生命告诫,有钱也不能乱来;潘金莲告诉我们……

诗词世界
2025-09-19 06:05:51
西贝都道歉了,多名大V依旧力挺,杨毅:老百姓不接受你可以不吃

西贝都道歉了,多名大V依旧力挺,杨毅:老百姓不接受你可以不吃

温读史
2025-09-19 16:03:24
9.7亿,上海建工、中建六局、上海园林、中建科工中标上海项目

9.7亿,上海建工、中建六局、上海园林、中建科工中标上海项目

蓝天白云1111
2025-09-19 13:18:54
仅一小时,好评如潮!连追2集后,我敢打包票:这古装大剧必爆

仅一小时,好评如潮!连追2集后,我敢打包票:这古装大剧必爆

崽下愚乐圈
2025-09-19 18:09:03
一天袭击3个俄罗斯炼油厂,击中大型化工厂!美媒为乌克兰出主意

一天袭击3个俄罗斯炼油厂,击中大型化工厂!美媒为乌克兰出主意

鹰眼Defence
2025-09-19 16:05:27
为何夫妻不送葬?老祖宗揭示:背后蕴含着5个人生智慧!

为何夫妻不送葬?老祖宗揭示:背后蕴含着5个人生智慧!

千秋文化
2025-09-15 11:23:18
太心疼!上海籍运动员遭疯狂网暴,3人被采取刑事强制措施!竞技场不是暴力场

太心疼!上海籍运动员遭疯狂网暴,3人被采取刑事强制措施!竞技场不是暴力场

新民晚报
2025-09-18 21:10:48
驱逐舰单挑航母时代来了!055搭载双高超弹,1000公里外毁灭敌舰

驱逐舰单挑航母时代来了!055搭载双高超弹,1000公里外毁灭敌舰

军武吐槽君
2025-08-30 01:13:56
央视直播一场英超,曼联冲向降级区,阿森纳结束魔鬼赛程

央视直播一场英超,曼联冲向降级区,阿森纳结束魔鬼赛程

嗨皮看球
2025-09-19 18:17:18
日本房价崩盘回忆:当年那些选择“不买房”的人,后来都怎么样了

日本房价崩盘回忆:当年那些选择“不买房”的人,后来都怎么样了

揽星河的笔记
2025-09-17 19:45:54
西尔斯基完全懵了,乌军投降上校变成俄罗斯中将:对乌军瓮中捉鳖

西尔斯基完全懵了,乌军投降上校变成俄罗斯中将:对乌军瓮中捉鳖

凉羽亭
2025-09-19 16:13:57
中国的这次阳谋,把以色列给彻底整不会了,就连美国都想拜师学艺

中国的这次阳谋,把以色列给彻底整不会了,就连美国都想拜师学艺

小lu侃侃而谈
2025-09-16 19:20:38
美国就算一动不动,中国20年也追不上?九三阅兵后,局势已被改写

美国就算一动不动,中国20年也追不上?九三阅兵后,局势已被改写

书中自有颜如玉
2025-09-10 10:41:55
2025-09-19 19:12:49
人工智能学家 incentive-icons
人工智能学家
人工智能领域权威媒体
4197文章数 37277关注度
往期回顾 全部

科技要闻

直击iPhone 17开售:消费者偏爱银色橙色

头条要闻

女子误踩氢氟酸身亡 专家回应"为何遗弃10年仍致命"

头条要闻

女子误踩氢氟酸身亡 专家回应"为何遗弃10年仍致命"

体育要闻

从轮椅到铜牌 他熬了7年:下个目标唱国歌!

娱乐要闻

全智贤被全面抵制!相关代言评论区沦陷

财经要闻

"矿霸"填埋万吨危废 当地政府成立调查组

汽车要闻

对话周光:一个技术理想主义者的“蜕变”

态度原创

教育
旅游
数码
公开课
军事航空

教育要闻

新航道寒假研学来了:插班世界名校、联合国认证,这届冬令营太顶了!

旅游要闻

热闻|清明假期将至,热门目的地有哪些?

数码要闻

技术颠覆者的答卷:TCL SQD-Mini LED如何重构电视画质天花板

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

卫星图像显示以军坦克集结加沙城周围

无障碍浏览 进入关怀版