网易首页 > 网易号 > 正文 申请入驻

梁文峰在《自然》发表封面论文 DS成首个经过严格学术审查的大模型

0
分享至

中国杭州AI初创公司DeepSeek开发的R1模型近日在《自然》杂志发表了同行评议版本,成为首个经过严格学术审查的主要大语言模型。DeepSeek 创始人兼 CEO 梁文峰为该论文的通讯作者。《自然》杂志不但将该篇论文作为封面论文,还在评论报道文章中用里程碑式论文揭示 DeepSeek AI 模型的秘密

这一里程碑式事件不仅揭示了该公司如何以仅29.4万美元的训练成本创造出震撼全球AI产业的模型,更重要的是,它为整个人工智能行业树立了透明度和科学严谨性的新标准。

今年1月,当DeepSeek R1模型发布时,其卓越的推理能力和极低的开发成本瞬间引发全球科技股大幅下跌,纳斯达克指数单日暴跌超过3%,英伟达等AI龙头企业市值蒸发数千亿美元。如今,随着经过同行评议的正式论文发布,这家中国公司的技术路径得到了学术界的认可,同时也为其创新方法提供了更可靠的科学依据。

论文链接:

https://www.nature.com/articles/s41586-025-09422-z

突破性的强化学习方法改写AI训练范式

DeepSeek R1的核心创新在于采用了"纯强化学习"这一自动化试错方法。与传统依赖人工标注推理示例的训练方式不同,R1通过奖励模型达到正确答案的行为来学习推理策略,而非模仿人类预设的推理模式。这种方法使模型能够自主发展出诸如自我反思、验证和动态调整等高级推理能力。

俄亥俄州立大学AI研究员孙欢表示,DeepSeek的这一创新"在研究界极具影响力",并指出"2025年迄今为止几乎所有在大语言模型中进行强化学习的工作,都可能在某种程度上受到R1的启发"。

为提升效率,DeepSeek还采用了一种名为"群体相对策略优化"的技术,让模型自我评估尝试结果,而非依赖独立算法进行评分。这些技术创新使得R1不仅在推理任务上表现卓越,在成本控制方面也实现了突破。

根据《自然》杂志论文的补充材料首次披露,R1的训练成本仅为29.4万美元,加上构建基础模型的约600万美元,总投入远低于竞争对手动辄数千万美元的开发费用。更值得注意的是,DeepSeek主要使用英伟达H800芯片进行训练,这些芯片自2023年起被美国出口管制禁止向中国销售。

学术透明度开启AI发展新纪元

DeepSeek R1成为首个通过同行评议的主要大语言模型,这一先例在AI学术界引起广泛赞誉。机器学习工程师、论文评审员刘易斯·滕斯托尔称这是"非常值得欢迎的先例",强调"如果我们没有公开分享这一过程大部分内容的标准,就很难评估这些系统是否存在风险"。

在同行评议过程中,DeepSeek团队根据评审意见减少了对模型的拟人化描述,并增加了技术细节说明,包括模型训练数据类型和安全性考虑。这种严格的学术审查流程不仅验证了模型的有效性,也为其他AI公司树立了榜样。

论文发表后,DeepSeek明确否认了此前关于其使用OpenAI模型输出进行训练的指控。该公司在与评审员的交流中声明,R1并非通过复制其他大语言模型生成的推理示例来学习。虽然承认其基础模型像其他大语言模型一样在网络上训练,可能包含已存在的AI生成内容,但DeepSeek坚持其核心训练方法的原创性。

滕斯托尔表示,尽管无法百分之百确定R1未使用OpenAI示例进行训练,但其他实验室的复制尝试表明"DeepSeek的推理方法可能足够优秀,无需这样做"。他补充道:"现在的证据相当明确,仅使用纯强化学习就能获得极高性能。"

全球AI竞争格局的重新洗牌

DeepSeek的成功不仅仅是技术突破,更是对全球AI产业发展模式的深刻挑战。其开源策略使R1成为AI社区平台Hugging Face上最受欢迎的开放权重模型,下载量已达1090万次。这种开放模式与美国科技巨头的封闭生态系统形成鲜明对比,为全球AI研发提供了新的范式。

在科学任务完成挑战ScienceAgentBench中,R1虽然在准确性方面未居首位,但在平衡能力与成本方面表现出色,证明了其在实际应用中的竞争力。这一表现进一步证实了低成本高效能AI模型的可行性,对整个行业的资源配置策略产生深远影响。

目前,众多研究团队正尝试将DeepSeek的方法应用于改进现有大语言模型的推理能力,并将其扩展到数学和编程之外的其他领域。正如滕斯托尔所言,R1已经"启动了一场革命"。

DeepSeek的崛起标志着AI发展进入新阶段,其低成本高效能的技术路径、开源开放的发展理念,以及对学术透明度的坚持,正在重新定义人工智能产业的竞争规则。随着更多研究机构和企业开始关注并采用类似方法,全球AI技术发展有望迎来更加多元化和民主化的未来。这场由中国初创企业引发的技术革命,最终可能惠及全人类的科技进步。

阅读最新前沿科技趋势报告,请访问欧米伽研究所的“未来知识库”

https://wx.zsxq.com/group/454854145828

未来知识库是“ 欧米伽 未来研究所”建立的在线知识库平台,收藏的资料范围包括人工智能、脑科学、互联网、超级智能,数智大脑、能源、军事、经济、人类风险等等领域的前沿进展与未来趋势。目前拥有超过8000篇重要资料。每周更新不少于100篇世界范围最新研究资料。 欢迎扫描二维码或访问https://wx.zsxq.com/group/454854145828 进入。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
深挖 | 首位00后冠军!22岁“吴道长”的斯诺克“飞升”秘笈是什么?

深挖 | 首位00后冠军!22岁“吴道长”的斯诺克“飞升”秘笈是什么?

新民周刊
2026-05-05 13:43:11
随着山东以5分之差不敌上海,邱彪和教练团队,可能会进行以下3个调整

随着山东以5分之差不敌上海,邱彪和教练团队,可能会进行以下3个调整

等等talk
2026-05-07 06:39:08
异性之间有一个现象:真正喜欢你的人,并不关心你的前途,也不在意你的成败,更不衡量你的价值,而是只关注这两点

异性之间有一个现象:真正喜欢你的人,并不关心你的前途,也不在意你的成败,更不衡量你的价值,而是只关注这两点

心理观察局
2026-05-06 07:28:05
公安部原主持常务工作的副部长白景富逝世,享年81岁

公安部原主持常务工作的副部长白景富逝世,享年81岁

澎湃新闻
2026-05-06 18:00:27
回顾:缅北女魔头魏榕嗜好!经常“活剥驴耳”,3个闺蜜喜欢观刑

回顾:缅北女魔头魏榕嗜好!经常“活剥驴耳”,3个闺蜜喜欢观刑

飞云如水
2024-11-13 06:54:13
3个前任都是大人物,为何阿sa却嫁给了健身教练?答案俗套又露骨

3个前任都是大人物,为何阿sa却嫁给了健身教练?答案俗套又露骨

揽星河的笔记
2026-04-28 22:48:59
俄乌战争以来曝俄军首次大规模败退!乌克兰炸毁俄后勤大桥

俄乌战争以来曝俄军首次大规模败退!乌克兰炸毁俄后勤大桥

项鹏飞
2026-05-05 19:02:50
安徽一28岁美女相亲,不料,遇车祸右腿被截肢!相亲对象竟说:“嫁给我,医药费我出”

安徽一28岁美女相亲,不料,遇车祸右腿被截肢!相亲对象竟说:“嫁给我,医药费我出”

励职派
2026-04-17 12:44:31
吉利新车官宣,5月正式上市!

吉利新车官宣,5月正式上市!

新浪财经
2026-05-07 03:52:03
沮丧,湖人队东契奇明确表达了自己至今无法参加季后赛的感受

沮丧,湖人队东契奇明确表达了自己至今无法参加季后赛的感受

好火子
2026-05-07 04:24:11
前大厂员工爆料跳槽大疆后真实体验:卷归卷,但周末真属于你

前大厂员工爆料跳槽大疆后真实体验:卷归卷,但周末真属于你

风口财经
2026-05-06 20:09:28
东风 - 31 泄密大案:总工程师被美色策反,国之重器险遭灭顶之灾

东风 - 31 泄密大案:总工程师被美色策反,国之重器险遭灭顶之灾

干史人
2026-04-18 13:44:12
1-2出局 35岁悲情巨星遗憾挥别!闯荡17年 欧冠0冠 西甲0冠

1-2出局 35岁悲情巨星遗憾挥别!闯荡17年 欧冠0冠 西甲0冠

叶青足球世界
2026-05-06 07:54:58
硬判尹锡悦妻子金建希4年,8天后他离奇死法院,排除他杀太诡异

硬判尹锡悦妻子金建希4年,8天后他离奇死法院,排除他杀太诡异

大鱼简科
2026-05-06 19:36:22
感谢王竞!国安终获主场首胜,双标判罚助球队工体3球大胜

感谢王竞!国安终获主场首胜,双标判罚助球队工体3球大胜

体坛鉴春秋
2026-05-06 22:22:18
吴宜泽名下台球馆人流量暴增,接受“台球皇帝”专访时谈奥沙利文,在比赛时他曾发私信“支招”

吴宜泽名下台球馆人流量暴增,接受“台球皇帝”专访时谈奥沙利文,在比赛时他曾发私信“支招”

极目新闻
2026-05-06 16:55:05
山东女子爆料,丈夫出轨嫂子多年,还有个孩子,全家合伙瞒着原配

山东女子爆料,丈夫出轨嫂子多年,还有个孩子,全家合伙瞒着原配

三农老历
2026-05-07 03:22:04
跟低学历妹子谈恋爱是啥体验?网友:低社会化人群被女版黄毛拿下

跟低学历妹子谈恋爱是啥体验?网友:低社会化人群被女版黄毛拿下

带你感受人间冷暖
2026-03-28 16:48:21
6岁女童弯道骑车逆行撞上对向三轮车,家长向骑三轮老人索赔遭拒,老人家属:小女孩逆行,我为何要赔?

6岁女童弯道骑车逆行撞上对向三轮车,家长向骑三轮老人索赔遭拒,老人家属:小女孩逆行,我为何要赔?

观威海
2026-05-06 09:58:21
外交部:中方一贯反对没有国际法依据的单边制裁,已向英方提出严正交涉

外交部:中方一贯反对没有国际法依据的单边制裁,已向英方提出严正交涉

新京报
2026-05-06 16:00:05
2026-05-07 07:31:00
人工智能学家 incentive-icons
人工智能学家
人工智能领域权威媒体
4714文章数 37461关注度
往期回顾 全部

科技要闻

“马斯克不懂AI”:OpenAI当庭戳老底

头条要闻

伊朗:美动用所有军事手段也无法开通霍尔木兹海峡

头条要闻

伊朗:美动用所有军事手段也无法开通霍尔木兹海峡

体育要闻

活塞1比0骑士:坎宁安不再是一个人了

娱乐要闻

谢娜演唱会暗藏惊喜 何炅瞒天过海现身

财经要闻

估值450亿美元 大基金被曝将投资DeepSeek

汽车要闻

领克10/领克10+ 无论能源形式 领克都要快乐

态度原创

数码
时尚
家居
手机
本地

数码要闻

三星宣布在中国大陆停售家电产品:手机业务不受影响 仍正常销售

有些路,不必每一步都走得那么用力

家居要闻

大胆前卫 时尚大宅

手机要闻

红米Turbo 6 Max硬刚iQOO Neo12,谁才是卷王?

本地新闻

用青花瓷的方式,打开西溪湿地

无障碍浏览 进入关怀版