网易首页 > 网易号 > 正文 申请入驻

DeepSeek遭美AI巨头污蔑,现实打脸反手登顶世界级顶刊

0
分享至

2025年9月17日,中国人工智能领域迎来高光时刻!

DeepSeek-AI团队梁文锋及同事关于开源模型DeepSeek-R1的研究成果,登上国际顶刊《自然》(Nature)当期封面,该成果迅速成为AI领域焦点,引发行业广泛讨论。



论文核心结论明确:大语言模型(LLM)的推理能力可通过纯强化学习显著提升,且能大幅减少对人工标注的依赖。

传统LLM训练需投入海量人力进行数据标注,成本高、周期长,而DeepSeek-R1的新方法打破了这一局限。

实测显示,新方法训练的模型在多领域表现优于传统模型:数学解题时能精准应对复杂题型,编程竞赛中可高效完成高难度任务,面对STEM领域研究生水平问题,也能展现出扎实的专业解答能力,充分验证了新训练路径的可行性与优越性。

此次研究还首次回应了此前备受关注的“蒸馏”争议。

在与《自然》审稿人沟通时,DeepSeek团队明确表示:R1并非通过复制OpenAI模型的推理示例学习,其基础模型和多数LLM一样,训练数据来源于网络,不可避免会吸收互联网上已有的AI生成内容,但这与“蒸馏”复制特定模型有本质区别,澄清了外界对其技术路径的误解。



在AI行业,“顶尖模型门槛在成本而非算法”是长期共识。

OpenAI训练GPT-4,外界估算花费超1亿美元。

谷歌、Anthropic、Meta等巨头的大模型研发预算也均达数千万美元级别,资金与算力直接决定了企业在行业中的话语权,高额成本让众多团队望而却步。

DeepSeek却打破了这一“潜规则”,据论文补充材料披露,DeepSeek-R1的推理成本仅29.4万美元,即便叠加约600万美元的基础模型训练开销,整体成本仍远低于国外巨头,堪称AI领域的“低成本奇迹”。



更关键的是,DeepSeek-R1的突破不仅在成本控制,更在方法论创新。

团队采用纯强化学习(RL)框架,引入组相对策略优化(GRPO)算法,训练中仅依据最终答案的对错给予模型奖励,而非让模型模仿人类推理路径。

这种看似“粗放”的方式,却带来了意外效果:模型在实践中自然涌现出自我反思(reflection)、自我验证(self-verification)、生成超长推理链条(long chains of thought)等高级行为,有时甚至会生成上千个token反复推敲单个问题,展现出自主深度思考的能力。

这一优势在数学测试中尤为凸显,论文数据显示,在美国数学邀请赛(AIME 2024)中,DeepSeek-R1-Zero的准确率从15.6%飙升至77.9%,使用自洽解码(self-consistency decoding)后更是达到86.7%,超过人类平均水平。

《自然》对此评价:这证明模型无需人类推理示范,仅通过强化学习就能自主形成复杂思维模式,标志着AI从“被动模仿”向“主动思考”迈出关键一步。



经过多阶段优化(包括RL、拒绝采样、监督微调及二次RL),最终版DeepSeek-R1实现了能力全面性突破:不仅在数学、编程等硬核任务中保持高水准,在写作、问答等通用任务上也展现出流畅性与一致性——写出的内容逻辑清晰,回答问题准确全面。

这意味着DeepSeek的训练逻辑并非“教AI思考”,而是真正“让AI学会自己思考”。

DeepSeek-R1的成功,离不开核心带头人梁文锋的长期深耕。

1985年,梁文锋出生于广东湛江普通家庭,父亲是小学老师,平凡的家庭环境培养了他坚韧的求知欲。

2002年,17岁的他考入浙江大学电子信息工程专业,五年后继续攻读该领域硕士学位,师从项志宇,专注机器视觉研究。



硕士阶段,梁文锋就展现出前瞻性:他与同学尝试将机器学习应用于金融市场,探索全自动量化交易,当时恰逢2008年全球金融危机,市场动荡中他仍敏锐捕捉到技术落地的可能性。

即便大疆创始人汪滔曾邀请他合伙创业,他也因坚信“人工智能将改变世界”,选择了独立创业的小众赛道。

硕士毕业后,梁文锋将AI技术与量化交易结合,创办雅克比投资与幻方科技,十余年间带领企业稳步发展,积累了扎实的技术与管理经验。

2023年,他瞄准通用人工智能的巨大潜力,创办DeepSeek,正式投身大模型研发。凭借对算法优化与成本控制的双重重视,DeepSeek在两年内连续推出V2、V3模型,不仅拉低了国产大模型的推理成本,更以高性价比震撼全球市场。



从行业价值来看,DeepSeek的研究远不止产出一个高性能模型,更像是一份“方法论宣言”:它向世界证明,AI进化无需依赖天量标注数据,存在更可持续的发展路径。

这一成果打破了“资金即壁垒”的行业魔咒,将AI发展的核心拉回科学创新本身。

正如《自然》审稿人、Hugging Face机器学习工程师Lewis Tunstall所言:“R1开启了一场革命”。

如今,已有越来越多团队借鉴R1的方法论优化现有大语言模型,推动全球AI向“推理革命”迈进。

可以预见,未来的AI竞争将从“数据与算力的军备竞赛”,转向“算法与智慧的创新竞赛”,而DeepSeek-R1,已然为这场新竞赛吹响了号角。

声明:个人原创,仅供参考

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
起底上海多校“发臭午餐”供应商绿捷:覆盖上海500多所学校,董事长曾任新希望六和总裁

起底上海多校“发臭午餐”供应商绿捷:覆盖上海500多所学校,董事长曾任新希望六和总裁

华夏时报
2025-09-18 16:35:10
昨晚,前夫借故来看孩子,一见面就迫不及待进入正题,我推不开他

昨晚,前夫借故来看孩子,一见面就迫不及待进入正题,我推不开他

第7情感
2025-09-14 11:33:27
俄罗斯经济稳中向好,通胀压力持续减弱,央行下调关键利率至17%

俄罗斯经济稳中向好,通胀压力持续减弱,央行下调关键利率至17%

碳基生物关怀组织
2025-09-19 16:34:59
心跳决定寿命!提醒:心率超过这个数,死亡风险飙升78%

心跳决定寿命!提醒:心率超过这个数,死亡风险飙升78%

名医在线网
2025-09-19 11:27:41
金正恩:让朝鲜人民每天都能吃到肉!

金正恩:让朝鲜人民每天都能吃到肉!

微微热评
2025-09-16 11:34:57
中国为何拒售歼-10C?专家:无体系支撑就是活靶子

中国为何拒售歼-10C?专家:无体系支撑就是活靶子

沧海旅行家
2025-09-19 21:00:54
郭台铭做梦也没想到,第二个富士康诞生!净利润百亿,员工24万

郭台铭做梦也没想到,第二个富士康诞生!净利润百亿,员工24万

通文知史
2025-07-21 18:42:54
紧急发布!苹果为 iPhone 17 推出 iOS 26 修订版

紧急发布!苹果为 iPhone 17 推出 iOS 26 修订版

简科技
2025-09-19 13:00:05
广东一男子洁身自好,却感染艾滋病,只因生活中的一个坏习惯

广东一男子洁身自好,却感染艾滋病,只因生活中的一个坏习惯

凯裕说故事
2024-09-17 15:25:35
1-1,大连英博憾平玉昆 佩尼亚赛季首球 马莱莱+毛伟杰过门将不进

1-1,大连英博憾平玉昆 佩尼亚赛季首球 马莱莱+毛伟杰过门将不进

替补席看球
2025-09-19 21:59:19
特朗普太高看自己了,向中国提出2个访华条件!中方霸气回应

特朗普太高看自己了,向中国提出2个访华条件!中方霸气回应

健身狂人
2025-09-19 16:45:32
全红婵入学仅4天,恶心事情再发生,官媒:退不退由她和团队决定

全红婵入学仅4天,恶心事情再发生,官媒:退不退由她和团队决定

阿废冷眼观察所
2025-09-19 10:19:11
罗翔:当你厌恶一个人,表达厌恶最好的方式不是和他争吵,而是..

罗翔:当你厌恶一个人,表达厌恶最好的方式不是和他争吵,而是..

诗词中国
2025-09-17 15:01:30
大加索尔:东詹跟我和科比的组合不同 当时我们都还处于巅峰期

大加索尔:东詹跟我和科比的组合不同 当时我们都还处于巅峰期

直播吧
2025-09-19 23:31:01
以色列被指与柯克被杀有关,内塔尼亚胡严厉驳斥

以色列被指与柯克被杀有关,内塔尼亚胡严厉驳斥

环球网资讯
2025-09-19 15:12:07
山东入室抢婴案宣判:主犯被判死缓,竟当庭狂骂法官等,还要上诉

山东入室抢婴案宣判:主犯被判死缓,竟当庭狂骂法官等,还要上诉

牛锅巴小钒
2025-09-19 20:40:36
地道战的残酷真相:胜利背后的血泪,远非电影所能描绘!

地道战的残酷真相:胜利背后的血泪,远非电影所能描绘!

简阳江妹儿
2025-09-18 20:42:24
女排名宿孙晋芳:在美国治病免房租,换血度日,她与婆婆情同母女

女排名宿孙晋芳:在美国治病免房租,换血度日,她与婆婆情同母女

动漫里的童话
2025-09-18 18:22:17
网曝成都大悦城西贝现状:18日晚上用餐高峰,仅仅只有一桌在吃饭

网曝成都大悦城西贝现状:18日晚上用餐高峰,仅仅只有一桌在吃饭

谈史论天地
2025-09-19 10:23:14
太心疼!上海籍运动员遭疯狂网暴,3人被采取刑事强制措施!竞技场不是暴力场

太心疼!上海籍运动员遭疯狂网暴,3人被采取刑事强制措施!竞技场不是暴力场

新民晚报
2025-09-18 21:10:48
2025-09-20 07:55:00
何蕥室内设计
何蕥室内设计
分享室内设计经验,避坑知识分享。
772文章数 32关注度
往期回顾 全部

科技要闻

直击iPhone 17开售:消费者偏爱银色橙色

头条要闻

韩国前第一夫人穿拘留所病号服坐轮椅就医 戴电子脚镣

头条要闻

韩国前第一夫人穿拘留所病号服坐轮椅就医 戴电子脚镣

体育要闻

从轮椅到铜牌 他熬了7年:下个目标唱国歌!

娱乐要闻

全智贤被全面抵制!相关代言评论区沦陷

财经要闻

习近平同美国总统特朗普通电话

汽车要闻

对话周光:一个技术理想主义者的“蜕变”

态度原创

数码
时尚
健康
游戏
军事航空

数码要闻

750万小米空调升级10年免费包修:为用户节省15亿元

卡其裤+蓝衬衫,简单高级

内分泌科专家破解身高八大谣言

和三月七一样爱自拍,还恶趣味让叽米加班,长夜月越来越神秘了

军事要闻

以军两个方向朝加沙城市中心推进

无障碍浏览 进入关怀版