网易首页 > 网易号 > 正文 申请入驻

DeepSeek遭美AI巨头污蔑,现实打脸反手登顶世界级顶刊

0
分享至

2025年9月17日,中国人工智能领域迎来高光时刻!

DeepSeek-AI团队梁文锋及同事关于开源模型DeepSeek-R1的研究成果,登上国际顶刊《自然》(Nature)当期封面,该成果迅速成为AI领域焦点,引发行业广泛讨论。

论文核心结论明确:大语言模型(LLM)的推理能力可通过纯强化学习显著提升,且能大幅减少对人工标注的依赖。

传统LLM训练需投入海量人力进行数据标注,成本高、周期长,而DeepSeek-R1的新方法打破了这一局限。

实测显示,新方法训练的模型在多领域表现优于传统模型:数学解题时能精准应对复杂题型,编程竞赛中可高效完成高难度任务,面对STEM领域研究生水平问题,也能展现出扎实的专业解答能力,充分验证了新训练路径的可行性与优越性。

此次研究还首次回应了此前备受关注的“蒸馏”争议。

在与《自然》审稿人沟通时,DeepSeek团队明确表示:R1并非通过复制OpenAI模型的推理示例学习,其基础模型和多数LLM一样,训练数据来源于网络,不可避免会吸收互联网上已有的AI生成内容,但这与“蒸馏”复制特定模型有本质区别,澄清了外界对其技术路径的误解。

在AI行业,“顶尖模型门槛在成本而非算法”是长期共识。

OpenAI训练GPT-4,外界估算花费超1亿美元。

谷歌、Anthropic、Meta等巨头的大模型研发预算也均达数千万美元级别,资金与算力直接决定了企业在行业中的话语权,高额成本让众多团队望而却步。

DeepSeek却打破了这一“潜规则”,据论文补充材料披露,DeepSeek-R1的推理成本仅29.4万美元,即便叠加约600万美元的基础模型训练开销,整体成本仍远低于国外巨头,堪称AI领域的“低成本奇迹”。

更关键的是,DeepSeek-R1的突破不仅在成本控制,更在方法论创新。

团队采用纯强化学习(RL)框架,引入组相对策略优化(GRPO)算法,训练中仅依据最终答案的对错给予模型奖励,而非让模型模仿人类推理路径。

这种看似“粗放”的方式,却带来了意外效果:模型在实践中自然涌现出自我反思(reflection)、自我验证(self-verification)、生成超长推理链条(long chains of thought)等高级行为,有时甚至会生成上千个token反复推敲单个问题,展现出自主深度思考的能力。

这一优势在数学测试中尤为凸显,论文数据显示,在美国数学邀请赛(AIME 2024)中,DeepSeek-R1-Zero的准确率从15.6%飙升至77.9%,使用自洽解码(self-consistency decoding)后更是达到86.7%,超过人类平均水平。

《自然》对此评价:这证明模型无需人类推理示范,仅通过强化学习就能自主形成复杂思维模式,标志着AI从“被动模仿”向“主动思考”迈出关键一步。

经过多阶段优化(包括RL、拒绝采样、监督微调及二次RL),最终版DeepSeek-R1实现了能力全面性突破:不仅在数学、编程等硬核任务中保持高水准,在写作、问答等通用任务上也展现出流畅性与一致性——写出的内容逻辑清晰,回答问题准确全面。

这意味着DeepSeek的训练逻辑并非“教AI思考”,而是真正“让AI学会自己思考”。

DeepSeek-R1的成功,离不开核心带头人梁文锋的长期深耕。

1985年,梁文锋出生于广东湛江普通家庭,父亲是小学老师,平凡的家庭环境培养了他坚韧的求知欲。

2002年,17岁的他考入浙江大学电子信息工程专业,五年后继续攻读该领域硕士学位,师从项志宇,专注机器视觉研究。

硕士阶段,梁文锋就展现出前瞻性:他与同学尝试将机器学习应用于金融市场,探索全自动量化交易,当时恰逢2008年全球金融危机,市场动荡中他仍敏锐捕捉到技术落地的可能性。

即便大疆创始人汪滔曾邀请他合伙创业,他也因坚信“人工智能将改变世界”,选择了独立创业的小众赛道。

硕士毕业后,梁文锋将AI技术与量化交易结合,创办雅克比投资与幻方科技,十余年间带领企业稳步发展,积累了扎实的技术与管理经验。

2023年,他瞄准通用人工智能的巨大潜力,创办DeepSeek,正式投身大模型研发。凭借对算法优化与成本控制的双重重视,DeepSeek在两年内连续推出V2、V3模型,不仅拉低了国产大模型的推理成本,更以高性价比震撼全球市场。

从行业价值来看,DeepSeek的研究远不止产出一个高性能模型,更像是一份“方法论宣言”:它向世界证明,AI进化无需依赖天量标注数据,存在更可持续的发展路径。

这一成果打破了“资金即壁垒”的行业魔咒,将AI发展的核心拉回科学创新本身。

正如《自然》审稿人、Hugging Face机器学习工程师Lewis Tunstall所言:“R1开启了一场革命”。

如今,已有越来越多团队借鉴R1的方法论优化现有大语言模型,推动全球AI向“推理革命”迈进。

可以预见,未来的AI竞争将从“数据与算力的军备竞赛”,转向“算法与智慧的创新竞赛”,而DeepSeek-R1,已然为这场新竞赛吹响了号角。

声明:个人原创,仅供参考

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
教练内讧的背后,是泰山队教练组存在三股势力,韩鹏已被架空

教练内讧的背后,是泰山队教练组存在三股势力,韩鹏已被架空

姜大叔侃球
2026-03-30 11:10:10
冷知识:千万不要买太大的蓝莓!!!

冷知识:千万不要买太大的蓝莓!!!

果壳
2026-03-30 16:12:50
马塞洛16岁儿子出彩:穿裆+补射 35分钟戴帽!皇马U19狂胜

马塞洛16岁儿子出彩:穿裆+补射 35分钟戴帽!皇马U19狂胜

叶青足球世界
2026-03-30 19:11:57
一天被毁21台梅卡瓦!美媒:以军遭遇40年来最大损失,濒临崩溃!

一天被毁21台梅卡瓦!美媒:以军遭遇40年来最大损失,濒临崩溃!

军机Talk
2026-03-29 14:03:41
贾跃亭宣布法拉第未来月底将超额完成机器人首月20台交付目标

贾跃亭宣布法拉第未来月底将超额完成机器人首月20台交付目标

IT之家
2026-03-30 17:30:27
450亿颗芯片悬空!荷兰突然宣布光刻机决定,欧媒:一切都结束了

450亿颗芯片悬空!荷兰突然宣布光刻机决定,欧媒:一切都结束了

安珈使者啊
2026-03-29 14:37:11
中央转移支付再超10万亿!四川、河南、湖南、湖北、河北,分得最多

中央转移支付再超10万亿!四川、河南、湖南、湖北、河北,分得最多

城市财经
2026-03-30 11:47:41
“希望大家不要再骂我了!”全红婵哽咽落泪:饿到不行,体重还是减不下来

“希望大家不要再骂我了!”全红婵哽咽落泪:饿到不行,体重还是减不下来

海峡网
2026-03-30 17:13:37
危险信号!特朗普,彻底被架空了!

危险信号!特朗普,彻底被架空了!

大嘴说天下
2026-03-30 18:13:30
CBA常规赛打完!这些水货外援都要全部走人,一个不留

CBA常规赛打完!这些水货外援都要全部走人,一个不留

男足的小球童
2026-03-30 18:53:57
7年败光数亿,55岁王中磊落魄,被迫拍短视频还债,儿子在美潇洒

7年败光数亿,55岁王中磊落魄,被迫拍短视频还债,儿子在美潇洒

以茶带书
2026-03-30 18:03:47
特朗普赚翻了,美媒:越来越多证据显示,特朗普利用伊朗战争敛财

特朗普赚翻了,美媒:越来越多证据显示,特朗普利用伊朗战争敛财

爱吃醋的猫咪
2026-03-30 20:27:35
我嫁给不能生育的迪拜富商,不到3个月我竟孕吐不止,医生:恭喜

我嫁给不能生育的迪拜富商,不到3个月我竟孕吐不止,医生:恭喜

千秋文化
2026-03-25 21:42:08
她41岁嫁庾澄庆,两年生一儿一女,比伊能静幸运的点在于婆婆老了

她41岁嫁庾澄庆,两年生一儿一女,比伊能静幸运的点在于婆婆老了

以茶带书
2026-03-29 20:58:52
泡泡玛特两日大跌超30%开启回购 段永平改口:收回不投资泡泡玛特的说法

泡泡玛特两日大跌超30%开启回购 段永平改口:收回不投资泡泡玛特的说法

快科技
2026-03-30 16:34:32
吴庆文任江苏镇江市委书记

吴庆文任江苏镇江市委书记

界面新闻
2026-03-30 11:24:16
27分5篮板,山东男篮外援捡到宝 助队小胜天津 陶汉林+郭凯齐爆发

27分5篮板,山东男篮外援捡到宝 助队小胜天津 陶汉林+郭凯齐爆发

替补席看球
2026-03-30 21:44:15
麦迪:约基奇不会在乎拿了20+20+20,赛后他只关心自己的马

麦迪:约基奇不会在乎拿了20+20+20,赛后他只关心自己的马

懂球帝
2026-03-30 21:30:09
伊能静回应逛迪士尼拒绝合影:一家三口难得在一起,我很珍惜

伊能静回应逛迪士尼拒绝合影:一家三口难得在一起,我很珍惜

大嘴天天说
2026-03-30 21:27:25
特朗普宣布访华新日期,不到48小时,中方不留情面,连出两条公告

特朗普宣布访华新日期,不到48小时,中方不留情面,连出两条公告

老范谈史
2026-03-30 20:58:50
2026-03-30 22:36:49
何蕥室内设计
何蕥室内设计
分享室内设计经验,避坑知识分享。
2052文章数 75关注度
往期回顾 全部

科技要闻

一句谎言引发的硅谷血案

头条要闻

开发商承诺有学校3年后交房没建 业主起诉被当地驳回

头条要闻

开发商承诺有学校3年后交房没建 业主起诉被当地驳回

体育要闻

想进世界杯,意大利还要过他这一关

娱乐要闻

单依纯凌晨发长文道歉!李荣浩再回应

财经要闻

本轮地缘冲突,A股凭什么走出独立行情

汽车要闻

限时12.58万起 银河星耀8远航家系列上市

态度原创

教育
健康
时尚
手机
亲子

教育要闻

妈妈不要怕,有我在,你的儿子女儿会平安快乐长大!

干细胞抗衰4大误区,90%的人都中招

这件衣服绝美!今年流行的风格而都离不开它

手机要闻

全焦段创作自由 vivo X300 Ultra专业V单发布

亲子要闻

孩子眼睛出现这些现象,一定要警惕!

无障碍浏览 进入关怀版