网易首页 > 网易号 > 正文 申请入驻

「夜袭」 OpenAI!DeepSeek 开源最强推理模型 R1,再震欧美同行

0
分享至

中国的 OpenAI,出现了。

作者 | 宛辰
编辑| 靖宇


对标 OpenAI o1 正式版的国产大模型来了!

1 月 20 日晚,DeepSeek(深度求索)公司发布推理模型 DeepSeek-R1 正式版,同步开源模型权重,并允许用户利用模型输出、通过模型蒸馏等方式训练其他模型。

网友热评:这,才是真正的OpenAI。能力相当于一个月 200 美元的 ChatGPT o1 版本,却完全免费

不止如此,DeepSeek 一同开源的还有「技术报告」,那些训练 R1 时踩过的坑、做过的事通通讲给你听,只为铺平 AGI 的路。

第一时间阅读这份技术报告后,英伟达高级研究科学家 Jim Fan 带来了新鲜解读,值得我们大声齐读:

「我们生活在这样一个时代:由非美国公司保持 OpenAI 最初的使命——做真正开放的前沿研究、为所有人赋能。这似乎讲不通,但戏剧性的往往最有可能发生。

DeepSeek-R1 不仅开源了大量模型,还泄露了所有训练秘密。他们可能是第一个显示 RL(强化学习)飞轮发挥主要作用、持续增长的 OSS 项目。

影响可以通过『内部实现了 ASI』或『草莓计划』等神话名称来实现。也可以通过简单地转储原始算法和 matplotlib 学习曲线来产生影响。」

中国公司 DeepSeek,正在实现赶超 OpenAI 的使命

01

DeepSeek-R1:

实力派选择「秀肌肉」

「DeepSeek-R1」的发布,摆明了是:有实力所以明晃晃地秀肌肉!

这首先体现在它不整期货那一套,而是「发布即上线」,现在,你就可以在 DeepSeek 官网与 App 体验最新的推理模型 DeepSeek-R1,随便体验随便用,免费。

DeepSeek-R1 也同步上线了 API,对用户开放思维链输出,通过设置 model='deepseek-reasoner' 即可调用。

值得注意的是 DeepSeek-R1 API 服务定价为每百万输入 tokens 1 元(缓存命中)/ 4 元(缓存未命中),每百万输出 tokens 16 元。看下面这这图你会有更直接的体感,输出 API 价格只有 OpenAI o1 的 3%。低价背后,显然仍是秀肌肉,价格实力展现了技术实力——从AIInfra 层面降本的技术能力。

第三波「秀肌肉」体现在开源开放DeepSeek-R1 开源模型权重几乎是选择了最开放的许可证和用户协议,开源 License 统一使用 MIT,产品协议明确可「模型蒸馏」,主打一个让大家多多来基于它做二次开发、集成。DeepSeek 甚至主动给大家示范引导将 R1 作为教师模型来蒸馏出一个更小但仍有实力的模型,「通过 DeepSeek-R1 的输出,蒸馏了 6 个小模型开源给社区,其中 32B 和 70B 模型在多项能力上实现了对标 OpenAI o1-mini 的效果」。

事实上,模型开源选择不同的 License 背后大有学问,这直接体现不同模型厂商的开放程度,更体现开源背后的目的和策略。比如像 Llama、Qwen、GPT-2 等模型就不止开放权重,还开放了模型训练的源代码,这可能是为了追求衍生模型的繁荣。而 DeepSeek-R1 选择只开放权重,但换成了标准化、宽松的 MIT License,更多还是为了让更多开发者能用起来,感受 DeepSeek-R1 的能力。

我们再来通过几大主流测试基准来感受一下 DeepSeek-R1 的实力。「性能对齐 OpenAI-o1 正式版 DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版。」

对于 DeepSeek-R1 带来的直观感受,硅基流动联合创始人杨攀表示,不止模型能力和性能出色,最近两个模型 (R1 和 V3) 在训练技术和模型底层架构上都做了领先全球的创新,而且其论文开放程度也震惊了业界。

在一并公开的模型技术报告中,DeepSeek 将「DeepSeek-R1」训练技术全部公开,「旨在促进技术社区的充分交流与创新协作」。

对于开源模型加技术报告,开源社联合创始人林旅强此前向极客公园表示,开源是最好的「秀技术肌肉」的方式,同时「有的开源模型只开源、不讲他是怎么做的,但是合乎大家期待的开源模型是要搭配技术报告,等于是发 paper 了。开源模型不够的,因为模型是黑盒子,技术报告会说明一些东西。DeepSeek 他们是很透明地把他的技术报告拿来公开,即使一定程度还是会捂着掖着,但是已经是开得比较有态度。今天全球范围的学术派还是会认为,你把一个东西做出来再以开源的方式,是有学术追求的。

如果 DeepSeek 的目标是真正达到 AGI,就不断需要把踩过的坑、做过的事情开放出来,让大家少走一点弯路,开放才能让整个行业更快达到 AGI,他补充道。

最后,我们来随机看一些用户实测评价(截图来源:X.com):

02

DeepSeek,还有什么

惊喜是我们不知道的?!

尽管昨晚 DeepSeek-R1 的发布引发了「这才是 Open AI 吧」「东方的 OpenAI」等一片称赞。但 DeepSeek 强得非常扎实、全面。

去年在 2024 年 11 月 20 日发布 DeepSeek-R1-Lite 预览版时,美国著名半导体与 AI 咨询机构 Semianalysis 创始人 Dylan Patel 就坐不住了,第一时间下场「提醒」大家:他们有 5 万张 H100GPU!请不要以为他们只有 1 万张 A100

因为众所周知的原因,这大概率不是事实,却能反映 DeepSeek-R1-Lite 的强悍到让行业紧张。

一个月后,DeepSeek 上线并同步开源了媲美 GPT-4o 和 Claude 3.5 Sonnet 的模型「DeepSeek-V3」,并附上了详实的技术报告。这一次,几乎惊动了整个硅谷AI圈。卡神(OpenAI 创始团队、前 Tesla AI 总监 Andrej Karpathy)、Alexandr Wang(Scale.ai 创始人)、田渊栋(Meta AI 科学家)、贾扬清(Lepton AI 创始人)……人均一句「难以置信」。就连 Sam Altman 都忍不住出来酸一把「复刻已经被验证过奏效的东西是容易的」。

随着模型性能逐渐走向全球第一梯队,DeepSeek 也迎来了新的发展契机。

过去一年半,DeepSeek 专注于模型和研究,但从今年开始,DeepSeek 着手做应用了。

2025 年 1 月 15 日,DeepSeek 推出移动端 AI 助手「DeepSeek」App。目前看,DeepSeek App 跟网页版功能一致,主要有两个功能:联网搜索和深度思考,主打一个简洁,聊天记录也会同步显示在手机端和网页端,尚未针对移动端进行特定功能的打磨,也没有市面上 AI 助手类 App 丰富、fancy 的功能,更像是一个能让你在手机上体验 DeepSeek 最新模型的入口。

对此,一位投资人向极客公园解释 DeepSeek 开始做应用背后可能的战略转向:「前期 DeepSeek 靠自己的算力优势积累出了模型技术的领先度。后期要补数据,发 App 是补数据的手段之一。接入用户数据和场景,可以帮助他更好地进行模型能力的迭代和升级。」

同时,有了 DeepSeek-R1 和其他模态、类型越来越好的模型,可以期待未来 DeepSeek 在比如代码模型/应用里有更激进的表现,惊喜才刚刚开始。

*头图来源:视觉中国

本文为极客公园原创文章,转载请联系极客君微信 geekparkGO

极客一问

你看好DeepSeek 吗

马斯克:传统教育培养答题机器,总爱折腾一些不存在的东西。

点赞关注极客公园视频号

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
2026年存款超100万要慌了?4个难题找上门,普通人如何守住财富

2026年存款超100万要慌了?4个难题找上门,普通人如何守住财富

老特有话说
2026-05-07 15:05:50
38岁本泽马率新月2-1逆转 加盟3个月即获首冠 4天后与C罗联赛决战

38岁本泽马率新月2-1逆转 加盟3个月即获首冠 4天后与C罗联赛决战

我爱英超
2026-05-09 06:40:03
随着奥萨苏纳2-3遭大逆转,西甲最新积分榜出炉:保级争夺白热化

随着奥萨苏纳2-3遭大逆转,西甲最新积分榜出炉:保级争夺白热化

侧身凌空斩
2026-05-09 05:17:37
去年造了全球90%产品,摩根士丹利:中国人形机器人或重演十年前中国新能源车剧本

去年造了全球90%产品,摩根士丹利:中国人形机器人或重演十年前中国新能源车剧本

红星新闻
2026-05-08 18:37:14
统一台湾后,第一任省长由谁担任最合适?五人上榜,一人脱颖而出

统一台湾后,第一任省长由谁担任最合适?五人上榜,一人脱颖而出

知鉴明史
2026-04-24 20:05:03
小宝与王某雷,谁探访花的数量更多?

小宝与王某雷,谁探访花的数量更多?

挪威森林
2026-01-31 12:15:26
她帮美国造出原子弹,37年后见到周总理,第一句话让人瞬间泪崩

她帮美国造出原子弹,37年后见到周总理,第一句话让人瞬间泪崩

老范谈史
2026-04-20 20:30:16
泽州4.26刑案嫌犯落网!逃亡四天后在山腰被抓,知情人披露案因

泽州4.26刑案嫌犯落网!逃亡四天后在山腰被抓,知情人披露案因

Likepres
2026-05-07 21:03:43
王暖暖不再隐瞒!自曝深夜被紧急送医,护士反复呼唤,熟悉的恐惧

王暖暖不再隐瞒!自曝深夜被紧急送医,护士反复呼唤,熟悉的恐惧

枫尘余往逝
2026-05-09 02:20:33
努诺:赢阿森纳难度非常大,但我们不会放弃保级

努诺:赢阿森纳难度非常大,但我们不会放弃保级

懂球帝
2026-05-09 05:55:11
皇马已启动“穆里尼奥行动”,本菲卡挽留穆帅,英超多队有意穆帅

皇马已启动“穆里尼奥行动”,本菲卡挽留穆帅,英超多队有意穆帅

福酱的小时光
2026-05-09 05:55:25
机关下设的事业单位,比如各种“中心”,名义上是独立机构,实际上早成了机关的内设处室?

机关下设的事业单位,比如各种“中心”,名义上是独立机构,实际上早成了机关的内设处室?

碧翰烽
2026-05-08 07:33:09
宁波女子帮“老同事”查快递被骗6万多元:“客服”让支付尾款否则定金作废,“老同事”网络不好请她先垫付并发毒誓“骗你出门被车撞死”

宁波女子帮“老同事”查快递被骗6万多元:“客服”让支付尾款否则定金作废,“老同事”网络不好请她先垫付并发毒誓“骗你出门被车撞死”

极目新闻
2026-05-08 22:19:45
《黑神话》3D大神发美图!美胸大雷 性感玉足太迷人

《黑神话》3D大神发美图!美胸大雷 性感玉足太迷人

游民星空
2026-05-06 21:29:22
酒局持续4小时,从下厨招待到拿刀拼命,妻子到底经历了什么

酒局持续4小时,从下厨招待到拿刀拼命,妻子到底经历了什么

笑谈历史阿晡
2026-05-04 12:02:08
德云社弟子大洗牌!3人自断后路,岳云鹏边缘,烧饼一哥地位稳了

德云社弟子大洗牌!3人自断后路,岳云鹏边缘,烧饼一哥地位稳了

白面书誏
2026-05-08 15:52:08
瑞秋·齐格勒Met Gala红毯造型致敬名画,用力过猛,被称“失败的白雪公主”

瑞秋·齐格勒Met Gala红毯造型致敬名画,用力过猛,被称“失败的白雪公主”

大中国
2026-05-07 15:09:12
300872,拟超35亿元切入算力租赁赛道!近期股价大涨!

300872,拟超35亿元切入算力租赁赛道!近期股价大涨!

证券时报
2026-05-08 21:52:04
巴拉圭总统窜台,不到24小时,中方下达最后通牒:与台“断交”

巴拉圭总统窜台,不到24小时,中方下达最后通牒:与台“断交”

感谢过往
2026-05-09 04:46:45
DeepSeek网页及API服务出现异常,官方称正在实施修复

DeepSeek网页及API服务出现异常,官方称正在实施修复

界面新闻
2026-05-08 17:57:26
2026-05-09 07:19:00
极客公园
极客公园
让最棒的创新成为头条
12025文章数 78879关注度
往期回顾 全部

科技要闻

SK海力士平均奖金600万 工服成相亲神器

头条要闻

美公布首批UFO文件 视频公开:阿联酋现水母状物体

头条要闻

美公布首批UFO文件 视频公开:阿联酋现水母状物体

体育要闻

他把首胜让给队友,然后用一年时间还清账单

娱乐要闻

古天乐被曝隐婚生子,新娘竟是她

财经要闻

估值3000亿 DeepSeek寻求500亿元融资

汽车要闻

MG 4X实车亮相 将于5月11日开启盲订

态度原创

艺术
本地
家居
亲子
公开课

艺术要闻

清风拂面,心旷神怡

本地新闻

用苏绣的方式,打开江西婺源

家居要闻

流动的尺度 打破家的形式主义

亲子要闻

小锐锐会走路后笑得很开心

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版