网易首页 > 网易号 > 正文 申请入驻

像人一样“顿悟”?国产AI大模型DeepSeek将实现“Copy from China”

0
分享至

现在的AI模型也能“灵光一现”,实现顿悟了?

1月20日,中国AI公司深度求索(DeepSeek)发布的DeepSeek-R1模型,凭借其独特的强化学习(RL)训练方法,首次让AI展现出类人的“顿悟时刻”——在解决复杂问题时,模型会突然停下思考,自主修正推理路径,甚至用自然语言标注“等等,这一步可能有误”。


(AI在思考的过程中突然停下:“等等,等等。这是一个顿悟时刻。让我们一步一步地重新评估一下,以确定正确的总和...”)

知名AI评测员Matthew Berman表示,R1拥有他所见过的最像人类的内心独白。

从“人类教”到“自己学”

DeepSeek-R1的这种特点,和它独特的训练方式有关。

传统的AI训练有三个阶段:预训练、SFT(监督微调)、RL(强化学习)。打个比方,传统AI需经历三阶段学习:先在预训练阶段里“背书自学”基础知识,再在SFT阶段里“抄写教案”模仿人类示范,最后在RL阶段里“模拟考试”优化表现。

而R1 Zero跳过了SFT阶段,直接进入了RL阶段。也就是说,DeepSeek-R1直接砍掉用人工标准数据训练的“模仿”环节,而是仅凭基础语言能力和数学规则,在持续解题试错中自悟知识体系。

SFT的使用是当年ChatGPT成功的关键,而R1 Zero完全用强化学习替代了SFT。

DeepSeek-R1成功的秘诀在于构建了一个智能训练场,这一系统由三个技术组件构成:动态题目生成系统、过程验证体系和协同工作机制。用一个比喻来说,每解完一题,系统自动生成更难的变体题,并实时验证解题过程逻辑是否自洽。它迫使AI像数学家般提炼方法论,甚至能将几何证明中的反证法迁移到代码检测中。

这个训练过程展示了强化学习的潜力。未来的AI发展,依然充满无限可能。

强大,便宜,还开源

据介绍,DeepSeek-R1的功能比肩OpenAI o1。

根据DeepSeek官方公布的数据,DeepSeek-R1在AIME2024上获得了79.8%的成绩,略高于OpenAI-o1-1217的79.2%。在MATH-500上,它获得了97.3%的惊人成绩,表现略高于OpenAI-o1-1217的96.4%,并明显优于其他模型。在编码相关的任务中,DeepSeek-R1在Codeforces上获得了2029 Elo评级,在竞赛中表现优于96.3%的人类参与者。对于工程相关的任务,DeepSeek-R1的表现略优于OpenAI-o1-1217。


性能这么强大,那么,价格如何呢?

DeepSeek-R1 API服务定价为每百万输入tokens1元(缓存命中)/4元(缓存未命中)。输入token(命中缓存)价格只有OpenAI o1的1/55,未命中缓存以及输出token价格约为o1的1/27。


最关键的是,DeepSeek将R1的训练技术全部公开了!


很多网友都为其超高的性价比和开源的行为震惊,高呼“源神”。

Copy from China

针对DeepSeek发布的论文,英伟达高级研究科学家Jim Fan在X上公开发表了一篇推文:我们正身处这样一个历史时刻:一家非美国公司正在延续OpenAI最初的使命——通过真正开放的前沿研究赋能全人类。看似不合常理,但最有趣的结局往往最可能成真。


有趣的是,在DeepSeek-R1发布后的两小时内,另一家国产厂商月之暗面也推出了在数学、代码、多模态推理能力等方面全面对标OpenAI o1的新模型——K1.5。

周鸿祎在年初谈及对国产大模型的看法时表示,过去我们是模仿者和追随者,他人擅长从零到一,我们擅长从一到n,如今情况正转变,中国科技领域原发性创新已让全世界看到,过去是“Copy to China”,以后可能是“Copy from China”。

让我们共同欣喜地看到中国创新引领世界发展,期待“Copy from China”的未来。

资料来源:潮新闻、观察者网、每日经济新闻、DeepSeek官网等

(大众新闻编辑 王嘉一 整合)

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
物美也取经胖东来,首家自主调改门店即将闭店

物美也取经胖东来,首家自主调改门店即将闭店

经济观察报
2025-02-09 18:54:11
南京市江宁区汤山街道孟墓社区党委书记戴光军接受纪律审查和监察调查

南京市江宁区汤山街道孟墓社区党委书记戴光军接受纪律审查和监察调查

鲁中晨报
2025-02-08 20:38:04
中方不低头也得低?4国联合出手,要和中方硬碰硬?

中方不低头也得低?4国联合出手,要和中方硬碰硬?

听风者说
2025-02-07 09:57:14
女演员孟子义赴柬埔寨拍戏引发粉丝担忧,本人发文报平安!后援团曾呼吁不要私自前往

女演员孟子义赴柬埔寨拍戏引发粉丝担忧,本人发文报平安!后援团曾呼吁不要私自前往

鲁中晨报
2025-02-09 11:42:14
越媒透露越南海关“收小费”被中国导演在社交媒体指控索贿。

越媒透露越南海关“收小费”被中国导演在社交媒体指控索贿。

文雅笔墨
2025-02-09 19:46:24
Oppo Find N5:全球首款“无折痕”折叠屏即将发布,规格曝光

Oppo Find N5:全球首款“无折痕”折叠屏即将发布,规格曝光

墨谈科技
2025-02-09 19:15:52
高圆圆颜值气质被秒杀!4年前旧照被扒,与国际名模合影,输惨了

高圆圆颜值气质被秒杀!4年前旧照被扒,与国际名模合影,输惨了

扒星人
2025-02-09 17:22:54
普京违背了对中国的承诺?俄朝在图们江修大桥,东北出海口咋办?

普京违背了对中国的承诺?俄朝在图们江修大桥,东北出海口咋办?

Ck的蜜糖
2025-02-09 08:32:17
尴尬!网传抚州移动私开彩铃助力比亚迪招聘,用户投诉被霸气回复

尴尬!网传抚州移动私开彩铃助力比亚迪招聘,用户投诉被霸气回复

火山诗话
2025-02-09 11:20:55
《熊出没》票房超过《射雕》 列春节档票房第四

《熊出没》票房超过《射雕》 列春节档票房第四

大象新闻
2025-02-09 19:43:24
亚冬会第2日奖牌榜:中国15金15银14铜继续第一!韩国排第二

亚冬会第2日奖牌榜:中国15金15银14铜继续第一!韩国排第二

直播吧
2025-02-09 15:12:54
如今看来,马斯克“安插”在中国的秘密武器,已经见效了!

如今看来,马斯克“安插”在中国的秘密武器,已经见效了!

古今历史记
2025-02-08 16:07:58
《哪吒2》成都合作方:曾派近30人分批入驻,项目似人才“奥运村”

《哪吒2》成都合作方:曾派近30人分批入驻,项目似人才“奥运村”

红星新闻
2025-02-09 23:52:15
春节同学聚会,退休班花炫耀养老金6000,我本有12000,立即改口说只有3000,晚上收到她的微信愣住了

春节同学聚会,退休班花炫耀养老金6000,我本有12000,立即改口说只有3000,晚上收到她的微信愣住了

职场火锅
2025-02-08 21:45:33
江西彩民2.54亿巨奖震惊全国,背后真相引热议

江西彩民2.54亿巨奖震惊全国,背后真相引热议

历史珍品
2025-02-09 22:57:05
梅拉尼娅发布官方肖像,《Vogue》立刻一通狂喷!8年了,还没消停啊...

梅拉尼娅发布官方肖像,《Vogue》立刻一通狂喷!8年了,还没消停啊...

北美省钱快报
2025-02-10 02:49:11
人可以蠢到什么程度?网友的真实分享:是个顶天立地的人才

人可以蠢到什么程度?网友的真实分享:是个顶天立地的人才

这班我上够了
2025-02-09 19:00:03
官方:里瓦尔多之子29岁巴西前锋里瓦尔迪尼奥加盟中甲青岛红狮

官方:里瓦尔多之子29岁巴西前锋里瓦尔迪尼奥加盟中甲青岛红狮

直播吧
2025-02-10 00:25:21
设计抄袭太没下限,近乎照搬,唯一例外39年后会自动消失

设计抄袭太没下限,近乎照搬,唯一例外39年后会自动消失

美人茶话会
2025-02-09 10:27:38
泰国内阁敲定中泰高铁令越南破大防,更是碾碎了日本高铁出海梦

泰国内阁敲定中泰高铁令越南破大防,更是碾碎了日本高铁出海梦

文雅笔墨
2025-02-09 17:43:12
2025-02-10 08:07:00
大众日报 incentive-icons
大众日报
大众日报是中共山东省委机关报
370807文章数 44967关注度
往期回顾 全部

科技要闻

DeepSeek引爆本地部署热 个人企业争相入局

头条要闻

殷郊法相被传是"4500元外包的" 《封神2》导演回应

头条要闻

殷郊法相被传是"4500元外包的" 《封神2》导演回应

体育要闻

三冠王!19岁林诗栋排名升至世界第一

娱乐要闻

包机事件再反转?葛斯齐爆料小S秘闻

财经要闻

1月CPI同比上涨0.5% PPI同比下降2.3%

汽车要闻

央企整合或提速 长安/东风同时公告控股股东筹划重组

态度原创

教育
数码
时尚
亲子
军事航空

教育要闻

“取消中考,高中纳入义务教育”,已有地区试点,家长表示赞同

数码要闻

国产飞腾 CPU 实现对 DeepSeek 全系列大模型端到端支持

伊姐周日热推:电视剧《六姊妹 》;电视剧《仙台有树》......

亲子要闻

山西一孕妇临盆做检查,发现孩子已停育2个月,不顾反对坚持要生,儿子生下后一家人崩溃了……

军事要闻

哈马斯官员:以方持续违反停火协议 可能导致协议破裂

无障碍浏览 进入关怀版