网易首页 > 网易号 > 正文 申请入驻

DeepSeek官方:R1升级后显著提升了思维深度与推理能力

0
分享至

观点网讯:5月29日,深度求索官方发布,DeepSeek R1模型已完成小版本升级,当前版本为 DeepSeek-R1-0528。用户通过官方网站、APP 或小程序进入对话界面后,开启“深度思考”功能即可体验最新版本。API 也已同步更新,调用方式不变。

公告显示,DeepSeek-R1-0528仍然使用2024年12月所发布的DeepSeek V3 Base模型作为基座,但在后训练过程中投入了更多算力,显著提升了模型的思维深度与推理能力。

更新后的R1模型在数学、编程与通用逻辑等多个基准测评中取得了当前国内所有模型中首屈一指的优异成绩,并且在整体表现上已接近其他国际顶尖模型,如o3与Gemini-2.5-Pro。

相较于旧版R1,新版模型在复杂推理任务中的表现有了显著提升。例如在AIME 2025测试中,新版模型准确率由旧版的70%提升至87.5%。这一进步得益于模型在推理过程中的思维深度增强:在AIME 2025测试集上,旧版模型平均每题使用12K tokens,而新版模型平均每题使用23K tokens,表明其在解题过程中进行了更为详尽和深入的思考。

同时,我们蒸馏DeepSeek-R1-0528的思维链后训练Qwen3-8BBase,得到了DeepSeek-R1-0528-Qwen3-8B。该8B模型在数学测试AIME 2024中仅次于DeepSeek-R1-0528,超越Qwen3-8B(+10.0%),与Qwen3-235B相当。我们相信,DeepSeek-R1-0528的思维链对于学术界推理模型的研究和工业界针对小模型的开发都将具有重要意义。

其他能力方面,幻觉改善:新版DeepSeekR1针对“幻觉”问题进行了优化。与旧版相比,更新后的模型在改写润色、总结摘要、阅读理解等场景中,幻觉率降低了45~50%左右,能够有效地提供更为准确、可靠的结果。

创意写作:在旧版R1的基础上,更新后的R1模型针对议论文、小说、散文等文体进行了进一步优化,能够输出篇幅更长、结构内容更完整的长篇作品,同时呈现出更加贴近人类偏好的写作风格。

本次R1更新后,官方网站、小程序、App端和API中的模型上下文长度仍为64K。如果用户对更长的上下文长度有需求,可以通过其他第三方平台调用上下文长度为128K的开源版本R1-0528模型。

DeepSeek-R1-0528与之前的DeepSeek-R1使用同样的base模型,仅改进了后训练方法。私有化部署时只需要更新checkpoint和tokenizer_config.json(toolcalls相关变动)。模型参数为685B(其中14B为MTP层),开源版本上下文长度为128K(网页端、App和API提供64K上下文)。

免责声明:本文内容与数据由观点根据公开信息整理,不构成投资建议,使用前请核实。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
向佑发文感谢向佐,还好身后,永远站着亲大哥

向佑发文感谢向佐,还好身后,永远站着亲大哥

话娱论影
2026-06-29 10:44:09
世界杯:梅西“26米巨雕像”如没穿裤子惹议 大力神杯位置太尴尬

世界杯:梅西“26米巨雕像”如没穿裤子惹议 大力神杯位置太尴尬

环球趣闻分享
2026-06-29 14:33:10
男子称购买4瓶同款茅台重量不一,差距超60克,门店回应:总重并无官方统一标准,重量差异主要源于瓶身烧制工艺,换货需走正规鉴定流程

男子称购买4瓶同款茅台重量不一,差距超60克,门店回应:总重并无官方统一标准,重量差异主要源于瓶身烧制工艺,换货需走正规鉴定流程

潇湘晨报
2026-06-29 12:33:17
WTT大满贯战报:张本美和对阵申裕斌,3-0轻松取胜

WTT大满贯战报:张本美和对阵申裕斌,3-0轻松取胜

老塕是个手艺人
2026-06-29 09:31:44
丰田将"价格战"打到底,曾卖20多万,现降到13.18万起,抄底?

丰田将"价格战"打到底,曾卖20多万,现降到13.18万起,抄底?

触摸史迹
2026-06-29 00:41:13
中国最“穷”的6个铁饭碗行业:表面体面风光,实际工资低到想哭

中国最“穷”的6个铁饭碗行业:表面体面风光,实际工资低到想哭

一口娱乐
2026-06-28 15:10:19
百姓躺平摆烂,食税群体怎么办?

百姓躺平摆烂,食税群体怎么办?

律法刑道
2026-06-03 09:30:48
新疆一刚出生7天的小马被游客无人机追赶,狂奔躲避致炸肺死亡,牧民:当晚收到邻居提醒后赶去,小马已倒地不起,守了整整一夜还是没保住

新疆一刚出生7天的小马被游客无人机追赶,狂奔躲避致炸肺死亡,牧民:当晚收到邻居提醒后赶去,小马已倒地不起,守了整整一夜还是没保住

台州交通广播
2026-06-28 06:38:37
王毅绍伊古密谈90分钟,俄答应中国4个要求,日本最怕的事发生了

王毅绍伊古密谈90分钟,俄答应中国4个要求,日本最怕的事发生了

无悔的灿烂人生
2026-06-29 11:55:55
普京:俄建议乌俄双方均停止打击对方领土纵深目标

普京:俄建议乌俄双方均停止打击对方领土纵深目标

财联社
2026-06-29 05:03:07
悲催!一远嫁女子闹离婚求助,妈妈怒斥其当初不听劝,并转她5000

悲催!一远嫁女子闹离婚求助,妈妈怒斥其当初不听劝,并转她5000

火山詩话
2026-06-29 07:04:46
2026年湖南省14市州高考成绩及一分一段完整版

2026年湖南省14市州高考成绩及一分一段完整版

解说阿洎
2026-06-29 07:27:38
田中斗莉王:日本队正走在正确的道路上;日本巴西谁赢我都接受

田中斗莉王:日本队正走在正确的道路上;日本巴西谁赢我都接受

懂球帝
2026-06-29 05:45:08
全球公认的男性四大体能标准,15个俯卧撑才是合格门槛

全球公认的男性四大体能标准,15个俯卧撑才是合格门槛

解说阿洎
2026-06-17 18:15:51
明朝最悲惨的状元:“状元及第”4字刚送到家,皇帝就下令杀了他

明朝最悲惨的状元:“状元及第”4字刚送到家,皇帝就下令杀了他

云霄纪史观
2026-06-29 02:00:33
10万亿美债即将到期,中国拒绝购买,救美国就是救中方的时代结束

10万亿美债即将到期,中国拒绝购买,救美国就是救中方的时代结束

小陆搞笑日常
2026-06-29 03:24:10
原来他们是两口子,曾大红大紫却丁克一辈子,如今都住上海养老院

原来他们是两口子,曾大红大紫却丁克一辈子,如今都住上海养老院

叹为观止易
2026-06-28 05:42:57
纪实:退伍军人摆摊刺死城管被判死刑,律师的三连问,让法官改判

纪实:退伍军人摆摊刺死城管被判死刑,律师的三连问,让法官改判

五元讲堂
2024-10-30 12:29:40
穿越者再现?1977年猫王最后一场演出,观众手里竟有“手机”

穿越者再现?1977年猫王最后一场演出,观众手里竟有“手机”

Science科学说
2026-06-25 08:05:03
特斯拉新品正式上架,性价比太高以至于根本买不到!

特斯拉新品正式上架,性价比太高以至于根本买不到!

XCiOS俱乐部
2026-06-28 21:21:28
2026-06-29 16:19:00
观点机构 incentive-icons
观点机构
房地产行业权威专业全媒体
290034文章数 80631关注度
往期回顾 全部

科技要闻

OpenAI推迟上市,那“Kimi们”呢?

头条要闻

运-20最新大片片尾"彩蛋"提到的"小六"是谁 专家分析

头条要闻

运-20最新大片片尾"彩蛋"提到的"小六"是谁 专家分析

体育要闻

他和伊朗队,再次赢得全世界的尊重

娱乐要闻

萧蔷宣布捐出参加“浪姐”所有收入

财经要闻

35岁职场人,又好找工作了?

汽车要闻

全新宝马iX3长轴版将于成都车展预售 四季度交付

态度原创

时尚
亲子
教育
公开课
军事航空

伊姐周日热推:电视剧《千香》;电视剧《非份之罪》......

亲子要闻

爸爸让女儿当妈妈面说:爱爸爸不爱妈妈,谁知4岁女儿的做法绝了

教育要闻

第41课-买好票才能尽享游乐园快乐时光

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

普京最新发声:俄罗斯正处于命运攸关之际

无障碍浏览 进入关怀版