网易首页 > 网易号 > 正文 申请入驻

DeepSeek-R1模型完成小版本升级:思考更深,推理更强

0
分享至

新京报贝壳财经讯(记者罗亦丹)5月29日晚,DeepSeek官方微信公众号发文称,DeepSeek-R1模型已完成小版本升级,当前版本为DeepSeek-R1-0528。用户通过官方网站、APP 或小程序进入对话界面后,开启“深度思考”功能即可体验最新版本。API 也已同步更新,调用方式不变。

具体来看,DeepSeek-R1-0528 仍然使用 2024 年 12 月所发布的 DeepSeek V3 Base 模型作为基座,但在后续训练过程中投入了更多算力,显著提升了模型的思维深度与推理能力。更新后的R1模型在数学、编程与通用逻辑等多个基准测评中取得了当前国内所有模型中首屈一指的优异成绩,并且在整体表现上已接近其他国际顶尖模型,如o3与 Gemini-2.5-Pro。

相较于旧版 R1,新版模型在复杂推理任务中的表现有了显著提升。例如在 AIME 2025 测试中,新版模型准确率由旧版的 70% 提升至 87.5%。这一进步得益于模型在推理过程中的思维深度增强:在 AIME 2025 测试集上,旧版模型平均每题使用 12K tokens,而新版模型平均每题使用 23K tokens,表明其在解题过程中进行了更为详尽和深入的思考。

同时,蒸馏 DeepSeek-R1-0528 的思维链后训练Qwen3-8B Base,得到了 DeepSeek-R1-0528-Qwen3-8B。该 8B 模型在数学测试 AIME 2024 中仅次于 DeepSeek-R1-0528,超越 Qwen3-8B (+10.0%),与 Qwen3-235B 相当。“我们相信,DeepSeek-R1-0528 的思维链对于学术界推理模型的研究和工业界针对小模型的开发都将具有重要意义。”DeepSeek方面表示。

此外,新版 DeepSeek R1 针对“幻觉”问题进行了优化。与旧版相比,更新后的模型在改写润色、总结摘要、阅读理解等场景中,幻觉率降低了 45%~50% 左右,能够有效地提供更为准确、可靠的结果。

而在创意写作方面,在旧版R1的基础上,更新后的R1模型针对议论文、小说、散文等文体进行了进一步优化,能够输出篇幅更长、结构内容更完整的长篇作品,同时呈现出更加贴近人类偏好的写作风格。

最后,DeepSeek保持了一贯的开源做派,提供了相关模型的下载链接。

编辑 陈莉 校对 杨许丽

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
英媒:佛得角打进淘汰赛获1100万美元奖金,相当于该国GDP的0.3%

英媒:佛得角打进淘汰赛获1100万美元奖金,相当于该国GDP的0.3%

懂球帝
2026-07-04 17:45:09
张雪称负债将近1亿!这个月就不是亿万“负”翁了,股份卖给顶级资本,“再也不欠钱了”,“努力干,它会变成10个亿”

张雪称负债将近1亿!这个月就不是亿万“负”翁了,股份卖给顶级资本,“再也不欠钱了”,“努力干,它会变成10个亿”

每日经济新闻
2026-07-05 00:02:35
卫冕失败!斯瓦泰克0-2爆冷遭伊埃拉横扫无缘16强 终结温网9连胜

卫冕失败!斯瓦泰克0-2爆冷遭伊埃拉横扫无缘16强 终结温网9连胜

醉卧浮生
2026-07-04 22:52:29
最新报告:全国每100户家庭中 就有一户净资产超600万!

最新报告:全国每100户家庭中 就有一户净资产超600万!

叶初七
2026-07-04 09:44:35
郑伊健路边摊被偶遇,头发稀疏,49岁蒙嘉慧认不出!

郑伊健路边摊被偶遇,头发稀疏,49岁蒙嘉慧认不出!

手工制作阿歼
2026-07-04 17:48:15
挥泪斩马谡!皇马同意,亿元先生转投曼联!1.8亿“顶星”空降

挥泪斩马谡!皇马同意,亿元先生转投曼联!1.8亿“顶星”空降

头狼追球
2026-07-04 17:34:56
13轮不败!中超:西海岸2-1十人海港,万涛连吹4球+张源染红

13轮不败!中超:西海岸2-1十人海港,万涛连吹4球+张源染红

乒烧泳球
2026-07-04 21:27:30
俄总统新闻秘书:普京宣布俄军“完全解放”卢甘斯克

俄总统新闻秘书:普京宣布俄军“完全解放”卢甘斯克

财联社
2026-07-04 04:41:06
中年少妇现在都在擦边直播…

中年少妇现在都在擦边直播…

微微热评
2026-07-04 12:47:33
2020年佛得角废除了体育总局,然后……

2020年佛得角废除了体育总局,然后……

熊太行
2026-07-04 11:01:14
哈梅内伊葬礼暗藏杀机,中方到场装上“防弹玻璃”!

哈梅内伊葬礼暗藏杀机,中方到场装上“防弹玻璃”!

健身狂人
2026-07-04 12:51:06
赛格最初创始人公开举报西安赛格:赵贵亲口说,我拿着你的钱跟你打官司,耗死你,你能搞的过我?

赛格最初创始人公开举报西安赛格:赵贵亲口说,我拿着你的钱跟你打官司,耗死你,你能搞的过我?

贴小君
2026-07-04 13:12:59
库兹马炮轰NBA工资帽:下个CBA是球员生死时刻

库兹马炮轰NBA工资帽:下个CBA是球员生死时刻

绿茵狂热者
2026-07-05 01:24:00
世界杯16强全出炉!欧洲7队+南美4强 1/8决赛对阵确定:3场焦点战

世界杯16强全出炉!欧洲7队+南美4强 1/8决赛对阵确定:3场焦点战

我爱英超
2026-07-04 11:34:18
空袭惨烈!乌克兰第二大城市被炸成废墟,俄军接连拿下关键阵地!

空袭惨烈!乌克兰第二大城市被炸成废墟,俄军接连拿下关键阵地!

青青衫书生
2026-07-02 23:23:10
苹果拒绝给印度交380亿罚款,印度一气将苹果630G机密数据泄露

苹果拒绝给印度交380亿罚款,印度一气将苹果630G机密数据泄露

流苏晚晴
2026-07-04 19:02:39
赛后被对手索要球衣,梅西打趣:在场上他们把我踢得够呛

赛后被对手索要球衣,梅西打趣:在场上他们把我踢得够呛

懂球帝
2026-07-04 19:09:03
6月领土收益继续为负,伤亡却暴增19倍!南线两万俄军要投降?

6月领土收益继续为负,伤亡却暴增19倍!南线两万俄军要投降?

鹰眼Defence
2026-07-04 16:22:34
佛得角门神沃齐尼亚父母赴美观赛:温州商人帮他们如愿

佛得角门神沃齐尼亚父母赴美观赛:温州商人帮他们如愿

海右那人
2026-07-04 16:13:07
柬埔寨电诈头目竟然是安徽商会会长,从300元草根逆袭到11亿电诈魔王

柬埔寨电诈头目竟然是安徽商会会长,从300元草根逆袭到11亿电诈魔王

杭城村叔
2026-07-04 13:02:27
2026-07-05 01:55:00
新京报 incentive-icons
新京报
好新闻,无止境
584668文章数 2508896关注度
往期回顾 全部

科技要闻

韬定律论文V2版,充工程细节和实测数据

头条要闻

老人被一次拔12颗牙种10颗:能刷的钱都刷走 只剩30块

头条要闻

老人被一次拔12颗牙种10颗:能刷的钱都刷走 只剩30块

体育要闻

揭法国锋线最大优势 有人比姆巴佩还快?

娱乐要闻

白鹿打戏抠图惹非议 连累丞磊遭扒皮

财经要闻

韩国股市杠杆失控:450亿美元资金狂飙

汽车要闻

方程豹钛9内饰曝光 用上了长联屏设计/下半年上市

态度原创

教育
旅游
时尚
房产
数码

教育要闻

参考!2026年高考分数对应2025年同位分!

旅游要闻

取名全靠一条溪,玉溪秀溪村藏滇中绝美田园,一年四季风景不重样

别再说"露肩衣服 "难驾驭!看看这几组日常穿搭,大方有回头率

房产要闻

总裁空缺17个月、现金缺口超1000亿:金融局“局外人”入局万科

数码要闻

苏姿丰签名同款!极摩客EVO-X3 AI工作站全球开卖:国行版21699元起

无障碍浏览 进入关怀版