网易首页 > 网易号 > 正文 申请入驻

DeepSeek-R1模型完成小版本升级:思考更深,推理更强

0
分享至

新京报贝壳财经讯(记者罗亦丹)5月29日晚,DeepSeek官方微信公众号发文称,DeepSeek-R1模型已完成小版本升级,当前版本为DeepSeek-R1-0528。用户通过官方网站、APP 或小程序进入对话界面后,开启“深度思考”功能即可体验最新版本。API 也已同步更新,调用方式不变。

具体来看,DeepSeek-R1-0528 仍然使用 2024 年 12 月所发布的 DeepSeek V3 Base 模型作为基座,但在后续训练过程中投入了更多算力,显著提升了模型的思维深度与推理能力。更新后的R1模型在数学、编程与通用逻辑等多个基准测评中取得了当前国内所有模型中首屈一指的优异成绩,并且在整体表现上已接近其他国际顶尖模型,如o3与 Gemini-2.5-Pro。

相较于旧版 R1,新版模型在复杂推理任务中的表现有了显著提升。例如在 AIME 2025 测试中,新版模型准确率由旧版的 70% 提升至 87.5%。这一进步得益于模型在推理过程中的思维深度增强:在 AIME 2025 测试集上,旧版模型平均每题使用 12K tokens,而新版模型平均每题使用 23K tokens,表明其在解题过程中进行了更为详尽和深入的思考。

同时,蒸馏 DeepSeek-R1-0528 的思维链后训练Qwen3-8B Base,得到了 DeepSeek-R1-0528-Qwen3-8B。该 8B 模型在数学测试 AIME 2024 中仅次于 DeepSeek-R1-0528,超越 Qwen3-8B (+10.0%),与 Qwen3-235B 相当。“我们相信,DeepSeek-R1-0528 的思维链对于学术界推理模型的研究和工业界针对小模型的开发都将具有重要意义。”DeepSeek方面表示。

此外,新版 DeepSeek R1 针对“幻觉”问题进行了优化。与旧版相比,更新后的模型在改写润色、总结摘要、阅读理解等场景中,幻觉率降低了 45%~50% 左右,能够有效地提供更为准确、可靠的结果。

而在创意写作方面,在旧版R1的基础上,更新后的R1模型针对议论文、小说、散文等文体进行了进一步优化,能够输出篇幅更长、结构内容更完整的长篇作品,同时呈现出更加贴近人类偏好的写作风格。

最后,DeepSeek保持了一贯的开源做派,提供了相关模型的下载链接。

编辑 陈莉 校对 杨许丽

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
陈婷在庆功夜戴了半个亿的珠宝,光是那条宝格丽灵蛇项链就三千万

陈婷在庆功夜戴了半个亿的珠宝,光是那条宝格丽灵蛇项链就三千万

天马幸福的人生
2026-06-17 10:58:59
见证历史!单日诞生三个梅开二度!出线第6队诞生,法国丢掉榜首

见证历史!单日诞生三个梅开二度!出线第6队诞生,法国丢掉榜首

锐评利物浦
2026-06-23 10:22:52
塔帅太狠了!阿森纳 21 球夺冠功臣说弃就弃  1.3 亿砸世界杯神锋

塔帅太狠了!阿森纳 21 球夺冠功臣说弃就弃 1.3 亿砸世界杯神锋

澜归序
2026-06-23 07:34:52
郑丽文选在端午节发难!终究不是洪秀柱留给大陆的或许只有一条路

郑丽文选在端午节发难!终究不是洪秀柱留给大陆的或许只有一条路

猪猪爱影视
2026-06-23 05:13:31
澳门警察街头执行任务时突然被抢劫,九名男子一拥而上将其围堵,勒住脖子扇巴掌抢走手机,最新通报:涉案7人已被抓

澳门警察街头执行任务时突然被抢劫,九名男子一拥而上将其围堵,勒住脖子扇巴掌抢走手机,最新通报:涉案7人已被抓

极目新闻
2026-06-22 16:32:57
某公司为女员工发了超短裙工装

某公司为女员工发了超短裙工装

微微热评
2026-06-23 12:23:56
我国越来越多的人患脑梗?建议:停止食用“4物”,保护大脑

我国越来越多的人患脑梗?建议:停止食用“4物”,保护大脑

路医生健康科普
2026-06-12 16:20:20
世界杯历史射手王,为何不再遥不可及?

世界杯历史射手王,为何不再遥不可及?

足球报
2026-06-22 13:06:30
郭斌发文阴阳王励勤,说乒协没打招呼就动了他那块地盘。 不是因为他说自己亏本经营替国乒兜底。

郭斌发文阴阳王励勤,说乒协没打招呼就动了他那块地盘。 不是因为他说自己亏本经营替国乒兜底。

乒乓网国球汇
2026-06-23 02:31:09
以色列开战以来最惨重创!王牌36师师部被精准斩首,高级军官团灭

以色列开战以来最惨重创!王牌36师师部被精准斩首,高级军官团灭

扬子的故事屋
2026-06-22 13:52:48
罗马诺:费尔明点赞罗马诺关于阿尔瓦雷斯的动态

罗马诺:费尔明点赞罗马诺关于阿尔瓦雷斯的动态

懂球帝
2026-06-23 07:10:17
郭碧婷婆婆太厉害了!69岁向太半年瘦20斤,穿印花裙美得像50出头

郭碧婷婆婆太厉害了!69岁向太半年瘦20斤,穿印花裙美得像50出头

小疯子耶
2026-06-23 11:27:58
深观察 | 脱欧十年 英国为何总在换首相?

深观察 | 脱欧十年 英国为何总在换首相?

国际在线
2026-06-23 08:15:08
全球破19亿,北美夺冠,中国票房仅37.2万,观众给好莱坞上了一课

全球破19亿,北美夺冠,中国票房仅37.2万,观众给好莱坞上了一课

靠谱电影君
2026-06-22 17:02:52
明明是“半吊子”,还敢装资深导师,《歌手》撕碎了这两位的体面

明明是“半吊子”,还敢装资深导师,《歌手》撕碎了这两位的体面

洲洲影视娱评
2026-06-22 21:20:55
所谓的爱情本质是肉体吸引,跟精神或者灵魂没有半点关系

所谓的爱情本质是肉体吸引,跟精神或者灵魂没有半点关系

加油丁小文
2026-06-07 11:00:11
冯小刚张艺谋都拼不过?大导演大制作的时代,看来真的要翻篇了

冯小刚张艺谋都拼不过?大导演大制作的时代,看来真的要翻篇了

小椰的奶奶
2026-06-23 11:10:58
西地那非立大功!研究发现:老人吃西地那非,或能缓解 5 种症状

西地那非立大功!研究发现:老人吃西地那非,或能缓解 5 种症状

垚垚分享健康
2026-06-23 10:53:17
地球真的生病了!塔克拉玛干沙漠边缘发洪,当地人:这辈子没见过

地球真的生病了!塔克拉玛干沙漠边缘发洪,当地人:这辈子没见过

哄动一时啊
2026-06-22 19:28:35
6月23日,2026年养老金调整通知还公布,今年到底还涨不涨?

6月23日,2026年养老金调整通知还公布,今年到底还涨不涨?

小彬说事
2026-06-23 08:45:02
2026-06-23 13:11:00
贝壳财经 incentive-icons
贝壳财经
新京报旗下财经品牌
66162文章数 14039关注度
往期回顾 全部

科技要闻

48名中国开发者联名举报苹果

头条要闻

公安局原副局长出狱后公开举报信访局长 最新进展来了

头条要闻

公安局原副局长出狱后公开举报信访局长 最新进展来了

体育要闻

哈兰德国家队52场59球 世界杯狂刷6大纪录

娱乐要闻

喜剧大师曝光肖战拍戏状态!

财经要闻

智谱万亿市值,国产Anthropic真来了?

汽车要闻

华为智驾ADS限时优惠月底结束 7月1日前下订立省3000元

态度原创

家居
房产
健康
游戏
公开课

家居要闻

绿意盎然 自然之境

房产要闻

一年时间,36个盘“消失”!海口楼市,罕见“大收缩”!

粽子还没吃完?专家教你“清库存”

《桌面伴侣》新DLC发布 虚拟偶像鼻祖智障爱登场

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版