网易首页 > 网易号 > 正文 申请入驻

DeepSeek-R1模型完成小版本升级:思考更深,推理更强

0
分享至

新京报贝壳财经讯(记者罗亦丹)5月29日晚,DeepSeek官方微信公众号发文称,DeepSeek-R1模型已完成小版本升级,当前版本为DeepSeek-R1-0528。用户通过官方网站、APP 或小程序进入对话界面后,开启“深度思考”功能即可体验最新版本。API 也已同步更新,调用方式不变。

具体来看,DeepSeek-R1-0528 仍然使用 2024 年 12 月所发布的 DeepSeek V3 Base 模型作为基座,但在后续训练过程中投入了更多算力,显著提升了模型的思维深度与推理能力。更新后的R1模型在数学、编程与通用逻辑等多个基准测评中取得了当前国内所有模型中首屈一指的优异成绩,并且在整体表现上已接近其他国际顶尖模型,如o3与 Gemini-2.5-Pro。

相较于旧版 R1,新版模型在复杂推理任务中的表现有了显著提升。例如在 AIME 2025 测试中,新版模型准确率由旧版的 70% 提升至 87.5%。这一进步得益于模型在推理过程中的思维深度增强:在 AIME 2025 测试集上,旧版模型平均每题使用 12K tokens,而新版模型平均每题使用 23K tokens,表明其在解题过程中进行了更为详尽和深入的思考。

同时,蒸馏 DeepSeek-R1-0528 的思维链后训练Qwen3-8B Base,得到了 DeepSeek-R1-0528-Qwen3-8B。该 8B 模型在数学测试 AIME 2024 中仅次于 DeepSeek-R1-0528,超越 Qwen3-8B (+10.0%),与 Qwen3-235B 相当。“我们相信,DeepSeek-R1-0528 的思维链对于学术界推理模型的研究和工业界针对小模型的开发都将具有重要意义。”DeepSeek方面表示。

此外,新版 DeepSeek R1 针对“幻觉”问题进行了优化。与旧版相比,更新后的模型在改写润色、总结摘要、阅读理解等场景中,幻觉率降低了 45%~50% 左右,能够有效地提供更为准确、可靠的结果。

而在创意写作方面,在旧版R1的基础上,更新后的R1模型针对议论文、小说、散文等文体进行了进一步优化,能够输出篇幅更长、结构内容更完整的长篇作品,同时呈现出更加贴近人类偏好的写作风格。

最后,DeepSeek保持了一贯的开源做派,提供了相关模型的下载链接。

编辑 陈莉 校对 杨许丽

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
毫无征兆!卢卡申科突然访华只求中国能够给自己四个字!

毫无征兆!卢卡申科突然访华只求中国能够给自己四个字!

阿龙聊军事
2026-06-30 10:52:50
资本全跑了,演员排队找工作,中国电影怎么就走到这步了?

资本全跑了,演员排队找工作,中国电影怎么就走到这步了?

陈意小可爱
2026-06-28 14:55:24
涉案金额过亿 刘应成(原法名释永信)一审被判有期徒刑24年

涉案金额过亿 刘应成(原法名释永信)一审被判有期徒刑24年

每日经济新闻
2026-05-30 00:42:59
为何只要去浙江发展,不但自己,甚至连下一代都很难再回到故乡生活?

为何只要去浙江发展,不但自己,甚至连下一代都很难再回到故乡生活?

周哥一影视
2026-06-30 17:51:31
上半场封神 下半场崩盘!安帅1招击溃日本铁桶阵,巴西赢在教练!

上半场封神 下半场崩盘!安帅1招击溃日本铁桶阵,巴西赢在教练!

看透足球专栏
2026-06-30 03:57:30
家中查出20吨黄金真相大白后 赵本山近况曝出 儿子不争气 女儿惹

家中查出20吨黄金真相大白后 赵本山近况曝出 儿子不争气 女儿惹

阿伧说事
2026-06-29 19:41:49
安徽一女子在酒吧被陌生男子投放“伟哥”,警方不予立案,双方签署调解协议后男方赔偿1.3万元,女子回应:已撤销协议,正在走法律程序

安徽一女子在酒吧被陌生男子投放“伟哥”,警方不予立案,双方签署调解协议后男方赔偿1.3万元,女子回应:已撤销协议,正在走法律程序

大风新闻
2026-06-29 22:09:46
没有公告,卢卡申科紧急访华,普京有心无力,白俄只有中国能救?

没有公告,卢卡申科紧急访华,普京有心无力,白俄只有中国能救?

顾史
2026-06-30 02:21:37
A股:刚刚,大消息传来,释放一信号,明天将迎来更大级别的变盘

A股:刚刚,大消息传来,释放一信号,明天将迎来更大级别的变盘

云鹏叙事
2026-06-30 00:00:08
A股:大家要准备好下车了!主力已经明牌,周二将迎来更大的分化

A股:大家要准备好下车了!主力已经明牌,周二将迎来更大的分化

虎哥闲聊
2026-06-30 00:00:04
A股:两天反弹100点涨到4094,种种迹象表明,A股要迎来七月开门红?

A股:两天反弹100点涨到4094,种种迹象表明,A股要迎来七月开门红?

趋势清风侠
2026-06-30 15:28:47
土耳其总统公开呼吁摧毁以色列,内塔尼亚胡:要向特朗普告状!

土耳其总统公开呼吁摧毁以色列,内塔尼亚胡:要向特朗普告状!

青烟小先生
2026-06-30 19:32:22
温网高温规则揭秘:辛纳中暑退赛敲响警钟

温网高温规则揭秘:辛纳中暑退赛敲响警钟

坠入温柔晚风
2026-06-30 01:15:28
《生活大爆炸》演员们如今都当爸妈了!佩妮二胎、莱纳德儿女双全

《生活大爆炸》演员们如今都当爸妈了!佩妮二胎、莱纳德儿女双全

粉红冻奶的观影日记
2026-06-30 15:40:42
1天4个瓜!当街亲密、全网封禁,自曝怀双胎,赵丽颖最让人意外

1天4个瓜!当街亲密、全网封禁,自曝怀双胎,赵丽颖最让人意外

丁丁鲤史纪
2026-06-28 15:35:14
终于破案了!蚊子专挑你咬并非因为血型!真正原因很多人都搞错了

终于破案了!蚊子专挑你咬并非因为血型!真正原因很多人都搞错了

匹夫来搞笑
2026-06-28 18:22:47
42 岁 16 年老员工遇欧派裁员:管理层平稳转岗,中年打工人无路可退

42 岁 16 年老员工遇欧派裁员:管理层平稳转岗,中年打工人无路可退

时尚的弄潮
2026-06-30 20:13:55
我出差提前回家,本想给妻子一个惊喜,却发现她在家出轨

我出差提前回家,本想给妻子一个惊喜,却发现她在家出轨

千秋文化
2026-06-03 20:07:29
湖北一位复读生的亮眼成绩:去年高考633分复读一年奋力冲刺

湖北一位复读生的亮眼成绩:去年高考633分复读一年奋力冲刺

手工制作阿爱
2026-06-30 19:37:20
国际现货金银扩大跌幅

国际现货金银扩大跌幅

界面新闻
2026-06-30 09:06:04
2026-06-30 21:35:00
贝壳财经 incentive-icons
贝壳财经
新京报旗下财经品牌
66482文章数 14041关注度
往期回顾 全部

科技要闻

iPhone18 Pro遭泄密!印度代工商惹祸

头条要闻

日本队世界杯出局后 韩媒来劲了

头条要闻

日本队世界杯出局后 韩媒来劲了

体育要闻

大热倒灶压力给到法国 王楚揭法国队隐患

娱乐要闻

韩红称要退出公益,多位名人挽留

财经要闻

万亿“寒王”,历史时刻

汽车要闻

奇瑞风云A9探店 五个理由一定来看看

态度原创

时尚
亲子
手机
艺术
公开课

“复古波点”又流行回来了!夏天简单穿就很时髦

亲子要闻

✨闪闪小葵花 成长正当时✨ 「寻找闪亮小主角」才艺展示活动 表演现场高光集锦,见证萌娃的舞台魅力~

手机要闻

苹果疑似加大打击力度 iPhone 18 Pro泄露测试视频在社交平台迅速消失

艺术要闻

明代书坛的超级天才,仅用数年超越文徵明,随便一字被文人雅士视为至宝!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版