网易首页 > 网易号 > 正文 申请入驻

DeepSeek官宣R1升级:提升思维深度与推理能力,整体表现已接近国际顶尖模型

0
分享至

国产大模型公司深度求索(DeepSeek)发布详细的升级公告,解释DeepSeek-R1升级的具体情况。

5月29日,据DeepSeek公告,DeepSeek R1模型已完成小版本升级,当前版本为DeepSeek-R1-0528。用户通过官方网站、APP或小程序进入对话界面后,开启“深度思考”功能即可体验最新版本。API也已同步更新,调用方式不变。

公告指出,DeepSeek-R1-0528使用2024年12月所发布的DeepSeek V3 Base模型作为基座,但在后训练过程中投入了更多算力,显著提升模型的思维深度与推理能力。更新后的R1模型在数学、编程与通用逻辑等多个基准测评中取得当前国内所有模型中首屈一指的优异成绩,并且在整体表现上已接近其他国际顶尖模型,如o3与Gemini-2.5-Pro。

相较于旧版R1,新版模型在复杂推理任务中的表现有显著提升。例如在AIME2025测试中,新版模型准确率由旧版的70%提升至87.5%。这一进步得益于模型在推理过程中的思维深度增强:在AIME2025测试集上,旧版模型平均每题使用12K tokens,而新版模型平均每题使用23Ktokens,表明其在解题过程中进行了更为详尽和深入的思考。

DeepSeek表示,DeepSeek-R1-0528的思维链对于学术界推理模型的研究和工业界针对小模型的开发都将具有重要意义。

新版DeepSeek R1针对“幻觉”问题进行了优化。与旧版相比,更新后的模型在改写润色、总结摘要、阅读理解等场景中,幻觉率降低45-50%左右,能够有效地提供更为准确、可靠的结果。

在旧版R1的基础上,更新后的R1模型针对议论文、小说、散文等文体进行进一步优化,能够输出篇幅更长、结构内容更完整的长篇作品,同时呈现出更加贴近人类偏好的写作风格。

据公告称,当前模型的测评成绩与OpenAI o1-high相当,但与o3-High以及Claude4 Sonnet仍有差距。

此次 R1更新后,官方网站、小程序、App端和API中的模型上下文长度仍为64K。如果用户对更长的上下文长度有需求,可以通过其他第三方平台调用上下文长度为128K的开源版本R1-0528模型。与旧版本的DeepSeek-R1保持一致,此次升级仍为开源模型,允许用户利用模型输出、通过模型蒸馏等方式训练其他模型。

此前5月28日,DeepSeek在官方微信群发布消息称,DeepSeekR1模型已完成“小版本试升级”,欢迎前往官方网页、APP、小程序测试(打开深度思考),API接口和使用方式保持不变。

据网友测评显示,此次升级效果令人惊艳。从社交媒体的反馈来看,网友最为关注的是此次DeepSeekR1更新后的思考时间变长。据测评显示,此次DeepSeek单任务处理时长可达30-60分钟。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
全球仅此一瓶!14日晚8点上京东拍卖,竞拍2026号五粮液大力神杯酒

全球仅此一瓶!14日晚8点上京东拍卖,竞拍2026号五粮液大力神杯酒

封面新闻
2026-06-14 16:44:05
开封男童已丢3天!2个致命噩耗曝光,难怪警犬无人机全找不到线索

开封男童已丢3天!2个致命噩耗曝光,难怪警犬无人机全找不到线索

奇思妙想草叶君
2026-06-13 21:40:23
太沉重了!一张殡仪馆的电子显示屏8位逝者,有6人未能活到55岁

太沉重了!一张殡仪馆的电子显示屏8位逝者,有6人未能活到55岁

火山詩话
2026-06-12 08:54:20
美论坛:如果中国发电量真的世界第一,为什么夜晚却没有印度亮?

美论坛:如果中国发电量真的世界第一,为什么夜晚却没有印度亮?

混沌录
2026-06-14 22:20:09
遭赖瑞隆指控家人全在美国, 柯志恩回呛:怎不质疑赖清德蔡英文?

遭赖瑞隆指控家人全在美国, 柯志恩回呛:怎不质疑赖清德蔡英文?

海峡导报社
2026-06-14 14:50:23
男友花94500元买“全国仅两只”LV鸵鸟皮包作为生日礼物,女友发现有色差,搜索后疑是“展销品”,要求退款遭拒

男友花94500元买“全国仅两只”LV鸵鸟皮包作为生日礼物,女友发现有色差,搜索后疑是“展销品”,要求退款遭拒

扬子晚报
2026-06-14 11:57:05
十二星座智商指数排行榜前三名

十二星座智商指数排行榜前三名

星座不求人
2026-06-14 20:22:25
凌晨0:00,重大预告,周一6:00将载入史册

凌晨0:00,重大预告,周一6:00将载入史册

新浪财经
2026-06-14 07:13:33
都 2026 年了,你还会选择油车吗?看网友评论:引起万千共鸣

都 2026 年了,你还会选择油车吗?看网友评论:引起万千共鸣

另子维爱读史
2026-06-11 07:56:18
18岁被王全安选中,20岁登戛纳,后来为啥没人敢用她?

18岁被王全安选中,20岁登戛纳,后来为啥没人敢用她?

不似少年游
2026-05-21 14:26:19
美专家曾说:若中国武统,西方可冻结3.2万亿中国资产!

美专家曾说:若中国武统,西方可冻结3.2万亿中国资产!

果妈聊娱乐
2026-05-28 18:57:51
比亚迪大汉高清实拍!5米25车长-奔驰S都得让座

比亚迪大汉高清实拍!5米25车长-奔驰S都得让座

网上车市
2026-06-13 02:49:10
金泽和钙子大佬的瓜!

金泽和钙子大佬的瓜!

八卦疯叔
2026-06-14 10:33:45
暨南大学硕市论文题目惊呆国人,终于知道为啥文科就业差了…

暨南大学硕市论文题目惊呆国人,终于知道为啥文科就业差了…

慧翔百科
2026-06-12 08:19:04
国行 iPhone 可强开 Siri AI 程序

国行 iPhone 可强开 Siri AI 程序

简科技
2026-06-14 12:09:00
人不会平白无故患带状疱疹!医生强调:得带状疱疹,多半有3共性

人不会平白无故患带状疱疹!医生强调:得带状疱疹,多半有3共性

39健康网
2026-06-12 20:16:42
“墨西哥持枪抢劫中国球迷案”1名嫌疑人落网,当事人:除手机外财物被抢光,无心看球已提前回国

“墨西哥持枪抢劫中国球迷案”1名嫌疑人落网,当事人:除手机外财物被抢光,无心看球已提前回国

极目新闻
2026-06-14 12:59:31
太疯狂了!1200个包裹堆爆西安酒店大堂,大马旅行团旅游网购上瘾

太疯狂了!1200个包裹堆爆西安酒店大堂,大马旅行团旅游网购上瘾

火山詩话
2026-06-14 06:42:50
泰勒·斯威夫特场边嘶吼自证尼克斯球迷,ESPN解说却嘲“她不是”:婚礼定在7月3日?

泰勒·斯威夫特场边嘶吼自证尼克斯球迷,ESPN解说却嘲“她不是”:婚礼定在7月3日?

快乐加载中21
2026-06-12 01:44:15
四连板!002971,澄清不实传闻!

四连板!002971,澄清不实传闻!

证券时报e公司
2026-06-14 20:44:29
2026-06-15 00:03:00
澎湃新闻 incentive-icons
澎湃新闻
专注时政与思想的新闻平台。
906249文章数 5092476关注度
往期回顾 全部

科技要闻

Anthropic最强模型被禁,传亚马逊通风报信

头条要闻

展会商品扫码后跳转至“涉黄网站” 多方回应

头条要闻

展会商品扫码后跳转至“涉黄网站” 多方回应

体育要闻

8年8队夺冠,邓肯那句话,现在还给了马刺

娱乐要闻

邓超携子观战NBA,等等帅气十足

财经要闻

金价跌至900元关口,大妈又来抄底了!

汽车要闻

综合续航超1600km/零百加速4秒级 2027款星途ES预售18.99万起

态度原创

教育
时尚
游戏
家居
本地

教育要闻

中考结束,但人生的无限可能才刚刚开始

绝望的直女:如何厌男又爱男?

逆天BUG秒赚上亿!《地平线6》紧急关闭吃鸡模式

家居要闻

空间微调 移形换境

本地新闻

AK刘彰邂逅河北南大港湿地

无障碍浏览 进入关怀版