DeepSeekR1幻觉率最高降低50%，用户喊话想要R2模型|推理|上下文|大模型|深度思考模型

DeepSeekR1幻觉率最高降低50%，用户喊话想要R2模型

分享至

在开源平台HuggingFace上发布R1模型的更新后，5月29日晚，DeepSeek终于发布了官方公告介绍这次版本的具体能力迭代细节，其中包括深度思考能力强化、幻觉改善和创意写作更好等。

在测评数据上，官方表示，更新后的R1模型在数学、编程与通用逻辑等多个基准测评中取得了当前国内所有模型中首屈一指的成绩，并且在整体表现上已接近其他国际顶尖模型，如 o3 与 Gemini-2.5-Pro。

值得一提的是，DeepSeek提到，新版DeepSeek R1 针对“幻觉”问题进行了优化。与旧版相比，更新后的模型在改写润色、总结摘要、阅读理解等场景中，幻觉率降低了 45%-50% 左右，能够提供更为准确可靠的结果。

所谓幻觉即大模型的“胡说八道”，此前DeepSeek的幻觉率并不低，也被不少用户和开发者所讨论。5月15日，SuperCLUE曾发布最新一轮中文大模型忠实性幻觉测评结果，显示此前的DeepSeek-R1模型幻觉率在21%左右，在测评的国内模型中排名第五。

据SuperCLUE，推理模型的幻觉比非推理模型更显著，在他们的测评中推理模型的平均幻觉率为22.95%，非推理模型的平均幻觉率为13.52%。

除了幻觉方面的改善，官方介绍，新R1模型在复杂推理任务中的表现有了显著提升。例如在 AIME 2025 测试（一个数学基准测试，用于模型在数学推理方面的能力）中，新版模型准确率由旧版的70%提升至87.5%。

此外，更新后的 R1 模型针对议论文、小说、散文等文体进行了进一步优化，能够输出篇幅更长、结构内容更完整的长篇作品，同时呈现出更加贴近人类偏好的写作风格。

在官方发文之前，众多测试表明R1新模型的代码能力有显著提升，在代码测试平台Live CodeBench中，其性能几乎媲美OpenAI重量级的o3-high模型。官方此次公告也提到，在前端代码生成、角色扮演等领域，模型的能力确实均有更新和提升。

在迭代路径上，DeepSeek表示，DeepSeek-R1-0528 仍然使用 2024 年12月所发布的DeepSeek V3 Base模型作为基座，但在后训练过程中投入了更多算力，显著提升了模型的思维深度与推理能力。

本次R1新模型参数为 685B，开源版本上下文长度为 128K（网页端、App 和 API 提供 64K 上下文）。同时，与旧版本的R1保持一致，此次开源模型权重仍然统一采用 MIT License，允许用户利用模型输出、通过模型蒸馏等方式训练其他模型。

有趣的是，在X平台DeepSeek的官方评论区中，讨论的话题全都关于R2模型，“We want R2（我们想要R2模型）”，有用户评论称。业界对DeepSeek下一代的模型期待已久。

基于DeepSeek刚刚发布了更新，有用户猜测，“是否意味着我们暂时不会听到有关R2的消息？”也有用户调侃称，这一模型或许在开发中应该是R2，但是当他们发现在基准测试中没有超越OpenAI的o3 时，DeepSeek将其重新命名为R1的更新。

一向低调的DeepSeek并未对外界的猜测进行任何回应，基于R1是在V3模型的基础上训练的，或许我们会先等到V4模型的更新。无论如何，海内外大模型领域的基座模型大战还在继续，DeepSeek之后，谁会是下一家？

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

手机 / 数码

房产 / 家居

DeepSeekR1幻觉率最高降低50%，用户喊话想要R2模型

美团发布外卖大战后成绩单：亏损超200亿

特朗普：伊朗允许10艘油轮通行霍尔木兹海峡

特朗普：伊朗允许10艘油轮通行霍尔木兹海峡

申京努力了，然而杜兰特啊

刘晓庆妹妹发声！称姐姐受身边人挑拨

油价"驯服"特朗普？一到100美元就TACO

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

救命，这只酱板鸭已经在我手机复仇了一万遍

河南开封万岁山武侠城，游客买300元门票：给妻子拍照被保安阻拦

400万人爱过的女孩，被黄谣网暴180天后

担心特朗普突然停战 以总理下令48小时尽力摧毁伊设施

担心特朗普突然停战以总理下令48小时尽力摧毁伊设施