5月29日消息,在官宣“小版本更新”并开源新模型之后。晚间,DeepSeek 终于官宣。
官方表示其旗下旗舰模型 DeepSeek-R1完成小版本更新,版本号升级为 DeepSeek-R1-0528。新版本已在官网、App、小程序及 API 全面上线,用户启用“深度思考”功能后即可体验。
本次升级,主要集中在模型的深度思考能力的强化、幻觉的改善,以及创意写作方面。
官方表示,DeepSeek-R1-0528依旧基于 DeepSeek V3 Base 模型构建,但在后训练阶段投入更多算力,使其在数学、编程、逻辑推理等任务中表现大幅提升。
官方数据显示,新版模型在复杂数学测评 AIME 2025中的准确率由原来的70% 提升至87.5%。平均每题推理使用 token 数从12K 提高到23K,显著表明其在“深度思考”过程中的路径更长、分析更细。
DeepSeek-R1-0528在各项评测集上均取得了优异表现
围绕“思维链”技术,DeepSeek 还将 R1-0528的推理路径蒸馏至 Qwen3-8B Base 模型,推出小模型 DeepSeek-R1-0528-Qwen3-8B,在 AIME 2024中表现超越 Qwen3-8B,逼近 Qwen3-235B,验证了高质量推理链的通用性与迁移能力。
在文本生成方面,R1-0528优化了议论文、小说、散文等写作能力,能输出更长、更符合人类偏好的长篇内容。同时,幻觉率下降45~50%,在改写、总结、理解等场景中输出更为精准。
此外,R1-0528还支持工具调用。在 Tau-Bench 测评中,其工具调用能力已与 OpenAI o1-high 相当。前端代码生成、网页开发、角色扮演等能力也都有更新。(袁宁)