3 月 25 日,深度求索宣布DeepSeek-V3 模型发布小版本更新,版本号升级为 DeepSeek-V3-0324。此次更新在推理任务表现、前端开发能力、中文写作、中文搜索能力等方面均有显著提升。
其中推理任务借鉴 DeepSeek-R1 模型训练中的强化学习技术,推理能力大幅提高,在数学、代码类评测集上得分超过 GPT-4.5。
前端开发方面,HTML 等代码生成的可用性、视觉效果和设计感显著增强,可生成赛博朋克风格的 HTML 页面。
中文写作方面,基于 R1 模型进一步优化,中长篇文本创作质量提升。
中文搜索方面,联网搜索场景下,报告生成类指令输出更详实、排版更清晰。
此外,模型在工具调用、角色扮演、问答闲聊等方面也有所提升。DeepSeek-V3-0324 模型参数约 660B,开源版本上下文长度为 128K(网页端、App 和 API 提供 64K 上下文),模型权重已在 ModelScope 和 Huggingface 平台开放下载,采用 MIT License 授权。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.