![]()
4月24日,深度求索公司正式上线并开源DeepSeek-V4预览版。该模型具备百万字超长上下文能力,在智能体、世界知识和推理性能上实现国内与开源领域领先,标志大模型长文本处理进入新纪元。
DeepSeek-V4系列包含两个版本:参数1.6万亿的DeepSeek-V4-Pro和参数2840亿的DeepSeek-V4-Flash。两者均基于超大规模预训练数据,并将百万上下文作为标准配置。
性能方面,DeepSeek-V4-Pro展现出世界顶级水平。官方评测显示,其在Agentic Coding评测中达开源模型最佳水平,使用体验优于Claude 3.5 Sonnet,交付质量接近GPT-4o Opus非思考模式。在知识推理、数学、STEM和竞赛型代码测评中,V4-Pro超越所有已公开评测的开源模型,成绩比肩顶级闭源模型。
技术突破在于全新注意力机制,通过token维度压缩结合DSA稀疏注意力,实现全球领先的长上下文处理能力,同时大幅降低计算资源和显存需求。
模型针对Agent能力专项优化,深度适配Claude Code、OpenClaw等主流产品,在代码任务、文档生成方面表现显著提升。官方示例显示,V4-Pro能生成包含复杂数据表格、营销策略和排期规划的完整PPT方案。
DeepSeek API已同步支持V4-Pro与V4-Flash,兼容OpenAI ChatCompletions和Anthropic接口。定价为:V4-Pro输入每百万token 12元,输出24元;V4-Flash输入每百万token 1元,输出2元。受限于高端算力,Pro版本服务吞吐量有限,预计下半年昇腾950超节点批量上市后价格将大幅下调。
深度求索已在Hugging Face和ModelScope平台开源DeepSeek-V4模型权重并发布技术报告。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.