![]()
图源:视觉中国
文丨雅萱
编辑丨叶锦言
出品丨深网·腾讯新闻小满工作室
开年以来,关于DeepSeek-V4即将推出的传闻随着一纸公告尘埃落地。
4月24日上午,DeepSeek在官方微信号推出《DeepSeek-V4预览版:迈入百万上下文普惠时代》的文章,宣布全新系列模型DeepSeek-V4的预览版本正式上线并同步开源。
DeepSeek-V4分为两个版本:deepseek-v4-pro 版和deepseek-v4-flash版,前者主打“全能”, 在写代码、数学、科学竞赛方面,可以和国际上最顶尖的模型(如 Claude 4.5/4.6)掰掰手腕;后者主打“性价比”, 虽然知识量比Pro版少一点,但由于模型参数和激活更小,相较之下 V4-Flash 能够提供更加快捷、经济的API服务。
与DeepSeek V3.2正式版相比,DeepSeek-V4预览版主要有三大亮点:
一是1M(一百万)上下文从此成为 DeepSeek 所有官方服务的标配;
二是与 DeepSeek V3.2-Exp 相比,DeepSeek-V4 系列中的 Flash 版本定价大幅降低,输入成本减半。
其中,输入(缓存未命中)从(DeepSeek V3.2-Exp)2元降至(deepseek-v4-flash) 1元,降幅 50%;输入(缓存命中)保持 0.2元 不变;输出从 (DeepSeek V3.2-Exp)3元 降至( deepseek-v4-flash)2元,降幅 33%。
对于deepseek-v4-pro版价格,DeepSeek官方解释称,“受限于高端算力,目前Pro的服务吞吐十分有限,预计下半年昇腾950超节点批量上市后,Pro的价格会大幅下调。”
有消息称,DeepSeek V4姗姗来迟的原因之一是与国产芯片的深度适配。V4技术报告第3.1节专门写了一句:“我们在英伟达GPU和华为昇腾NPU两个平台上均验证了细粒度EP(专家并行)方案。”
![]()
三是DeepSeek-V4 针对 Claude Code 、OpenClaw、OpenCode、CodeBuddy等主流的 Agent 产品进行了适配和优化,在代码任务、文档生成任务等方面表现均有提升。也就是说,DeepSeek现在不仅能聊天,还针对自动写代码、自动做 PPT、自动处理文件等做了专项优化。
与DeepSeek-V4预览版发布的消息形成微妙对照的,是近期围绕DeepSeek融资的密集传闻。这家背靠幻方量化、自带造血能力的科技公司从未对外融资,创始人梁文锋曾多次公开表示“不缺钱、不融资”。
据多家媒体报道,DeepSeek正在与投资者洽谈首轮外部融资。对此,DeepSeek官方并未公开回复。
有行业人士分析称,如若融资消息为真,或出于两大核心考虑。
“一是应对日益激烈的大模型人才争夺战,通过引入外部融资为员工期权提供一个市场化的定价基准,是稳定核心团队、防止人才流失的关键举措,此前已有多位核心研究员流向小米、字节跳动等大厂;”
二是储备算力资源,大模型的研发与运营成本呈指数级增长,新筹集的资金将为采购和储备更多算力资源提供财力保障,确保在未来的技术竞赛中不掉队。”
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.