网易首页 > 网易号 > 正文 申请入驻

停更近五个月,这次梁文锋携DeepSeek V4绝地反击?黄仁勋都觉得“可怕”

0
分享至

本文来源:时代财经 作者:庞宇 林心林


图源:AI生图

蛰伏近5个月,DeepSeek终于迎来新一轮重磅迭代。

4月24日,DeepSeek-V4 Preview正式上线并开源,该版本分为Pro和Flash两款,分别对应官方网页端、App界面的专家模式与快速模式。

从技术迭代方向来看,DeepSeek-V4 在模型参数体量与实际能力上实现不小突破。

DeepSeek官方测评显示,V4-Pro在Agentic Coding、世界知识、数学、STEM和竞赛级代码等测评中,达到当前开源模型领先水平,并在部分指标上比肩顶尖闭源模型。

此次备受关注的V4版本发布,较市场此前预期的“春节前后”节点晚了数月。而在这段时间里,大模型行业竞争空前激烈,部分大模型甚至以“月更”为节奏高频持续上新,DeepSeek却一直悄无声息。

这家凭借低成本、高性能和开源打出辨识度的明星大模型企业,则一边因新模型“停更”“跳票”身陷舆论讨论,一边又被卷入人才流动和融资传闻。

时代财经注意到,深度求索官方在DeepSeek-V4官宣文稿末尾,特意援引了《荀子·非十二子》的名句“不诱于誉,不恐于诽,率道而行,端然正己。”这十六个字表述,似乎是其对近期外界种种声音作出的间接回应。

V4姗姗来迟,在华为昇腾平台首发

“从现在开始,1M上下文将是DeepSeek所有官方服务的标配。”深度求索方面介绍,DeepSeek-V4模型按大小分为DeepSeek-V4-Pro、DeepSeek-V4-Flash两个版本,上下文长度均为1M(一百万)。

长上下文能力已非大模型行业的新鲜事。过去一年,国内外头部模型厂商几乎都在持续拉长上下文窗口。V4更受关注的,是其通过结构创新实现推理成本大幅降低。

DeepSeek在官方文章中表示,V4开创了一种全新的注意力机制,在token维度进行压缩,结合DSA稀疏注意力(DeepSeek Sparse Attention),既实现全球领先的长上下文能力,又相较于传统方法大幅降低了对计算和显存的需求。

而V4更大的亮点在于Agent能力的显著提高。

在Agentic Coding评测中,V4-Pro已达到当前开源模型最佳水平。“目前DeepSeek-V4已成为公司内部员工使用的Agentic Coding模型,据评测反馈使用体验优于Sonnet 4.5,交付质量接近Opus 4.6非思考模式,但仍与其思考模式存在一定差距。”

在世界知识测评中,V4-Pro大幅领先其他开源模型,仅稍逊于顶尖闭源模型Gemini-Pro-3.1。此外,在数学、STEM、竞赛型代码的测评中,V4-Pro超越当前所有已公开评测的开源模型,取得了比肩世界顶级闭源模型的成绩。

不过,DeepSeek也坦言,在推理能力上,V4-Pro-Max与最先进的前沿模型仍存在3至6个月的差距。


图源:DeepSeek-V4技术报告

时代财经注意到,DeepSeek-V4在海内外全网更新后,迅速在海外开发者社区和技术圈引起热议。

不少网友对于DeepSeek此次更新给出积极反馈,有评价称其几乎是“这个领域里相当彻底的开源”,开发者文档完善、价格“低得惊人”,同时却具备接近前沿模型的能力;也有用户直言,模型质量与价格相比是一笔“疯狂划算的交易”。

实际上,DeepSeek V4的登场比市场预期晚了许多。

早在今年初,就有消息传出DeepSeek-V4将在春节前后发布,一时间业内讨论度升温。但之后,市场几番猜测又频频落空。直至4月24日正式亮相,较上一轮模型更新(DeepSeek-V3.2)已间隔近5个月。

值得注意的是,对于此前外界猜测的延迟发布与底层代码重写、适配国产芯片有关的传闻,本次DeepSeek-V4技术报告给出了侧面印证。

时代财经注意到,深度求索罕见地将华为昇腾和英伟达写进DeepSeek-V4技术报告:“我们在英伟达GPU和华为昇腾NPU平台上验证了细粒度EP(专家并行)方案。”

华为官方也发布信息称,DeepSeek-V4在昇腾首发,昇腾超节点全系列产品支持DeepSeek V4系列模型。

这一算力适配的选择,或将引来全球科技行业的震动。长期以来,全球AI算力的技术体系与产业生态,基本围绕英伟达的技术路线构建,其CUDA生态不仅为模型开发提供了成熟的工具支撑,更已成为行业内通用的AI计算标准接口。

如今,DeepSeek-V4选择在华为昇腾平台首发,无疑打破了这一长期固化的算力生态格局。近日,英伟达创始人黄仁勋在一场访谈中就提到:“DeepSeek绝非一个⽆关紧要的进步,如果DeepSeek率先在华为上发布,那对美国来说将是一个可怕的结果。”

与此同时,这一生态成本未来或能够进一步降低。DeepSeek表示,受限于高端算力,目前Pro的服务吞吐十分有限,预计下半年昇腾950超节点批量上市后,Pro的价格会大幅下调。

目前,按DeepSeek官方价格折算,V4-Pro每百万tokens输入是1元,输出是12元;V4-Flash每百万tokens的输入和输出分别是0.2元和2元。


图源:DeepSeek-V4技术报告

融资传闻升温,DeepSeek走到十字路口

在DeepSeek-V4“姗姗来迟”的这段空窗期里,大模型行业的竞争格局已悄然剧变,火药味渐浓——这与当年DeepSeek R1横空出世时的环境已然不同。

今年2月,字节跳动、腾讯、阿里等多家科技巨头纷纷加大AI应用投入,它们旗下的豆包、元宝和千问等产品的月活跃用户(MAU)迎来爆发式增长,在AI原生App榜单中强势崛起,一度撼动DeepSeek占据的“江湖地位”。几乎在同一时间,Kimi K2.5、GLM-5、MiniMax M2.5等国产大模型也密集登场。

随着4月上旬DeepSeek创始人梁文锋在内部沟通中透露,新一代旗舰大模型将于当月下旬发布的消息传开,一场围绕大模型的卡位战加速打响。

戏剧性的是,就在DeepSeek-V4上线的前一天,互联网巨头上演了一场集体“伏击”,4月23日,小米MiMo-V2.5和腾讯混元Hy3 preview同日开启公测,而阿里则在更早前的4月2日便发布了Qwen3.6-Plus。

外部强敌环伺之下,DeepSeek的内部组织稳定性与服务保障能力正在经受考验。

一方面,核心技术人才的接连出走,引发市场对这家基座大模型公司研发能力的担忧。公开信息显示,自2025年下半年以来,DeepSeek的研发团队出现明显人员流动,DeepSeek第一代大语言模型核心作者王炳宣转投腾讯、V3版本核心贡献者罗福莉入职小米。

甚至在4月中旬V4版本呼之唤出之时,据晚点报道,当年R1核心研究员郭达雅选择加入字节跳动Seed团队。

另一方面,随着用户规模的扩张,DeepSeek服务稳定性问题也日益凸显。2026年开年以来,DeepSeek多次出现大规模服务中断,其中3月29日晚至次日上午的宕机波及网页端与APP端,持续时间长达约12小时。

进入4月,关于DeepSeek启动首次外部融资的消息持续发酵。

就在DeepSeek-V4上线前一周,证券时报等多家媒体报道称,DeepSeek正与投资者洽谈首轮外部股权融资,计划以不低于100亿美元的估值,募集不少于3亿美元资金。随后又有报道称,腾讯、阿里正洽谈以超过200亿美元估值投资DeepSeek,两家投资方预计共计投资18亿美元。不过上述消息均未得到DeepSeek及相关方的确认。

这场融资传闻之所以引发如此大的反响,核心在于它与DeepSeek此前留给外界的“技术纯粹派”印象形成强烈反差。

梁文锋曾在公开表态中表现出对融资的明确排斥。其在采访中曾表示,幻方作为出资人之一为其充足研发预算;更核心的顾虑在于外部投资者或干预公司决策,梁文锋称很多VC对做研究有顾虑,存在退出需求,希望尽快做出产品商业化,而这与DeepSeek优先做研究的思路并不完全匹配。

彼时,独立于融资叙事之外、专注于技术研究,正是DeepSeek最吸引人的故事之一。一定程度上,当年R1横空出世,正是凭借这份纯粹的技术追求,在众多模型中脱颖而出,成为AI行业的“黑马”。

但如今,大模型竞争已告别单点突破的时代,进入算力、人才、生态、产品和商业化的综合战。仅依靠技术声望和内部资金,或许已难以覆盖下一阶段的综合竞争成本。

而引入外部资本,不仅能补充弹药,还意味着企业的估值将得到市场定价,员工手中的股权激励也将有更清晰的价值参照。这对于过去一年频频被卷入人才流动讨论的DeepSeek来说,或许也是稳定团队、留住核心研发人员的一种更为现实的方式。

实际上,在DeepSeek尚未迈出融资这一步时,昔日同为大模型独角兽的竞争对手们,早已在资本市场上加速奔跑。

今年1月,智谱(02513.HK)与MiniMax(00100.HK)先后登陆港交所,截至4月24日,两者最新市值分别达到4169亿港元和2439亿港元。

月之暗面虽尚未启动上市,但据财联社3月份报道,其今年以来已完成三轮融资,估值在3个月内翻了4倍,最新一轮融资估值上升至180亿美元。

对于站在十字路口的DeepSeek而言,一边是愈发残酷的算力与人才军备竞赛,另一边是向其抛出橄榄枝的资本市场。一边是坚守技术理想的初心,一边是应对商业竞争的现实压力。

这家曾给中国AI行业带来巨大惊喜的公司,能否在技术理想与现实之间找到可持续的平衡,将决定它下一阶段的生存与发展走向。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
海牙做出审判,老杜回国无望,人民日报一锤定音:中国不救菲律宾

海牙做出审判,老杜回国无望,人民日报一锤定音:中国不救菲律宾

泠泠说史
2026-04-25 20:05:47
大数据分析,在中国,找个身高1米7年入20万的老公,到底有多难?

大数据分析,在中国,找个身高1米7年入20万的老公,到底有多难?

深度报
2026-04-18 23:37:27
楼市大变天!如果不出意外,2026年二手房,价格将迎来4大新变化

楼市大变天!如果不出意外,2026年二手房,价格将迎来4大新变化

爱看剧的阿峰
2026-04-25 03:42:28
华尔街疯抢“电力霸权”!

华尔街疯抢“电力霸权”!

格隆汇
2026-04-25 19:48:07
CCTV5直播史上最弱京津德比!国安外援双煞缺席 于根伟先找好借口

CCTV5直播史上最弱京津德比!国安外援双煞缺席 于根伟先找好借口

刀锋体育
2026-04-25 08:54:03
人到晚年,趁着还能走得动,一定要主动去做这5件事

人到晚年,趁着还能走得动,一定要主动去做这5件事

蝉吟槐蕊
2026-04-25 10:17:27
为何慈禧一死,清朝的北洋军连皇帝都指挥不动了?原因其实很简单

为何慈禧一死,清朝的北洋军连皇帝都指挥不动了?原因其实很简单

老达子
2026-03-31 06:55:03
库克公开承认,苹果最失败的产品和最成功的产品!

库克公开承认,苹果最失败的产品和最成功的产品!

XCiOS俱乐部
2026-04-24 00:05:15
广西民族大学前书记卞成林落马,退休不到1年,曾执掌3所高校19年

广西民族大学前书记卞成林落马,退休不到1年,曾执掌3所高校19年

百家论大学
2026-04-25 20:16:55
副司令员下连队视察,看到一老兵后被吓了一跳,连忙上前向他敬礼

副司令员下连队视察,看到一老兵后被吓了一跳,连忙上前向他敬礼

云霄纪史观
2026-04-25 19:56:31
杨成武半夜出门,看到路边一人姿势奇怪,当即下令:撤退,有日军

杨成武半夜出门,看到路边一人姿势奇怪,当即下令:撤退,有日军

云霄纪史观
2026-04-25 20:26:52
施明离世胞妹未现身葬礼,丈夫邓梓峰低调送别,称看新闻才知死讯

施明离世胞妹未现身葬礼,丈夫邓梓峰低调送别,称看新闻才知死讯

八斗小先生
2026-04-25 14:03:58
被禁60年的影片:这位蒋介石最尊敬的乞丐,不该被中国人遗忘

被禁60年的影片:这位蒋介石最尊敬的乞丐,不该被中国人遗忘

华人星光
2026-04-23 12:12:20
辟谣!利拉德通过身边人发声:不可能在季后赛复出 目标下赛季

辟谣!利拉德通过身边人发声:不可能在季后赛复出 目标下赛季

醉卧浮生
2026-04-25 00:01:14
铜梁龙董事长:演唱会280那么多人抢,足球80还有人骂,所以要改变

铜梁龙董事长:演唱会280那么多人抢,足球80还有人骂,所以要改变

懂球帝
2026-04-25 00:06:57
北京国安主场2比4惨败津门虎,青岛海牛很惊悚,难题给到泰山队

北京国安主场2比4惨败津门虎,青岛海牛很惊悚,难题给到泰山队

姜大叔侃球
2026-04-25 21:54:42
昔日影视龙头被立案调查,两日股价大跌16%,4万股民可索赔

昔日影视龙头被立案调查,两日股价大跌16%,4万股民可索赔

21世纪经济报道
2026-04-25 11:56:48
这份是我觉得写的最好的一季报

这份是我觉得写的最好的一季报

雪球
2026-04-25 10:47:05
补丁老头挂专家号被嫌脏,次日院长晨检看清长相瞬间哽咽

补丁老头挂专家号被嫌脏,次日院长晨检看清长相瞬间哽咽

星星会坠落
2026-04-25 20:02:10
事发上海地铁!警方通报:2人车厢内大打出手,均被行拘!公共视频还原事发经过

事发上海地铁!警方通报:2人车厢内大打出手,均被行拘!公共视频还原事发经过

新民晚报
2026-04-25 12:50:21
2026-04-25 22:28:49
时代财经 incentive-icons
时代财经
企业第一财经读本
51869文章数 150451关注度
往期回顾 全部

科技要闻

DeepSeek V4发布!黄仁勋预言的"灾难"降临

头条要闻

媒体:美军在中东罕见高密度集结 伊朗开始调整战术

头条要闻

媒体:美军在中东罕见高密度集结 伊朗开始调整战术

体育要闻

火箭0-3触发百分百出局定律:本季加时赛9战8败

娱乐要闻

《我们的爸爸2》第一季完美爸爸翻车了

财经要闻

90%订单消失,中东旺季没了

汽车要闻

2026款乐道L90亮相北京车展 乐道L80正式官宣

态度原创

房产
艺术
数码
健康
教育

房产要闻

新一轮教育大爆发来了!海口,开始疯狂建学校!

艺术要闻

服了!苏州20栋“墓碑楼”,出自英国设计师之手

数码要闻

苹果视频特效怎么做的?

干细胞如何让烧烫伤皮肤"再生"?

教育要闻

教育纵深 | 阅读走新更走心

无障碍浏览 进入关怀版