网易首页 > 网易号 > 正文 申请入驻

V4“上桌”,DeepSeek的故事更热血了

0
分享至


听筒Tech(ID:tingtongtech)原创

文 杨 林

编 饶霞飞

DeepSeek,这家被行业视为持有技术极客与执拗气质的公司,结束了它长达15个月的静默。

4月24日,在OpenAI刚秀完肌肉、业内外都在猜测“中国军团”何时能跟上节奏时,DeepSeek毫无征兆地甩出了“王炸”,DeepSeek V4上线。

在业内看来,V4正在进行激进转身。它的登场,不仅带来了1.6T的稀疏大模型,更将手伸向了曾被视作禁区的高阶Agent(智能体)。

而最让行业热血的是,DeepSeek V4明确向外界传递,它与华为昇腾的联姻已进入深水区。无论是训练框架的迁移,还是下半年的算力支持,DeepSeek都在告诉市场,在全球算力封锁的夹缝中,自己正在走一条中国式的自主闭环之路。


图:DeepSeek公告发布V4预览版本

来源:DeepSeek官方网站 《听筒Tech》截图

而就在V4发布之际,坊间关于DeepSeek以超200亿美元(此前为100亿美元)估值寻求融资的消息也传得沸沸扬扬,甚至还有市场信息将资本对象纷纷指向阿里和腾讯。

靴子仍未落地。但市场不难看出,DeepSeek仍沿着技术苦行僧这条路继续攀登。V4针对Claude Code、OpenClaw等主流Agent产品的专项优化,也反映了它在抢占开发者生态方面的迫切和焦虑。

毕竟,在AI讲通了上市和赚钱的故事后,比起参数更新,市场仍关心,梁文锋将带队走向何方。

当理想撞上现实,如何以极客的姿态继续“仰望星空”,随着V4的落地,DeepSeek需要讲给市场的是一个更热血,但更现实的商业故事。

“硬货”V4,离商业化近了

在《听筒Tech》看来,V4的升级体现了DeepSeek一贯的风格,在前沿架构上足够激进。而在商业化落地上,这次,DeepSeek显然迈出了一步。

技术的亮点,首先体现在体量的飞跃上。

目前来看,V4分为两个版本,完整版参数量达到了惊人的1.6万亿,Lite版也有2850亿。相比于上一代V3(671B参数),V4的规模扩大了近24倍。

在当前行业普遍追求“小体量、专业模型”的背景下,DeepSeek反而选择了一条更“重”的路,试图用暴力计算碾压出更复杂的智能。


图:V4两个版本及参数量

来源:DeepSeek官方公众号 《听筒Tech》截图

然后是架构的缝合与创新。

这一次,V4引入了名为DSA2的注意力机制。这是一次技术集大成,它融合了V3中验证过的DSA设计,以及2026年初论文中提到的NSA稀疏注意力方案。

为了处理更长的上下文,V4在MoE(混合专家)架构上做了大幅调整,每层配置384个专家,推理时激活6个。这意味着,虽然模型总容量巨大,但在实际运行中,它依然保持了相对较高的效率。

市场还看到了100万tokens的上下文窗口。

这是一个非常实用的升级。最早,Kimi就靠“长文本”出圈,而100万tokens的容量足以处理《三体》三部曲这样的长篇巨著。这对于法律合同分析、长篇小说创作、复杂代码库维护等企业级场景,是实实在在的生产力工具。

从模型角度整体来看,V4没有去追所谓的“多模态”风口(目前明确是纯文本模型),而是继续死磕大参数和推理效率。实际上,这很符合DeepSeek的调性,不打概念战,只打参数和成本战。

不只是模型升级,V4的战略重心,还明显转向了底层算力的国产化适配。

这是V4发布中最具行业影响力的信号,甚至,在市场看来,这远比模型本身的得分更为重要。

背景是这样的。在过去,中国大模型公司虽然做得风生水起,但底层算力依然重度依赖英伟达(NVIDIA)的CUDA生态。高端芯片进口受限后,国产AI芯片虽然算力纸面数据不差,但一直被“生态”卡脖子,很多模型在上面跑不起来,或者跑起来效率极低。

基于此,此次V4的发布,明确打出了“适配国产芯片”的旗号。

根据官方释放的信息,DeepSeek V4团队投入了大量精力在与华为昇腾等国产AI芯片的底层适配工作上。这不是简单的“能用”,而是追求“开箱即用”的深度工程化验证。

AI从业者廖哥对《听筒Tech》表示,“这才是V4对国内AI产业真正的贡献,也是资本市场反应最激烈的地方。”

实际上,在V4预览版上线的当天,科创芯片设计ETF迅速拉涨。也即是说,市场看好的不仅仅是DeepSeek这家公司,而是对“模型+芯片”的闭环商业故事要走通的期待。

这也意味着,国产算力第一次有了一个世界级的软件生态撑腰,而一旦通道打通,正向的循环才可能形成。

“V4在其中的角色,就是那个打破僵局的‘关键先生’。”廖哥解释,“模型适配国产卡,企业敢买国产卡,算力成本大幅下降,从而模型调用价格下降,最后促使应用爆发。”

DeepSeek或加速步调

不过,不可否认的是,在V4发布前,DeepSeek确实处于一种微妙的境地。

一个事实是,它太“慢”了。从R1的爆火到V4发布,中间隔了15个月,而在这15个月里,竞争对手们,却跑得太快了。

字节的豆包在2026年初实现了技术的升级,Seedance也在视频生成领域撕开了口子;智谱凭借GLM-5.1在编程能力上口碑反超;甚至连DeepSeek的核心团队都遭遇了挖角,R1的核心贡献者之一郭达雅也被曝出“被挖了墙角”。

在市场看来,DeepSeek的“慢”,答案是很明显的。

“主要是技术洁癖。DeepSeek不仅在做模型,还在花大量精力做底层代码的国产化适配(如TileLang语言),这在短期内拖慢了研发节奏。”廖哥坦言,“另外一个,是算力瓶颈。实际上,随着模型快速变大,仅靠幻方量化的自有资金,DeepSeek已经捉襟见肘,很难有余粮去突破瓶颈。”

不过,随着V4的发布,这种“慢”可能转化为一种“快”。

诸多的市场分析认为,V4的发布,是DeepSeek从“纯理想主义”向“现实主义”过渡的转折。

一个最主要的表现是,号称“永不融资”的DeepSeek,要开始市场融资了。

就在V4发布前夕,DeepSeek被曝寻求至少3亿美元的外部融资。而此前,梁文锋曾多次拒绝包括腾讯、阿里在内的大厂注资。

不过,随着核心成员被高薪挖走,算力资金缺口加大,梁文锋开始接受现实。毕竟,稀释股权换取估值背书,是低成本稳定军心、留住人才最有效的路径。

“我们仍相信,筹码加持下,梁文锋将带领DeepSeek,开始新一轮启航。”廖哥表示。

另一方面,从V4的发布节奏、产品策略和商业模式上,市场都看出了DeepSeek向应用靠拢的务实态度。

实际上,DeepSeek在V4发布前,就已经上线了处理复杂推理的“专家模式”和快速响应的“快速模式”,分别对应这次发布的V4-Pro和V4-Flash模型。

这也被业内解读为,DeepSeek开始重视产品需求,从纯技术工厂转向产品逻辑。

另外,在Agent优先战略下,V4明确针对Claude Code等主流Agent产品进行了优化,目标也换成了成为“Agent时代的基础设施”。这等于说,它放弃自建生态,而服务于最能产生商业价值的应用层。


图:V4-Pro在某Agent框架下生成的PPT内页示例

来源:DeepSeek官方公众号 《听筒Tech》截图

尤为重要的是,据OpenRouter数据,V4-Flash的API输出定价低至2元/百万token,仅为GPT-5.5 Pro的约1%。这种“价格屠夫”式的定价,目的在于快速获取市场份额,将技术优势转化为用户和收入,也是典型的公司商业化的早期打法。

“以前的DeepSeek可以不融资、不站队,靠技术理想吸引人才。但现在,大模型的竞争已经是烧钱的基础设施战争。”廖哥坦言。

“毕竟,有了V4的技术实力,DeepSeek能向资本要更高的价,如此才能买得起更多算力、留住人才,才能将国产化适配这件事做好。”

“我们认为,经历多次跳票后,V4‘上桌’后,以后DeepSeek的路,可以走得更快。”廖哥表示。

新的热血故事才刚开始

尽管V4参数升级以及大模型的国产适配化探索,带来了市场小震撼,但于DeepSeek而言,笑到最后仍是最根本的命题。

实际上,将V4与同行放在一起对比,优势是明显的。

比如,无论是与海外OpenAI、Anthropic,还是国内的其他主流大模型,V4的核心优势依然是主打“性价比”和“开源”,并率先完成国产算力底座的适配。

用廖哥的话说,“V4的目标不是一下子打死‘GPT-5们’,而是无限逼近,同时将成本打下来。事实上,DeepSeek依然是条鲶鱼,它一旦开源,很多厂商的API就不好卖了。”

不过,DeepSeek前方的路,也是布满荆棘的。

在技术上,V4虽强,但并没能像当年的R1那样带来颠覆性的范式革新,更多的是工程和成本优化的集大成者。在Agent和复杂推理的极限测试中,DeepSeek也承认与最顶尖的闭源模型存在几个月的差距。

而在生态上,虽然拉上了华为,但适配国产芯片的代价往往是牺牲开发的便捷性。如何让全球开发者心甘情愿地在一个非CUDA主导的生态里玩耍,这是DeepSeek和昇腾,都需要共同面临的长期课题。

但无论如何,DeepSeek还是那个DeepSeek。正如它在推文结尾引用的《荀子・非十二子》的那句“不诱于誉,不恐于诽”,说明这家公司依然带着一种极客特有的执拗。

在国产大模型普遍陷入应用变现焦虑的2026年,DeepSeek希望死磕底层架构、推理成本和国产适配能力。


来源:DeepSeek官方公众号 《听筒Tech》截图

这也让市场接下来的看点更明确了,既然V4证明了“我能行”,那该“怎样行”以及“如何行”,仍需要依赖后续的融资落地与商业推进。

这也是决定DeepSeek从技术极客进化为商业巨头的关键。毕竟,在这个时代,只有活下去的理想主义,才是真正的理想主义。

V4开了一个好头,但真的热血故事,才刚开始。

(文中均为化名。)

(头图来自AI生成。)

(声明:本文仅作为信息交流,不构成任何投资参考建议。)

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
又撞上!夏洛特生辰后,梅根公开莉莉捡蛋视频,娃美式口音引众怒

又撞上!夏洛特生辰后,梅根公开莉莉捡蛋视频,娃美式口音引众怒

聪明的橙子hj
2026-05-06 15:39:08
赖清德回台不到24小时,美高层发声,特朗普害怕:再晚就来不及了

赖清德回台不到24小时,美高层发声,特朗普害怕:再晚就来不及了

云舟史策
2026-05-07 07:26:09
马筱梅:还有很多事情没有说,怕会伤害很多人,网友:似曾相识

马筱梅:还有很多事情没有说,怕会伤害很多人,网友:似曾相识

街上的行人很刺眼
2026-04-14 14:04:10
倪萍:感谢陈凯歌当年的抛弃,如今儿子是学霸,丈夫是绝世好男人

倪萍:感谢陈凯歌当年的抛弃,如今儿子是学霸,丈夫是绝世好男人

精彩背后的故事
2026-05-07 06:14:07
林彪、刘伯承和粟裕三人,谁是官方认可的战神?谁更能打?

林彪、刘伯承和粟裕三人,谁是官方认可的战神?谁更能打?

扬平说史
2026-05-07 22:38:22
因叛徒出卖,她与丈夫同时被捕,在狱中,敌人当着她丈夫面扒光她的衣服,...

因叛徒出卖,她与丈夫同时被捕,在狱中,敌人当着她丈夫面扒光她的衣服,...

网络易不易
2026-05-07 12:55:01
漓江水如镜,美女貌似花

漓江水如镜,美女貌似花

东方不败然多多
2026-05-07 20:43:41
巴基斯坦战略专家:这三场战争已表明,中国才是世界最强超级大国

巴基斯坦战略专家:这三场战争已表明,中国才是世界最强超级大国

阿芑历史
2026-05-06 18:43:43
老人财产转给独生子女:3个最佳时间,早知道少走弯路

老人财产转给独生子女:3个最佳时间,早知道少走弯路

小鹿姐姐情感说
2026-05-05 10:43:52
好吃得像垃圾食品,其实配料表超干净!高蛋白无负担,减脂人也能敞开吃!

好吃得像垃圾食品,其实配料表超干净!高蛋白无负担,减脂人也能敞开吃!

下厨房
2026-05-07 18:31:03
傅首尔瘦到认不出引热议,本人回应:8个月减重26斤,全靠自律

傅首尔瘦到认不出引热议,本人回应:8个月减重26斤,全靠自律

小兔子的快乐
2026-05-05 05:54:07
泽连斯基表示,俄罗斯违反乌克兰的停火协议,将会遭到应有的惩罚

泽连斯基表示,俄罗斯违反乌克兰的停火协议,将会遭到应有的惩罚

山河路口
2026-05-06 18:55:30
徐帆回应离婚仅9个月,冯小刚王志文同聚打球,与养女关系引争议

徐帆回应离婚仅9个月,冯小刚王志文同聚打球,与养女关系引争议

小琴动漫
2026-05-06 20:15:51
深夜,特斯拉大涨,苹果股价创历史新高,中概股多数走低!国际油价跳水,金银拉升,加密货币超11万人爆仓丨美股开盘

深夜,特斯拉大涨,苹果股价创历史新高,中概股多数走低!国际油价跳水,金银拉升,加密货币超11万人爆仓丨美股开盘

每日经济新闻
2026-05-07 22:19:11
3-0横扫3-2险胜!世乒赛男团八强敲定,中韩狭路相逢日本凶多吉少

3-0横扫3-2险胜!世乒赛男团八强敲定,中韩狭路相逢日本凶多吉少

史智文道
2026-05-07 19:36:29
世乒赛男团:张本智和一单独砍2分状态正佳,日本队3-1淘汰德国队

世乒赛男团:张本智和一单独砍2分状态正佳,日本队3-1淘汰德国队

乒谈
2026-05-07 21:54:49
硅谷大转向,一个极其危险的信号出现了

硅谷大转向,一个极其危险的信号出现了

新浪财经
2026-05-07 09:45:54
比亚迪大唐EV预售订单突破10万台,预售价25万元起

比亚迪大唐EV预售订单突破10万台,预售价25万元起

IT之家
2026-05-07 20:41:04
18栋楼重建,损失超7亿!甲方多人落马!施工单位降级

18栋楼重建,损失超7亿!甲方多人落马!施工单位降级

天天热点见闻
2026-05-06 06:36:48
10亿都救不了一命!京东副总裁蔡磊,生命进入倒计时

10亿都救不了一命!京东副总裁蔡磊,生命进入倒计时

听风喃
2026-04-06 11:16:04
2026-05-07 23:40:49
雷达财经
雷达财经
扫除雷点,发现价值!
60862文章数 60270关注度
往期回顾 全部

科技要闻

月之暗面完成20亿美元融资,估值突破200亿

头条要闻

日媒询问中国是否希望恢复中日之间人员往来 中方回应

头条要闻

日媒询问中国是否希望恢复中日之间人员往来 中方回应

体育要闻

巴黎再进欧冠决赛,最尴尬的情况还是发生了

娱乐要闻

Lisa主持!宁艺卓观看脱衣秀风波升级

财经要闻

人均年薪406万,这家ST公司惊呆市场!

汽车要闻

雷克萨斯全新纯电三排SUV 全新TZ全球首发

态度原创

手机
房产
本地
数码
公开课

手机要闻

麒麟9050+双潜望+超声波指纹,华为Mate90 Pro Max迎重磅升级!

房产要闻

负债23亿,抵押482亩地!海南这家巨头,惨遭拍卖!

本地新闻

用青花瓷的方式,打开西溪湿地

数码要闻

5月6月机圈杀疯了!十几款新机排队上场,你的钱包顶得住吗?

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版