网易首页 > 网易号 > 正文 申请入驻

DeepSeek V4背后,梁文锋的转身

0
分享至



「核心提示」
国产架构与外部融资同时启动,DeepSeek的惊险一跃。

作者 | 张经纬

编辑 | 邢昀

2026年4月,DeepSeek几乎同时公布了两条大新闻:一是公司启动首次外部融资,目标估值从100亿美元迅速抬升至200亿到300亿美元,腾讯、阿里正洽谈入局;二是其新一代旗舰模型V4发布,全面适配华为昇腾950PR芯片,从英伟达的CUDA生态转向华为的CANN框架。

一内一外两种变化,背后是DeepSeek的全面战略转向,也是AI公司竞争进入深水区的标志。

那个纯靠自身的量化投资输血、以“技术理想主义”自居的DeepSeek,正在完成自己的“成人礼”。

1、国产替代和推理跃进,V4的新故事

2026年4月24日,DeepSeek V4发布。

这不是一次常规的模型迭代。新模型将总参数推至1.6万亿,首次将百万token上下文打成标配,并实现了百万上下文下每token的算力消耗仅为V3.2的27%,KV缓存占用只有10%。

模型输出质量上,V4同时支持三档推理强度,并针对Agentic Coding做了专项优化。内部评测显示,其交付质量已接近Claude Opus 4.6的非思考模式。

不过V4最受瞩目的,是首次在官方技术报告中,把国产芯片和英伟达GPU写进了同一份硬件验证清单。

V4适配的华为昇腾950PR推理芯片于2026年3月量产,单卡算力较英伟达对华特供版H20提升2.87倍。到目前为止,阿里巴巴、字节跳动、腾讯等国内科技巨头已向华为下单数十万颗昇腾芯片。

从成本角度看,这是一次理性的商业选择。昇腾950PR的采购价格约为英伟达H200的三分之一到四分之一,绝对算力则是H200的一半,这意味着性价比。

虽然和英伟达的前沿芯片相比,国产芯片有显著的算力差距。不过在低精度推理场景下,华为昇腾950PR的SIMD/SIMT新同构设计、低精度数据格式支持和自研HBM,能展现出超越通用GPU的效率。不仅更便宜,而且更高效。

现在也正好是大模型正从“训练为王”逐渐转向“推理决胜”的时代。2026年3月的GTC大会上,黄仁勋宣布推理的拐点已经到来,需求还在不断增长。他指出过去两年AI计算需求激增了1万倍,行业重心正在从一次性、高成本的模型训练,转向持续性的推理服务。

事实上,黄仁勋本人也曾公开表达对中国芯片的忧虑。4月15日,他在彭博社播客访谈中罕见发飙,当众反驳“芯片是浓缩铀,不该出口给中国”的说法。他警告,过度限制无法阻止中国进步,反而会逼中国建立完整的自主生态。

跳出英伟达架构是一条高风险、高收益的新路。风险在于,CANN不是一个非常成熟的架构,第三方库支持、调试工具链仍不及CUDA,对于个人开发者和小团队而言迁移门槛依然存在。

但如果V4在华为芯片上跑出有竞争力的性能,它将是全球第一个不依赖英伟达的前沿AI模型,这意味着中国AI产业将拥有完全自主的算力底座,不再受制于华盛顿的出口管制。

这也意味着中国的AI企业们会直接坐在金山上。根据OpenRouter的数据, 2026年3月30日-4月5日,中国AI模型的周调用量突破12.96万亿Token,是同期美国的4.3倍,国产化无疑有着巨大的市场前景。

2、向资本重新伸出的手

不过,追求国产架构性价比的另一面,是DeepSeek的资金压力。

这家一度站在中国AI赛道顶峰的公司,长期主要靠创始人梁文锋和背后的量化基金幻方量化支持。梁文锋直接和间接持有DeepSeek 84.29%的股份,拥有几乎100%的表决权,这让DeepSeek在AI创业公司中显得格外另类。当智谱、MiniMax、月之暗面在2023-2024年疯狂融资时,DeepSeek像一个隐士般潜心研发,直至2025年R1的横空出世。

也是在这一年,梁文锋拒绝了来自腾讯和阿里巴巴等科技巨头的合作机会,担心外部投资者会干预公司决策。而且,梁文锋本人也极少出现在公众视野中,除了几篇AI研究的论文。

但他的态度不久前发生了180度大转弯。2026年4月,DeepSeek启动首轮外部融资,募资至少3亿美元,目标估值超200亿美元,市场传闻甚至飙至300亿美元以上。

AI正在变得越来越烧钱,也变得越来越值钱,这是全球性共识。

OpenAI 2025年亏损80亿美元,2026年预计亏损250亿美元。2026年3月OpenAI完成最新一轮融资,募集资金1220亿美元,投后估值8520亿美元。其最大竞争对手Anthropic于2026年2月完成300亿美元G轮融资,投后估值3800亿美元。由于年化收入从2025年底的90亿美元暴涨至2026年4月的300亿美元,Anthropic在一些二级市场的隐含估值已超1万亿美元。

除了算力采购,烧钱的还包括人才竞争。脉脉高聘《2026春招人才供需报告》显示,2026年1至2月,AI岗位数量同比增长约12倍,岗位占比升至26.23%,平均月薪超6万元。

薪资上涨促进了人才流动,这给很多AI大厂带来了薪资压力。据媒体报道,过去一年间,字节跳动Seed团队有近70名技术人才离职,转而加入国内头部互联网企业、大模型公司及国际科技巨头。为抵御人才流失,字节跳动为Seed团队大规模发放专项期权,提高待遇。在字节内部,活水流动到Seed部门是新风向,面试流程也相比其他部门更为复杂。

字节被报道2025年净利润同比下滑超过70%,核心原因是在三、四季度加码了人工智能领域的资源投入。随后抖音副总裁李亮澄清称,净利润下降主要是优先股和期权成本变动等会计因素带来的。虽然缓解了市场上对于字节净利润下滑的担忧,但也显示出公司在人才,尤其是AI人才激励上的大手笔。

AI公司人才的频繁流动,也同时给DeepSeek带来了压力。

去年底至今,DeepSeek有多位核心员工离职。2025年11月,罗福莉加入小米MiMo大模型团队,她曾是DeepSeek-V2核心开发者、被冠以“95后天才少女”之名;2025年底2026年初,王炳宣加入腾讯混元大模型团队,他是DeepSeek第一代大语言模型的核心作者;2026年1月阮翀加入元戎启行,他是DeepSeek多模态领域核心贡献者;2026年4月,R1核心研究员、DeepSeek-Coder系列第一作者郭达雅被报道加入字节Seed团队。

有说法称,梁文锋最近寻求融资是在给员工做期权定价,以留住人才。

无论是出于保有技术人才还是做算力储备,AI厂商都不可能暂停这种“军备竞赛”。在这当中,DeepSeek还有一些自身的课题要解决。和很多收费服务的厂商不同,DeepSeek在C端推行token平权,专注免费模式,主要靠B端API调用商业化。

这无疑让DeepSeek更加需要引入资本市场的力量。

3、被支持,也被期待

DeepSeek作为国产大模型始终被寄予厚望。自2025年1月R1模型横空出世以来,它以极低的训练成本达到OpenAI顶尖模型的性能,一度引发全球科技股震荡,被视作中国AI的标杆。

一年来,DeepSeek受到了很多不同形式的支持。比如R1上线后,国家超算互联网平台第一时间上线DeepSeek,提供一键推理和定制化训练服务;体制内曾掀起“学习使用DeepSeek”的热潮;华为昇腾、寒武纪、沐曦等十余家国产芯片厂商,以及华为云、天翼云、腾讯云、阿里云等九大国内云巨头,也都及时推出适配DeepSeek的算力方案或服务。

“被支持”也意味着“被期待”。人们也同样期待DeepSeek能在算力自主上蹚出一条路。V4全面拥抱华为昇腾,某种程度上是对这种期待的回应。

同样备受期待的还有模型本身的性能。

V4发布前,很多人期望DeepSeek的新模型能在多模态上有所进步。然而,V4仅支持文字输入,暂不支持原生多模态功能。相比之下,Gemini 3.1 Pro已实现"全模态”(文本+图片+音频+视频),GPT-5.4支持文本、图片、音频、视频全链路,国内主要大模型也基本支持文本+图片的信息输入。

DeepSeek的融资与转向,同样折射出中国AI创业公司的某种困境。在技术迭代以月为单位、资本开支以百亿为单位的军备竞赛中,“中小厂”的研发窗口正在急剧收窄。智谱和MiniMax已先后赴港上市,月之暗面正以180亿美元估值完成新一轮融资。当大厂们挥霍着源源不断的弹药,创业公司们只能选择求助资本市场。

对DeepSeek自己来说,新阶段也意味着新的问题。引入过多外部融资是否会掣肘DeepSeek的决策?芯片国产化是否意味着,在一定阶段中美大模型技术的切割甚至差距拉大?这些都是未知数。

但DeepSeek仍有其独特优势。它的开源策略和低成本训练方法论,已在全球开发者社区建立了品牌认知;它在MoE架构、条件记忆机制(Engram)、流形约束超连接(mHC)等底层技术上的创新,证明了其不依赖算力堆砌的研发能力。如果V4能在国产芯片上跑出有竞争力的性能,它将证明一件事:中国AI公司可以在被制裁的环境下,用更少的钱、更自主的供应链,做出世界一流的产品。

当理想主义撞上现实的算力账单,DeepSeek正在经历惊险一跃。这场跳跃如果成功,超越的将是整个AI产业的旧秩序。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
CCTV5直播!北京G3主场再战上海,3后卫成取胜关键,周琦硬磕双塔

CCTV5直播!北京G3主场再战上海,3后卫成取胜关键,周琦硬磕双塔

老叶评球
2026-05-19 19:41:09
特朗普刚离京,中方就亮底牌!500架波音订单泡汤,美方瞬间着急

特朗普刚离京,中方就亮底牌!500架波音订单泡汤,美方瞬间着急

通鉴史智
2026-05-18 17:05:38
泡泡玛特创始人母校收到校友捐赠20亿token,价值仅几百元?校方称捐赠属实,专家估值约20万美元

泡泡玛特创始人母校收到校友捐赠20亿token,价值仅几百元?校方称捐赠属实,专家估值约20万美元

上游新闻
2026-05-19 16:46:10
中国给予高规格礼遇!走进天安门广场前,普京对华第一个诉求曝光

中国给予高规格礼遇!走进天安门广场前,普京对华第一个诉求曝光

影孖看世界
2026-05-19 18:39:51
第三轮第六批中央生态环境保护督察公布四省区典型案例

第三轮第六批中央生态环境保护督察公布四省区典型案例

界面新闻
2026-05-19 15:04:08
纽约时报刷屏长文:硅谷正在准备迎接「永久底层阶级」!AI时代的四个新阶层,你的孩子将被困在哪一层?

纽约时报刷屏长文:硅谷正在准备迎接「永久底层阶级」!AI时代的四个新阶层,你的孩子将被困在哪一层?

新浪财经
2026-05-19 09:11:27
访华回国第三天,美方代表就变脸对华出手,彻底撕碎北京会谈伪装

访华回国第三天,美方代表就变脸对华出手,彻底撕碎北京会谈伪装

丁丁鲤史纪
2026-05-18 18:24:17
普京来了!访华热度也很高,不低于老特,我们的关系真的太好了

普京来了!访华热度也很高,不低于老特,我们的关系真的太好了

魔都姐姐杂谈
2026-05-19 09:16:57
快观察| 22年来第16次访华,李显龙直奔广西与上海,想和中方畅谈什么?

快观察| 22年来第16次访华,李显龙直奔广西与上海,想和中方畅谈什么?

上观新闻
2026-05-19 20:21:27
俄技术集团提议中方境内组织生产卡-226T直升机

俄技术集团提议中方境内组织生产卡-226T直升机

俄罗斯卫星通讯社
2026-05-19 15:01:53
交大樊某被曝更多恶行!撒谎拉老师下水,中高考全保送,大有来头

交大樊某被曝更多恶行!撒谎拉老师下水,中高考全保送,大有来头

小鋭有话说
2026-05-19 17:23:10
倒翻天罡!欧盟公开喊话中国:断供空客软件,要让中国客机停飞?

倒翻天罡!欧盟公开喊话中国:断供空客软件,要让中国客机停飞?

携手游人间a
2026-05-19 09:53:53
奇葩!俄称输给乌不丢人,大家一家人,乌克兰又一款大杀器亮相

奇葩!俄称输给乌不丢人,大家一家人,乌克兰又一款大杀器亮相

史政先锋
2026-05-19 17:03:28
队报:皇马许多官员曾竭尽全力劝阻老佛爷,认为穆帅已经过时

队报:皇马许多官员曾竭尽全力劝阻老佛爷,认为穆帅已经过时

懂球帝
2026-05-19 17:16:34
尼得科将撤出在华合资业务

尼得科将撤出在华合资业务

新浪财经
2026-05-19 05:38:44
泰国内阁决定取消60天免签政策

泰国内阁决定取消60天免签政策

新华社
2026-05-19 19:45:12
1983年,红卫兵头子被判刑,晚年沦落到捡菜叶子充饥,活到2019年

1983年,红卫兵头子被判刑,晚年沦落到捡菜叶子充饥,活到2019年

米果说识
2024-09-12 04:20:03
韩国西瓜大涨价,单个西瓜卖到136元

韩国西瓜大涨价,单个西瓜卖到136元

界面新闻
2026-05-19 12:46:17
生意太好被处处刁难,屠夫6天杀13人,公安部A级通缉犯石悦军落网

生意太好被处处刁难,屠夫6天杀13人,公安部A级通缉犯石悦军落网

易玄
2026-05-18 23:06:35
特写:中俄博览会上的俄罗斯舞者

特写:中俄博览会上的俄罗斯舞者

北青网-北京青年报
2026-05-19 14:49:21
2026-05-19 21:19:00
豹变
豹变
最具穿透力洞察力的商业观察
2140文章数 20987关注度
往期回顾 全部

财经要闻

从卖流量到卖Token,运营商算力生意破局

头条要闻

男子花20多万买到洗白"试验车" 结果被强制注销成废铁

头条要闻

男子花20多万买到洗白"试验车" 结果被强制注销成废铁

体育要闻

文班亚马:没拿到MVP,就证明自己是MVP

娱乐要闻

姚晨删博难平众怒,为什么她还能蹦哒

科技要闻

马斯克败诉,法院判他起诉OpenAI太晚了

汽车要闻

焕新极氪009上市41.38万起 齐家版让MPV回归家庭

态度原创

时尚
艺术
健康
公开课
军事航空

休闲阔腿裤怎么穿才美?看看这些穿搭公式,解锁不重样的造型

艺术要闻

丁一林油画风景写生新作(2026年5月)

专家揭秘干细胞回输的安全风险

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

特朗普暂缓打击伊朗 称系应中东三国请求

无障碍浏览 进入关怀版