梁文锋讨厌两件事:跟VC吃饭,对外解释DeepSeek的决策。
过去两年,腾讯来过,阿里来过,几乎所有顶级风投都在他的闭门羹列表里。他的理由很直接——"VC的钱是负担",这些人得帮LP赚钱,"所以谈不到一块去"。
![]()
他有说这句话的底气。据接近他的人透露,梁文锋有一笔20到30亿的自有资金,不用对外募资。另有顶级资本人表示,他曾对外称有四五万张卡,40、50亿拿得出来,不需要外部机构掏钱。
2026年4月24日,事情变了。DeepSeek发布V4,万亿参数MoE架构,MIT协议全量开源,从训练到推理全流程跑在华为昇腾上。同一天,OpenAI发布GPT-5.5。梁文锋选的日子,不是巧合。
V4打消了"DeepSeek技术不行了"的质疑。但真正让市场震惊的是一个月后:DeepSeek启动首轮外部融资,500亿人民币。这是中国AI公司有史以来最大的一轮。梁文锋自己出200亿,国家大基金领投。
融资传闻的跳跃很戏剧性。4月中旬,公开报道称DeepSeek曾与投资人讨论过一轮融资,估值约100亿美元,融资规模约3亿美元。一个月后,金额暴涨至500亿元人民币,估值推到450亿美元。
真正改变市场定价逻辑的,是V4发布。
V4之前,市场看DeepSeek是一家效率极高的模型公司:训练成本低,模型能力强,开源生态有影响力。V4之后,市场看的是国产AI基础设施里最关键的模型节点之一——它率先走通"国产算力+大模型"的路径,完成"去英伟达化"。
黄仁勋的评价很直接:"一旦DeepSeek率先在华为平台上发布,对美国而言将是灾难性的结果。"
但梁文锋的说法是另一回事。DeepSeek内部人员向雷峰网透露,他曾在内部明确表示:"我们不是因为缺钱才融资,而是需要一个明确的估值锚点,来兑现员工的期权价值。过去三年,大家跟着我一起打拼,付出了很多。我不能让大家的努力白费。"
在此之前,他多次公开表示"DeepSeek不缺钱,短期内无融资计划"。
过去几年,DeepSeek员工手中的期权,可能是中国AI圈最难估值的资产。公司技术实力顶尖,开源模型被全球开发者广泛使用,但从未进行过外部融资,没有公开估值,也没有明确上市时间表。
早期这不是问题。核心团队愿意为"做出世界级模型"接受不确定性。但当DeepSeek成为字节、腾讯、小米、阿里竞相挖角的"人才货架"时,问题开始凸显。
DeepSeek过去是挖人的一方。2024年前后,国内大模型圈流传一个说法:DeepSeek给钱很猛,也敢给年轻人机会。一位顶级猎头曾对雷峰网说,早期只有DeepSeek去挖字节的人,很少听说字节能反向挖DeepSeek的人。有机构给两位博士开到260万、270万元年包,DeepSeek直接在此基础上再加100万元。
这套打法在DeepSeek还没完全出圈时有效。加入DeepSeek意味着能在小团队里直接碰核心模型,能发论文,能把名字写进技术报告,能参与国内最前沿的大模型训练。对顶尖研究员来说,这比在大厂做螺丝钉更有吸引力。
DeepSeek火了以后,它的人也变成了"明牌资产"。一个在DeepSeek参与过基座模型、推理模型、多模态、OCR的人,拿到市场上就是硬通货。大厂能给出确定的现金、签字费和总包。
王炳宣,DeepSeek第一代大语言模型核心作者,去了腾讯。罗福莉,V3模型核心贡献者,雷军开价千万年薪,去了小米。郭达雅,R1核心研究员,去了字节跳动Seed团队,传闻总包近亿元。多模态技术核心研究员阮翀加入元戎启行,OCR系列核心作者魏浩然也已离职。
2025年下半年到2026年初,不到半年,走了五个人。
DeepSeek总共不到200人。核心研究团队100多人。基模架构团队——真正做模型本体的人——只有小几十人。
小团队的弱点同样明显:任何一个关键人离开,影响都会被无限放大。万人大厂走几个研究员可能只是组织波动,但对DeepSeek来说,连续走掉几个核心作者,就意味着某条技术线要从头重组。
更麻烦的是,DeepSeek的核心竞争力建立在"人和系统的强耦合"上。它不是简单堆卡,也不是照搬已有框架,而是在模型结构、训练策略、通信优化、推理成本上做了大量独特的工程取舍。DeepSeek-V2论文里的MLA、DeepSeekMoE等设计,本质上是算法、系统和硬件约束共同优化的结果。
一个研究员离开,带走的不仅是代码和论文里的显性成果,还有大量未被完整文档化的隐性经验:哪些训练策略试过但失败了,哪些通信优化在特定硬件上有效,哪些模型结构看起来漂亮但工程上跑不通。这些东西很难写进论文,却决定了公司能不能持续推出前沿模型。
所以DeepSeek真正要解决的,不只是薪酬问题。总包可以谈,签字费可以加,但最致命的是:期权没有市场化定价锚点。
理想可以让人上车,但只有明确的价格,才能让人长期坐稳。融资,就是给未来标价。
一位AI创业公司合伙人向雷峰网表示,DeepSeek这轮融资本质上是一场"OpenAI式的期权重估"。OpenAI早年也经历过完全相同的困境:大量研究员为了理想加入,但随着公司估值飙升和商业化加速,如何让核心人才分享公司增值,成为组织稳定的关键变量。最终,OpenAI通过多轮融资和二级交易,让员工股权获得了可参照的市场价格。
这轮融资里最有戏剧性的部分:梁文锋自己出了200亿,占本轮融资总额的40%。
对此,业内资深人士给出了三种解读。
第一种,如果公司需要的是500亿现金来发工资搞研发,梁文锋自己出200亿就够了——国家大基金和腾讯是"陪跑"。
第二种,说明DeepSeek真正需要的不是500亿现金,而是"500亿"这个数字本身。一个经过市场验证的估值锚点。有了这个锚点,员工手里的期权才有了可交易、可定价、可变现的参照系。
第三种,梁文锋用200亿锁定40%股权,既向市场证明信心,又确保控制权不被稀释。国家大基金领投,则给这一定价背书,同时解决"国产替代"叙事下的政策合规问题。
三种解读指向同一个结论:这不是一笔为了烧钱的融资,而是一次为了"定价"的融资。
DeepSeek的困境,某种程度上是中国AI创业公司的缩影。技术能力可以靠论文和开源模型证明,但组织能力、人才留存、长期激励,这些软实力需要更复杂的金融工具来支撑。
梁文锋的选择,是用一场创纪录的融资,把"理想主义"翻译成"市场价格"。500亿是一个信号——告诉员工,你们手里的期权值这个数;告诉竞争对手,挖人的成本要重新计算;告诉整个行业,国产大模型的估值体系,可以独立于英伟达生态存在。
但信号归信号,真正的考验还在后面。期权有了锚点,不等于能变现。DeepSeek仍然需要回答:商业化路径是什么?上市时间表有没有?二级市场的流动性如何设计?
这些问题,梁文锋可能依然不想跟VC解释。但500亿融资之后,他或许不得不学会另一件事:如何在一个被定价的世界里,继续做一个讨厌定价的人。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.