DeepSeek不差钱，为什么要融500亿？|期权|融资|锚点|算法|自然语言|deepseek

DeepSeek不差钱，为什么要融500亿？

2026-05-09 21:13:22　来源: 算力游侠

北京举报

分享至

梁文锋讨厌两件事：跟VC吃饭，对外解释DeepSeek的决策。

过去两年，腾讯来过，阿里来过，几乎所有顶级风投都在他的闭门羹列表里。他的理由很直接——"VC的钱是负担"，这些人得帮LP赚钱，"所以谈不到一块去"。

他有说这句话的底气。据接近他的人透露，梁文锋有一笔20到30亿的自有资金，不用对外募资。另有顶级资本人表示，他曾对外称有四五万张卡，40、50亿拿得出来，不需要外部机构掏钱。

2026年4月24日，事情变了。DeepSeek发布V4，万亿参数MoE架构，MIT协议全量开源，从训练到推理全流程跑在华为昇腾上。同一天，OpenAI发布GPT-5.5。梁文锋选的日子，不是巧合。

V4打消了"DeepSeek技术不行了"的质疑。但真正让市场震惊的是一个月后：DeepSeek启动首轮外部融资，500亿人民币。这是中国AI公司有史以来最大的一轮。梁文锋自己出200亿，国家大基金领投。

融资传闻的跳跃很戏剧性。4月中旬，公开报道称DeepSeek曾与投资人讨论过一轮融资，估值约100亿美元，融资规模约3亿美元。一个月后，金额暴涨至500亿元人民币，估值推到450亿美元。

真正改变市场定价逻辑的，是V4发布。

V4之前，市场看DeepSeek是一家效率极高的模型公司：训练成本低，模型能力强，开源生态有影响力。V4之后，市场看的是国产AI基础设施里最关键的模型节点之一——它率先走通"国产算力+大模型"的路径，完成"去英伟达化"。

黄仁勋的评价很直接："一旦DeepSeek率先在华为平台上发布，对美国而言将是灾难性的结果。"

但梁文锋的说法是另一回事。DeepSeek内部人员向雷峰网透露，他曾在内部明确表示："我们不是因为缺钱才融资，而是需要一个明确的估值锚点，来兑现员工的期权价值。过去三年，大家跟着我一起打拼，付出了很多。我不能让大家的努力白费。"

在此之前，他多次公开表示"DeepSeek不缺钱，短期内无融资计划"。

过去几年，DeepSeek员工手中的期权，可能是中国AI圈最难估值的资产。公司技术实力顶尖，开源模型被全球开发者广泛使用，但从未进行过外部融资，没有公开估值，也没有明确上市时间表。

早期这不是问题。核心团队愿意为"做出世界级模型"接受不确定性。但当DeepSeek成为字节、腾讯、小米、阿里竞相挖角的"人才货架"时，问题开始凸显。

DeepSeek过去是挖人的一方。2024年前后，国内大模型圈流传一个说法：DeepSeek给钱很猛，也敢给年轻人机会。一位顶级猎头曾对雷峰网说，早期只有DeepSeek去挖字节的人，很少听说字节能反向挖DeepSeek的人。有机构给两位博士开到260万、270万元年包，DeepSeek直接在此基础上再加100万元。

这套打法在DeepSeek还没完全出圈时有效。加入DeepSeek意味着能在小团队里直接碰核心模型，能发论文，能把名字写进技术报告，能参与国内最前沿的大模型训练。对顶尖研究员来说，这比在大厂做螺丝钉更有吸引力。

DeepSeek火了以后，它的人也变成了"明牌资产"。一个在DeepSeek参与过基座模型、推理模型、多模态、OCR的人，拿到市场上就是硬通货。大厂能给出确定的现金、签字费和总包。

王炳宣，DeepSeek第一代大语言模型核心作者，去了腾讯。罗福莉，V3模型核心贡献者，雷军开价千万年薪，去了小米。郭达雅，R1核心研究员，去了字节跳动Seed团队，传闻总包近亿元。多模态技术核心研究员阮翀加入元戎启行，OCR系列核心作者魏浩然也已离职。

2025年下半年到2026年初，不到半年，走了五个人。

DeepSeek总共不到200人。核心研究团队100多人。基模架构团队——真正做模型本体的人——只有小几十人。

小团队的弱点同样明显：任何一个关键人离开，影响都会被无限放大。万人大厂走几个研究员可能只是组织波动，但对DeepSeek来说，连续走掉几个核心作者，就意味着某条技术线要从头重组。

更麻烦的是，DeepSeek的核心竞争力建立在"人和系统的强耦合"上。它不是简单堆卡，也不是照搬已有框架，而是在模型结构、训练策略、通信优化、推理成本上做了大量独特的工程取舍。DeepSeek-V2论文里的MLA、DeepSeekMoE等设计，本质上是算法、系统和硬件约束共同优化的结果。

一个研究员离开，带走的不仅是代码和论文里的显性成果，还有大量未被完整文档化的隐性经验：哪些训练策略试过但失败了，哪些通信优化在特定硬件上有效，哪些模型结构看起来漂亮但工程上跑不通。这些东西很难写进论文，却决定了公司能不能持续推出前沿模型。

所以DeepSeek真正要解决的，不只是薪酬问题。总包可以谈，签字费可以加，但最致命的是：期权没有市场化定价锚点。

理想可以让人上车，但只有明确的价格，才能让人长期坐稳。融资，就是给未来标价。

一位AI创业公司合伙人向雷峰网表示，DeepSeek这轮融资本质上是一场"OpenAI式的期权重估"。OpenAI早年也经历过完全相同的困境：大量研究员为了理想加入，但随着公司估值飙升和商业化加速，如何让核心人才分享公司增值，成为组织稳定的关键变量。最终，OpenAI通过多轮融资和二级交易，让员工股权获得了可参照的市场价格。

这轮融资里最有戏剧性的部分：梁文锋自己出了200亿，占本轮融资总额的40%。

对此，业内资深人士给出了三种解读。

第一种，如果公司需要的是500亿现金来发工资搞研发，梁文锋自己出200亿就够了——国家大基金和腾讯是"陪跑"。

第二种，说明DeepSeek真正需要的不是500亿现金，而是"500亿"这个数字本身。一个经过市场验证的估值锚点。有了这个锚点，员工手里的期权才有了可交易、可定价、可变现的参照系。

第三种，梁文锋用200亿锁定40%股权，既向市场证明信心，又确保控制权不被稀释。国家大基金领投，则给这一定价背书，同时解决"国产替代"叙事下的政策合规问题。

三种解读指向同一个结论：这不是一笔为了烧钱的融资，而是一次为了"定价"的融资。

DeepSeek的困境，某种程度上是中国AI创业公司的缩影。技术能力可以靠论文和开源模型证明，但组织能力、人才留存、长期激励，这些软实力需要更复杂的金融工具来支撑。

梁文锋的选择，是用一场创纪录的融资，把"理想主义"翻译成"市场价格"。500亿是一个信号——告诉员工，你们手里的期权值这个数；告诉竞争对手，挖人的成本要重新计算；告诉整个行业，国产大模型的估值体系，可以独立于英伟达生态存在。

但信号归信号，真正的考验还在后面。期权有了锚点，不等于能变现。DeepSeek仍然需要回答：商业化路径是什么？上市时间表有没有？二级市场的流动性如何设计？

这些问题，梁文锋可能依然不想跟VC解释。但500亿融资之后，他或许不得不学会另一件事：如何在一个被定价的世界里，继续做一个讨厌定价的人。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.