![]()
![]()
这两天,全球科技圈和资本圈被一条消息炸锅。
中国大模型头部玩家DeepSeek(深度求索)正式启动成立以来的首次外部融资,目标估值不低于100亿美元,计划募集资金不少于3亿美元。
但资本市场还是给了很高的预期。
据说这个周末,无数投资人订好了机票,务必要在这千载难逢的窗口期见到那个曾经连电话都不接的梁文锋。
那个曾被拒绝向资本低头的技术理想主义者,也扛不住了?还是梁文锋有更大的布局?
![]()
01
100亿美元估值?估值逻辑是什么?
100亿美元是个什么概念?
参照下同业。2026年1月,智谱AI在港股上市,首日市值528亿港元,约合68亿美元。MiniMax上市首日市值冲到了1067亿港元,约合137亿美元。
![]()
数据来源:公开查询
截至目前公开查询到的数据,DeepSeek尚未盈利,尚未发布V4,尚未有任何商业化数据,却已经在融资谈判桌上开出了100亿美元的价格牌。
这个估值介于智谱和MiniMax之间,但要知道,智谱和MiniMax已经在港交所挂牌交易,有公开市场的定价锚。DeepSeek拿的是私募市场的钱,这个估值意味着投资人对它的技术实力和未来商业潜力给出了极高的溢价。
再看海外。OpenAI在今年3月以8520亿美元估值完成1220亿美元融资,Anthropic在2月以3800亿美元估值完成300亿美元G轮融资。
100亿美元放在全球舞台上看,不过是个零头,但在中国AI独角兽阵列里,这个数字已经足够让VC们疯狂了。
![]()
![]()
02
DeepSeek的钱包发生了什么?
DeepSeek由量化私募巨头幻方量化于2023年孵化,创始人梁文锋同时执掌这两家横跨金融与AI的企业。公开工商信息显示,梁文锋在DeepSeek直接和间接持有84.29%的股份,拥有几乎100%的表决权。
这家公司从第一天起就没有拿过外部VC的钱。
梁文锋为什么要拒绝资本?
他曾经说得很直接:VC都是帮LP管钱,都得赚钱,谈不到一块去。他的理想(可能是曾经的理想)是做一个纯粹的研究机构,追AGI、做开源、不被任何人的商业化时间表绑架。
更重要的是,他确实有钱。
幻方量化2025年收益均值高达56.55%,在百亿量化私募中位列第二。按超700亿元的管理规模计算,这意味着约350到400亿元的利润。
业内人士估算,幻方量化2025年的强劲表现可能带来超过7亿美元的收入。相比之下,DeepSeekV3的总训练成本预算仅557万美元。
从账面上看,幻方几个月的利润足以支撑DeepSeek数年的研发投入。早年间梁文锋就已经囤了大量的英伟达GPU,2021年砸10亿元建萤火二号,把幻方做成了国内屈指可数的万卡集群公司。
这就是DeepSeek的底气。在友商拿着PPT融资数亿美元的时候,梁文锋在用自己的钱玩。
但2026年的故事已经不同了。
![]()
数据来源:公开查询
这张表格揭示了一个残酷的事实:大模型的烧钱速度在指数级增长。
2025年你花500多万美元就能训练出一个震惊世界的模型,2026年你可能需要投入十亿美元级别的资金才能跟上节奏。
![]()
02
V4发布前夕,市场变天了
融资消息传出的时间点很微妙。
DeepSeekV4预计在4月底正式亮相,这原本该是这家公司的又一次高光时刻。但在这个节骨眼上,梁文锋选择了向资本开口。
V4的参数规格让所有人大吃一惊:总参数跃升至约1万亿(MoE架构,每个token仅激活370亿参数),上下文窗口扩展至100万token,首次支持原生多模态。
内部测试基准显示SWE-bench超80%、HumanEval达90%。这个模型如果真能跑出这样的成绩,将与美国顶尖大模型处于同一水平线。
但问题在于,V4已经被推迟了好几次。原定春节前后发布,推到2月,再推到3月,目前的口径是4月下旬。
![]()
综合业内人士的分析,延期背后至少有三层原因。
1.技术路线本身发生了质变。V4不再是简单的参数堆叠,而是万亿参数MoE架构、原生多模态、百万token上下文的全新系统级工程,训练验证复杂度陡然上了一个台阶。
2.DeepSeek选择了一条最难的路:彻底去英伟达化。V4将深度适配华为昇腾芯片,工程师们需要将核心代码从英伟达的CUDA生态迁移到华为的CANN架构。
精度对齐需要反复调试,同样的模型在两种芯片上跑出一致结果极其耗时。
3.身份包袱的压力。DeepSeek以“效率神话”立身,V4不能有闪失,否则整个叙事就会崩塌。
这些问题的本质指向同一个东西:钱。
更多的钱意味着更多的算力、更多的工程师、更快的调试进度。
![]()
04
人才正在用脚投票
如果说算力压力是外部推动力,那么人才流失就是内部引爆点。
有媒体报道,自2025年初R1爆红以来,DeepSeek的核心团队正在经历一场“大出血”。V3架构的关键贡献者罗福莉2025年底转投小米,接手MiMo大模型团队。第一代大语言模型核心作者王炳宣去了腾讯。
多模态方向核心研究员阮翀加入元戎启行做首席科学家。OCR系列核心作者魏浩然也在今年春节前后离开。1994年生的核心研究员郭达雅被字节跳动挖走,担任Agent方向负责人之一。
为什么?因为在这个阶段,理想不能当饭吃。对于大部分打工人来说,诗和远方(老板画的大饼)不能充饥,解决当下的生活问题,真金白银进入自己腰包才是实惠的。
DeepSeek从未融资,没有市场化的估值对标。员工手里的股权承诺就是一张无法兑现的白条。
大厂的期权有行权价、有内部回购机制、有IPO预期。外界只知道DeepSeek很值钱,但到底值多少,没有人能说清,员工更不知道。
当字节、小米开出“现金+期权+IPO预期”的组合时,梁文锋拿什么留人?
这个问题只有一个答案:建立市场化的股权激励机制。而要建立这个机制,首先需要一轮市场化的融资,给公司一个公允价值。
![]()
![]()
05
行业竞争背后的重要筹码:资本
2026年全球大模型竞争的格局已经彻底变了。海外市场,OpenAI和Anthropic正在上演“资本之王”的争夺战。
OpenAI以8520亿美元估值完成1220亿美元融资,Anthropic紧随其后以3800亿美元估值融资300亿美元。这两家公司的估值已经不能用市盈率来衡量,完全是“市梦率”。
国内赛道呈现“头部聚集、冷热分化”的格局。
2026年一季度国内通用大模型融资额同比下滑72%,但资金向头部集中明显。阶跃星辰在1月完成50亿元B+轮融资,刷新国内大模型单笔纪录。智谱AI和MiniMax相继登陆港股,市值合计超过1700亿元。垂直赛道的竞争同样激烈,生数科技获近20亿元B轮融资,极佳视界两个月内融资25亿元。
![]()
数据来源:公开查询
在这张牌桌上,DeepSeek再不拿钱,可能真的会掉队。
更直观的数据是:2026年中国日均Token调用量已突破140万亿,两年间增长了1000多倍。算力消耗进入爆发式增长期,V4的训练与规模化部署需要数万张算力卡,投入规模跃升至十亿美元级别。
幻方量化再有钱,毕竟是一家量化基金,不可能无限制地往一个烧钱无底洞输血。
![]()
06
游戏规则变了
过去两年,DeepSeek用“效率神话”证明了技术可以绕开资本的绑架。
它用500多万美元的训练成本做出了对标OpenAI顶级模型的R1,用开源和低价策略颠覆了行业对算力堆叠的迷信。但到了2026年,游戏规则变了。
参数规模从千亿级跃升到万亿级,算力需求从百万美元级膨胀到十亿美元级,竞争从技术单点比拼演变为算力、人才、生态的综合较量。
算力要烧钱,人才要高薪,产品迭代要速度,没有资本的持续支撑,再强的技术也跑不远。
接下来,行业将进入更残酷的资本硬战,谁能融到更多资金,谁能更快实现商业化,谁能构建更稳固的生态,谁就能活到最后。
对于投资者来说,DeepSeek的入局也是一个明确的信号:大模型赛道已经从“讲故事”转向“看业绩”。100亿美元的估值不是终点,而是起点。
V4模型的表现、商业化的进展、算力自主的进度,才是决定它能走多远的关键。
参考此前的其他科技行业的成长轨迹,未来1-2年,可能国内大模型赛道将迎来新一轮洗牌,头部玩家的估值将逐渐回归基本面。
那些真正能赚钱、能落地的模型,才会获得资本的长期认可。而DeepSeek的这轮首融,只是这场洗牌的开始。
声明:本文仅为财经热点分析,观点仅供参考,不构成任何投资或消费建议。
DeepSeek
对此,您怎么看?
期待您在留言区文明理性发布高见,留言点赞最高的朋友,扫码文末投行君微信,可以获得投行圈子精美商务背包一个。
感谢耐心阅读,欢迎顺手点个“在看”
![]()
声明:本平台深耕财经自媒体12年,聚焦资本市场、上市公司和商业、科技最前沿的深度解读,目前全网粉丝超300万,欢迎投稿,如采纳,将支付稿费。引用文章、图片如遇版权问题,请与管理员联系,管理员核实后将及时更正出处、作者、支付一定稿费或进行删除。商务合作、投稿、资源对接,金融同仁入群请扫码添加管理员投行-涤生。
我正在「投行圈子」和朋友们讨论有趣的话题,你⼀起来吧?点击阅读原文,加入投行圈子私域会员。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.