来源:市场资讯
(来源:新行情)
![]()
AI黄金时代,梁文锋在风口上起舞。
出品 | 新行情 作者 | 宋辉
DeepSeek首轮融资有了新消息,曝国家队入局领投。
近日,英国《金融时报》援引多位知情人士消息称,中国国家集成电路产业投资基金,也就是业内熟称的“大基金”,正与DeepSeek接触,讨论领投其首轮融资。
![]()
X
若交易最终落地,DeepSeek估值可能接近450亿美元,约合人民币超3000亿元。
与此同时,消息人士透露,目前跟DeepSeek接触的投资方不止一家,除了大基金这样的国资代表,阿里等几家互联网大厂也在谈判桌上,只是各家眼下态度都很谨慎,最终谁进谁不进、估值定多少,都还没画句号。
![]()
DeepSeek估值超3000亿,大基金或领投
“大基金”的全名是国家集成电路产业投资基金,是目前国内规模最大的国家级产业投资基金。
过去几年,大基金主要聚焦半导体产业链,包括设备、材料、制造、芯片等方向。
如今,突然传出领投DeepSeek这种大模型公司的消息,还是头一回。
换句话说,AI已经不只是互联网行业的故事。更宏观地看,国家资本对于AI产业的态度正在更明确。
当然对于以上消息,截至发稿,DeepSeek方面尚未做出回应。
回到估值本身,450亿美元这个数字,放在一个月前恐怕没人敢想。
4月17日,The Information放出消息称,DeepSeek开始接触外部资本,当时的估值口径是超过100亿美元,计划融至少3亿美元。
![]()
The Information
到了4月22日,The Information补充说,估值已经跳到超过200亿美元。
如今两周后,估值又从200亿涨到450亿,估值膨胀的速度在业内实属少见。
而把这个450亿美元放在整个行业地图上看,位置会更清楚。
国内同行里,今年1月上市的智谱AI,目前市值超500亿美元;MiniMax目前超300亿美元;月之暗面(Kimi)刚完成新一轮融资后,估值突破200亿美元。
可以说,450亿美元,在国内独立AI公司里已经排进第一梯队了。
那么,资本市场为什么给出了如此高的定价?
一方面,DeepSeek具备了目前行业里稀缺的几个特征。
第一,它已经拥有一定的全球开发者影响力和社区中不错的口碑。
AI行业和传统互联网行业不太一样,很多时候它并非单纯靠广告、营销建立影响力,而是依靠技术社区自发传播。开发者会主动测试模型能力,也会把真实使用体验持续反馈到社区中,而这些技术社区里的口碑,往往比商业宣传更有价值。
MIT与Hugging Face的联合研究显示,截至2025年8月,中国开源模型在全球下载总量中已占17.1%,首次超越美国的15.86%,而DeepSeek和阿里的Qwen正是两个最大的贡献者。
2025年下半年以来,OpenAI与Anthropic也在技术报告中多次将DeepSeek列为重点跟踪对象。2025年9月,DeepSeek甚至登上了Nature封面。
下载量、开发者反馈密度、竞争对手点名频率,在投资机构看来,这些都是可以量化的信号。
![]()
第二,在资本市场看来,DeepSeek的优势在于,此前融资节奏一直比较克制,目前股权结构相对集中。
公开信息显示,DeepSeek主要由幻方量化支持,而创始人梁文锋通过个人持股及关联实体控制DeepSeek 84.29%的股份,有极强的控制权。
![]()
这意味着,公司未来在战略方向、研发投入以及长期路线选择上,会拥有更强决策效率。
另一方面,从最近的动作来看,DeepSeek让市场进一步看到了其模型能力和成本控制的想象空间。
4月24日,DeepSeek放出了V4预览版,还同步了开源。资料显示,V4用了1.6万亿参数的混合专家架构,上下文窗口拉到百万token级别,在代码生成和长文档理解上明显比前代强了一截。
![]()
DeepSeek公众号
与此同时,DeepSeek还宣布,V4将完全跑在华为昇腾950PR芯片上,训练框架从英伟达的CUDA切到了华为的CANN。即DeepSeek已经不是单纯在做模型了,而是在跑通一套从芯片到框架再到应用的国产闭环。
模型一发布,降价也跟着来了。4月25日,DeepSeek对V4-Pro的API搞了限时2.5折优惠。隔天又宣布全系列API输入缓存命中价格降到原来的十分之一,叠加上折扣后,V4-Pro每百万token输入缓存命中只要0.025元。
各种因素叠加,资本市场自然会给予更高溢价。
![]()
不缺钱的DeepSeek,为什么开始融资了?
聊到融资,一个随之而来、不可避免的问题就是:幻方量化不是赚了很多钱吗,怎么突然要融了?梁文锋顶不住了?
一直以来,DeepSeek“人设”都是国内少数“不急着融资”的AI公司。相比其他大模型创业公司频繁融资、快速扩张,其给人的感觉更像一支低调的技术团队。
从账面数字来看,DeepSeek的确不缺钱。
2025年,幻方量化平均收益率56.6%,管理规模超700亿,同期百亿量化私募平均水平才37%左右,直接甩开同行将近20个百分点。另外,私募排排网数据显示,幻方量化近三年的收益均值为85.15%,近五年的收益均值为114.35%。
![]()
如果按1%管理费加20%业绩提成粗算,光2025年一年就进账50亿人民币上下。业内人士估算,仅这一年,幻方就为梁文锋输送了超过7亿美元。
梁文锋自己也公开讲过,VC的钱是负担,VC都是帮LP管钱的,都得赚钱,谈不到一块去。
但不缺钱是一年前的逻辑,现在情况已经变了。
AI行业有个特点:越强花钱越快。
训练一个大模型,单次成本几千万美金起步。训练完了要推理部署,部署完了要持续迭代,每多一个用户、每多一个调用场景,对应的算力账单都在往上翻。
DeepSeek在变得更强,但成本也在跟着往上涨。
而且,行业格局也在迅速变化。
过去,大模型是Chatbot时代,一次训练反复调用,推理成本相对可控。现在,整个行业在快速切到Agent逻辑,一条复杂任务链消耗的token是Chatbot时代的几十倍甚至上百倍。
简单说,AI行业正在进入一个典型的“重资产阶段”。在这个背景下,仅靠原有体系继续“小而精”地推进,显然很难支撑下一阶段竞争。
这一点非常现实。
除此之外,人才也是一个非常现实的命题。
2025年下半年开始,DeepSeek至少流失了5名核心研发成员,覆盖基座模型、推理、OCR和多模态四条核心技术线。
公开的名单显示,其中第一代大语言模型核心作者王炳宣去了腾讯,V2/V3关键贡献者罗福莉被雷军千万年薪挖至小米,R1核心研究员郭达雅确认加入字节跳动Seed团队,OCR核心作者魏浩然、多模态项目负责人阮翀也先后离职。
人才的作用不必赘述,对于DeepSeek这样相对较“小”的团队,人才的重要性更是不言而喻。
而若长期没有外部融资,员工手里的期权协议缺乏明确的公司估值支撑,流动性几乎为零。在大厂重金抢人、动辄“翻2到3倍”的薪酬包面前,更显得单薄。
对此,路透社称,DeepSeek本轮融资的重要目标之一,就是进一步扩展算力基础设施,并增强人才竞争力。
换句话说,DeepSeek这轮融资,并不意味着此前路线失败,也不是“缺钱了”,而是意味着它已经准备进入更大规模竞争阶段。
大模型本质上是一个资源高度集中的行业,接下来,资金、人才、开发者生态都会向头部进一步集中。因此,未来真正能留在牌桌上的公司,其实不会太多。
现阶段,幻方量化的现金流虽然能保证DeepSeek活下去,但梁文锋的目标是,不仅要活下去,还要活在前排。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.