网易首页 > 网易号 > 正文 申请入驻

不缺钱的梁文锋,为什么要融资?

0
分享至

文 | 版面之外,作者|画画

DeepSeek 开始接触外部资本了。

The Information 引述四位知情人士报道,DeepSeek 正在寻求至少 3 亿美元的首次外部融资,估值不低于 100 亿美元。

如果把时间拨回两年前,这几乎是一个不成立的命题。在那段时间里,这家公司是整个中国 AI 行业里最反常识的存在。

当所有人都在融资、扩张、讲生态、抢入口的时候,DeepSeek反而在做一种刻意的收缩,不对外发声,不频繁发产品,不参与大厂叙事,甚至对资本保持距离。

很多投资人尝试接近过,得到的反馈几乎一致:没有融资计划。

在一个高度资本驱动的行业里,这种姿态显得反工业逻辑。但也正因为如此,DeepSeek 一度被视为一个异类样本,一个试图在 AI 时代验证"少资源路径"的团队。

所以这次融资信号里,真正重要的不是金额,也不是估值,是它打破了一种持续两年的策略前提:DeepSeek 不再试图把自己隔离在体系之外。

一、DeepSeek的防火墙

梁文锋对外部资本的排斥有很深的根源。

2022 年前后,量化行业被政策持续打压,幻方管理规模从巅峰时期的千亿缩减了大半。手里攥着大量富余的 GPU 集群和现金,梁文锋一度想通过投资入股或云厂商合作的方式把算力用出去。

他专门招了两个人做战投,看了一圈科技项目,低空经济、智能硬件、SaaS,最终一个也没投。

当时DeepSeek内部的判断是,外面能做的事,自己也做得了。

2023 年 7 月,DeepSeek 正式成立。梁文锋从第一天就给这家公司划了一条线,不接受外部融资,不稀释股权,不被任何人的商业化时间表绑架。

他想造的东西,更像一个纯粹的研究机构,追 AGI、做开源、让技术本身说话。

底气是实打实的。

早在 2019 年,他就花 2 亿元自研了深度学习训练平台萤火一号。两年后又砸 10 亿元建萤火二号,大批采入英伟达 A100,把幻方做成了国内屈指可数的万卡集群公司。

疫情期间芯片供应最紧张的那阵子,幻方已经提前囤好了货。2025 年,幻方全年收益率 56.6%,营收超 50 亿人民币。

梁文锋的钱袋子,比绝大多数 AI 创业公司的投资人都丰盛。

有钱、有卡、有人。VC 的钱反而是负担,带着对赌、带着估值压力、带着什么时候变现的追问。他说得很直接:VC 都是帮 LP 管钱,都得赚钱,所以就谈不到一块去。

这条路在 2025 年 1 月到达了巅峰。R1 发布,训练成本约 560 万美元,性能逼近 OpenAI 的顶级系统。

"用十分之一的钱做出同级模型",这个故事让行业意识到一件事,顶级模型能力,并非只能通过极端的资源堆叠获得。

那一刻,DeepSeek 的意义被迅速放大。它提供的不只是一个模型,是一种可能性,在资源不占优的情况下,仍然可以进入核心竞争区。

防火墙不仅立住了,还成了故事的一部分。

但故事的问题在于,它需要不断被续写。

二、裂缝出现了

裂缝不是突然出现的,它从 R1 发布之后就开始生长,只是当时的信号是分散的。

最先松动的是人。

顶级模型团队有一个共性,核心成员的市场价值极高,一旦项目进入空档期,这些人就会成为整个市场的目标。

最早被注意到的是罗福莉,V3 架构的关键开发者,2025 年底转投小米接手 MiMo 大模型团队。差不多同一时期,第一代大语言模型核心作者王炳宣去了腾讯,多模态方向的核心研究员阮翀加入元戎启行做首席科学家,OCR 系列核心作者魏浩然也在今年春节前后离开。

然后是郭达雅。1994 年生,中山大学博士,在 DeepSeek 只待了两年,却全程参与了 V3、R1、Coder、Math、Prover 等几乎所有标志性模型的研发。他提出的 GRPO 算法是 R1 的核心技术底座,论文总被引超过 37000 次,在同龄的中国 AI 研究者里几乎找不到对手。

就在前两天,郭达雅加入字节跳动,方向是智能体。(延伸阅读:张一鸣,信达雅)

五个核心研发骨干,在不到一年的时间里相继出走。这些流动的意义超出了人走了本身,在模型研发里,经验高度路径依赖,核心成员的离开会直接影响下一轮迭代的效率和节奏。

他们为什么走?

猎头圈流传的数字是,大厂给 DeepSeek 核心技术人员的开价,普遍是原薪资的两到三倍。字节 Seed 团队从 2025 年 9 月起推出专项期权津贴,按职级每月发放 9 万到 13.5 万元不等的期权,价格低于内部回购价,相当于直接打折。

梁文锋的管理哲学在中国科技行业里几乎是个异类:不加班、不打卡、不设 KPI。员工下午六七点走人,早上不用签到。

他认为一个人每天高质量工作的时间很难超过六到八小时。这种文化在 DeepSeek 还是小团队的时候运转得很好,聪明的人给够自由度,他们自己会往最难的方向冲。

但当外面有人拿八位数总包来敲门的时候,自由就不够用了。

更致命的是期权。DeepSeek 从未融资,没有市场化的估值锚点。你给核心成员一个股权承诺,他拿到手里没法换算成真金白银。大厂的期权有行权价、有内部回购机制、有 IPO 预期。外界只知道 DeepSeek 很值钱,但到底值多少,没有人能说清,员工更不知道。

郭达雅的离开可能比薪资的账面差距更值得琢磨。他去字节做的是智能体,DeepSeek 至今没有任何一个 Agent 产品,R1 发布时甚至不支持 function call(函数调用)。

想做 Agent,但所在的公司不做这个方向,这种错位,给再多钱也填不上。

与人一起松动的,还有产品节奏。

下一代旗舰 V4 原本定在春节前后发布,推到 2 月,再推到 3 月,目前的口径是 4 月下旬。从公开信息来看,延期背后至少有三层原因交织在一起。

最直接的一层是技术路线本身发生了质变。

V4 要做的已经不再是一个刷 benchmark 的基础模型,万亿参数 MoE 架构、原生多模态、百万 token 上下文、全新的 Engram 条件记忆机制,这是系统级工程,训练验证的复杂度陡然上了一个台阶。

更深一层的压力来自身份包袱。

DeepSeek 立身靠的是十分之一成本做到顶级这个故事。V4 如果只是性能微增却推高了推理成本,支撑估值和声誉的故事就会出现裂痕。某种程度上,一个不够惊艳的 V4,反而不如不发。

还有一层很少被充分讨论。国产芯片的深度适配。多方信源在 4 月初披露,V4 将全面运行在华为昇腾 950PR 芯片上,有望成为首个完全跑在国产算力上的旗舰大模型。战略价值极高,但这本身就是一个独立的巨型工程,直接吃掉了大量研发带宽。

到 2026 年 4 月,DeepSeek 已有 15 个月没有大版本更新。而这期间,OpenAI 迭代四五轮,Anthropic 连推 Claude 4.5/4.6/4.7,国内同行如智谱、月之暗面、字节也在应用层狂飙突进。

所有人都在加速,只有DeepSeek 静悄悄。

和很多团队不同,DeepSeek 在 R1 之后没有迅速扩张,没有大规模商业化推进,没有密集的版本更新。

当时不少人把这种节奏理解为定力。但从今天回看,它更接近一种主动选择,尽可能延长"实验室状态"的时间。

保持克制本质上是在控制节奏,但当外部环境整体加速时,节奏就不再完全由自己决定了。

三、竞争换了一套逻辑

如果把 DeepSeek 当前的处境单独看,很容易归因为公司内部问题。但更关键的变量来自外部,过去15个月,整个行业的竞争维度发生了巨大的迁移。

更早的时候,大模型竞争的核心在架构、训练方法和工程优化上。2026 年之后,新的东西开始占据主导,算力池的规模、人才的密度、应用层的反馈速度。三者共同决定了迭代能跑多快。

海外头部公司的收入结构已经说明了方向。

Anthropic 年化收入从 90 亿美元翻到 300 亿美元,用了四个月,增量几乎全部来自 Claude Code 这一款编程智能体。Cursor 一个代码编辑器,估值 600 亿美元。GitHub Copilot 覆盖了 2000 万开发者。

钱在流向能直接产出代码、产出工具、产出应用的产品。

国内同行也在快速补位,字节、阿里、腾讯各自铺了 Coding 和 Agent 产品线,智谱和月之暗面的 API 在年初的小龙虾热潮中被打爆,恰恰因为它们在 Coding 方向上的押注。

很显然,单点的模型能力仍然重要,但不再是唯一的决定因素。资源、组织、系统能力,开始成为关键变量。中国几家头部公司过去一年的动作路径不同,方向一致,把模型能力嵌入到更大的系统里。

DeepSeek 有全球开源社区最高的人气,GitHub 上 17 万颗星,2.6 万个企业账户,每月 57 亿次 API 调用。但它没有自己的 IDE,没有 Coding 工具,没有 Agent 产品,没有终端用户直接为之付费的垂直应用。

梁文锋一直坚持模型是一切的根基。

他最近署名的论文方向,条件记忆机制、超连接优化 Transformer,说明DeepSeek的注意力仍然在解决底层问题。这种执着在 R1 时代被验证过,用最少的钱和人,把基础能力做到极致,剩下的交给开源生态。

但当竞争从基础模型能力扩展到能力 + 产品 + 生态同时比拼的时候,只有发动机没有整车,再强也跑不起来。

3 月 29 日晚间,DeepSeek 遭遇了上线以来持续时间最长的一次服务中断,超过 7 小时,波及数亿用户。官方没有解释原因。中断期间竞品流量明显跳升,部分企业客户开始考虑多平台冗余策略。

一次宕机不会杀死一家公司,但它把一个事实推到了台面上。当用户从百万级涨到亿级,基础设施的投入就不是效率优化能兜住的了。

幻方的利润撑得住,但撑得不从容。

四、3 亿美元买什么?

3 亿美元对 100 亿美元的估值来说,稀释比例不到 3%。对比 Anthropic 和OpenAI 这样的巨头来说,这个数字甚至显得极为克制。

梁文锋真正想买的东西,可能不在资产负债表上。

首先,期权终于有了锚点。 100 亿美元的定价一旦确认,核心团队手里的股权就成了真金白银。对一个正在被大厂逐个挖角的团队来说,这个信号比任何加薪方案都管用,现阶段止住人才流失至关重要。

其次,这是 V4 的保险金。

华为昇腾的全量适配本身就在烧资源,与此同时媒体报道称DeepSeek 也在用英伟达最新一代 Blackwell 芯片训练下一代模型,而这款芯片受出口管制影响,获取节奏存在变数。两条硬件路线并行,资金消耗成倍放大。

最微妙的一层是,这是一张进入下半场的入场券。

AI 竞争已进入模型、产品、生态、资本四轮驱动的阶段。你可以拥有全球最好的发动机,但如果没有资本背书和产品生态,你最终只是产业链里的一名高级供应商,看别人拿你的模型赚钱。

从 V4 的研发方向来看,梁文锋大概已经意识到了这一点。多方信源显示,V4 的规划明确包含了 AI 搜索、长期记忆和代码能力的大幅跃升,这些都是 Agent 时代的底层能力。

DeepSeek 在补课。融资,是为了让这门课来得及上完。

【版面之外】的话:

外界很容易把这次转向理解为妥协。但换一个角度看,它更接近一种从实验状态向工业状态的进化。

AI 行业的成本曲线已陡然上扬,人才通胀超出了所有人的预期。依靠个人风格和单一利润源去扛一家超级独角兽,变得越来越不现实。

梁文锋过去的选择有它的逻辑,控制规模、避免过早商业化、保持研发的纯度。这样的选择,在特定阶段极具爆发力,但行业节奏最终会对所有人产生约束。

3 亿美元,是梁文锋第一次公开承认这件事。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
何润东扮演项羽助阵!宿迁队主场2-0复仇南京:霸王坐镇所向披靡

何润东扮演项羽助阵!宿迁队主场2-0复仇南京:霸王坐镇所向披靡

风过乡
2026-04-18 21:44:45
沙特带头,阿联酋紧跟,卡塔尔随后,中东开始大变局

沙特带头,阿联酋紧跟,卡塔尔随后,中东开始大变局

明天见灌装冰块
2026-04-18 13:24:18
朱芳雨:很遗憾没能用胜利答谢球迷,希望季后赛能得到大家支持

朱芳雨:很遗憾没能用胜利答谢球迷,希望季后赛能得到大家支持

懂球帝
2026-04-18 23:29:08
2-2!热刺遭绝平仍陷降级区 15轮不胜创纪录 传射功臣沮丧快哭了

2-2!热刺遭绝平仍陷降级区 15轮不胜创纪录 传射功臣沮丧快哭了

我爱英超
2026-04-19 05:29:34
10小时高铁彰显外交态度!苏林以行动拒绝德日,表明越南的新选择

10小时高铁彰显外交态度!苏林以行动拒绝德日,表明越南的新选择

魔都姐姐杂谈
2026-04-18 13:59:48
4月16日俄乌最新:乌克兰终于迎来了春天

4月16日俄乌最新:乌克兰终于迎来了春天

西楼饮月
2026-04-16 19:10:03
90分钟战报:马竞2-2皇社,小蜘蛛扳平比分,双方进入加时

90分钟战报:马竞2-2皇社,小蜘蛛扳平比分,双方进入加时

懂球帝
2026-04-19 05:19:12
台湾突然宣布重磅决定,岛内数万人联名反对,郑丽文成众望所归

台湾突然宣布重磅决定,岛内数万人联名反对,郑丽文成众望所归

素衣读史
2026-04-19 05:35:36
骑士灭猛龙总分1-0:哈登22+10总分超伯德 米切尔32分创历史第一

骑士灭猛龙总分1-0:哈登22+10总分超伯德 米切尔32分创历史第一

醉卧浮生
2026-04-19 05:51:10
054A护卫舰缠斗美舰20小时,边航行边紧急装弹,一度准备开火击沉

054A护卫舰缠斗美舰20小时,边航行边紧急装弹,一度准备开火击沉

十三级台阶
2026-04-18 17:33:54
黄圣依17年终错付,杨子带23岁新女友见91岁母亲,铜钱盆抢镜

黄圣依17年终错付,杨子带23岁新女友见91岁母亲,铜钱盆抢镜

卷史
2026-04-18 13:54:59
蒜苔开始上市!再三强调:高血压患者吃蒜苔时,多注意这5点

蒜苔开始上市!再三强调:高血压患者吃蒜苔时,多注意这5点

芹姐说生活
2026-04-18 14:47:34
日舰穿行台海不是路过,是试探;中方没开火,不是不敢,是算得清

日舰穿行台海不是路过,是试探;中方没开火,不是不敢,是算得清

Ck的蜜糖
2026-04-19 00:47:08
还能抗多久?雷军内外交困!15小时熬夜直播自证,挡不住资本质疑

还能抗多久?雷军内外交困!15小时熬夜直播自证,挡不住资本质疑

临云史策
2026-04-18 17:02:00
马斯克又向激光雷达开炮!没有人比我更懂激光雷达

马斯克又向激光雷达开炮!没有人比我更懂激光雷达

科技每日推送
2026-04-18 12:41:37
百年难得一遇,2025届新秀前5顺位没有一个水货,全是超巨苗子!

百年难得一遇,2025届新秀前5顺位没有一个水货,全是超巨苗子!

君子一剑似水流年
2026-04-18 06:48:08
伊朗称霍尔木兹海峡于18日晚起关闭

伊朗称霍尔木兹海峡于18日晚起关闭

极目新闻
2026-04-19 07:16:06
国王杯:皇社点球大战6-5绝杀马竞,惊险夺冠

国王杯:皇社点球大战6-5绝杀马竞,惊险夺冠

二爷台球解说
2026-04-19 06:42:35
足坛疯狂夜:热刺被绝平,切尔西四连败,马竞无缘冠军

足坛疯狂夜:热刺被绝平,切尔西四连败,马竞无缘冠军

老牛体育解说
2026-04-19 06:44:31
与泰国女友吵架后失联 中国台湾男子在芭提雅医院被找到 正接受心理治疗

与泰国女友吵架后失联 中国台湾男子在芭提雅医院被找到 正接受心理治疗

曼谷陈大叔
2026-04-18 13:37:05
2026-04-19 07:47:00
钛媒体APP incentive-icons
钛媒体APP
独立财经科技媒体
132458文章数 862104关注度
往期回顾 全部

财经要闻

"影子万科"2.0:管理层如何吸血万物云?

头条要闻

媒体:特朗普对伊朗发动攻击 美国遭遇四大挫败

头条要闻

媒体:特朗普对伊朗发动攻击 美国遭遇四大挫败

体育要闻

时隔25年重返英超!没有人再嘲笑他了

娱乐要闻

刘德华回应潘宏彬去世,拒谈丧礼细节

科技要闻

传Meta下月拟裁8000 大举清退人力为AI腾位

汽车要闻

奇瑞威麟R08 PRO正式上市 售价14.48万元起

态度原创

时尚
健康
本地
艺术
教育

选对发型,真的能少走很多变美弯路

干细胞抗衰4大误区,90%的人都中招

本地新闻

12吨巧克力有难,全网化身超级侦探添乱

艺术要闻

夜色下的欧洲

教育要闻

父母永远不看孩子的脸色

无障碍浏览 进入关怀版