来源:市场资讯
(来源:AI信息Gap)
「不差钱」的 DeepSeek,今天终于张口要钱了。
The Information 独家披露,DeepSeek 正在洽谈首次对外融资。
融资金额至少 3 亿美元。估值不少于 100 亿美元。
![]()
上一次传 DeepSeek 融资,还是 14 个月前。
2025 年 2 月 7 日,阿里 100 亿估值投资 10 亿美元入股 DeepSeek 的消息流出。阿里副总裁颜乔当晚就在朋友圈亲自辟谣,「外界流传阿里投资 DeepSeek 的信息是假消息」。
12 天后 The Information 又爆料 DeepSeek 内部在讨论是否接外部资本,DeepSeek 相关人士也回了一句,「融资相关均为谣言」。
去年 2 月的热闹,就这么被压下去了。
今天再次传出的这条消息,暂时还没人跳出来辟谣。
估值 100 亿,是不是卖便宜了
有意思的是这个估值数字。
100 亿美元,比 2025 年初外界估的 34 亿翻了三倍,听着很猛。
但其实不然。
Kimi 三月份的新一轮估值,180 亿。智谱和 MiniMax 更猛,1 月双双在港股上市,市值一度都冲到 400 亿美元这一档,MiniMax 甚至短暂超过了百度。
![]()
被资本追着跑的几家头部国产大模型公司,估值都在 180 亿到 400 亿美元之间。曾经全球 AI 圈讨论度最高的 DeepSeek,开出来的价却只有他们的一半到四分之一。
幻方养不动了?
DeepSeek 能「不融资」走到今天,靠的是一个别家模型公司都没有的外挂。
它的母公司,幻方量化。
幻方管理规模 100 亿美元以上,2025 年平均收益 56.6%。
幻方一年在二级市场赚的钱,随手就够 DeepSeek 烧。
![]()
金沙江创投朱啸虎去年也表过态。
「我肯定会投啊!这个价格已经不太重要了。」
那会儿 DeepSeek 没松口。
这次的 3 亿美元融资如果属实,就是这条路变了。
V4 要来了。
据爆料,这一代 V4 是一个万亿参数的 MoE,支持原生多模态。它也是 DeepSeek 第一个专门为国产芯片优化的模型。
从英伟达彻底换到国产芯片,整套技术栈都要重写。据报道 V4 已经因为软件栈磨合不顺,推迟过两次。烧钱量级跟过去的 DeepSeek 不是一个级别。
幻方能养一个专心搞研究的 DeepSeek,但一个既要换国产芯片、又要支持全球 API 调用、还要做多模态的 DeepSeek,就不一定了。
这两天,DeepSeek 还干了另一件事
就在融资消息传出的前一天,DeepSeek 负责「榨干显卡性能」的开源项目 DeepGEMM 悄悄更新了。
![]()
一个万亿参数的大模型里,可能有几百个「专家」。你问个问题,系统先判断「该找哪几个专家」,然后把活派给他们,他们算完,再汇总答案。派活、计算、汇总,三步。
传统方法是一步一步来,前一步没干完后一步就得等。显卡部分时间在空转。
融合算子 Mega MoE 把这三步整合成了一步。计算的同时,显卡之间传数据的通道(NVLink)也不闲着,同步把下一批数据传过去。
「让同样的显卡,跑出更多算力。」
这正是 DeepSeek 最擅长的事。别人猛堆硬件,它优化底层。
完全开源,免费。
The Information 报道,「DeepSeek 之前多次拒绝了中国顶级 VC 和科技公司的投资意向。这次摆上台面,态度确实有所松动。」
对资本来说,DeepSeek 可能是那种最罕见的标的之一。
模型 TOP,成本够低,品牌有全球影响力,还不折腾。
只要故事还没讲完,钱就会继续往头部堆。
后面就差 V4 兑现了。
我是木易,Top2 + 美国 Top10 CS 硕,现在是 AI 产品经理。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.