文丨胡世鑫 编辑丨叶锦言
出品丨深网·腾讯新闻小满工作室
“这家公司是我目前最看不懂的。”一位国产大模型上市公司的投资部人士这样评价月之暗面。在他看来,月之暗面的模型能力本身没问题。让人困惑的是,这家公司在行业节奏上的走向。
1月21日,在达沃斯世界经济论坛年会上,月之暗面Kimi总裁张予彤表态:“Kimi很快就会发布一个新模型。”六天后的1月27日,月之暗面发布并开源了Kimi K2.5模型。
这是Kimi迄今能力最为集中的一次更新:视觉理解、代码、多模态输入、思考与非思考模式、Agent及Agent集群能力,被统一封装进同一个All-in-one模型之中。发布视频中,杨植麟亲自站台介绍着K2.5。
模型如期亮相,让月之暗面在技术层面给了外界一个明确回应。但在资本与公司化层面,它却走在另一条轨道上。过去一段时间,“AI六小虎”开始分化:智谱、MiniMax先后推进上市。
几乎在同一时间,杨植麟称,公司有100亿元现金,并不着急上市。正是在这种对照下,投资人对月之暗面的“看不懂”,变得更具体。进入行业中场,这是在主动放慢节奏,把筹码继续押在技术路径上,还是不得不承认,已经不在第一梯队?
Kimi K2.5,怎么样?
一位体验过Kimi K2.5的AI创业者表示,该模型给他的直观感受是全面聚焦于“生产力”:核心转向编程、办公与复杂任务协作,而非扩展零散功能。“它不是靠跑分证明自己,而是靠实际产品能力。”他强调,这种在具体任务中的体感差异,比分数更有说服力。
K2.5的取向是一次有迹可循的战略聚焦,标志着月之暗面在大模型能力谱系中的位置迁移:其技术标签已从2024年的“长文本”,转向2025年的复杂推理、思考过程与Agent任务协同。
一位接近公司的人士指出,此轮迭代的价值不在榜单排名,而在工程取向——模型围绕Agent任务反向设计,核心目标是稳定地拆解任务、调用工具并保持长链路推理的一致性。
这一取向,与月之暗面近年来强调的效率优先路线相呼应。公司方面在多个场合提到,自身并不具备无限堆砌算力的条件,因此更强调算法与系统层面的效率提升,而非单纯扩大训练规模。
在K2系列训练中,月之暗面使用改进版Muon优化器,实现约2倍Token效率提升,并通过QK-Clip等机制增强大规模训练稳定性;在推理侧,则提出Kimi Linear线性注意力机制,在保证效果的同时提升长上下文处理速度。
张予彤在达沃斯论坛上将这一策略概括为:仅使用美国顶尖实验室约1%的资源,完成K2与K2 Thinking的训练。这也意味着,月之暗面对模型能力的验证路径,正转向工程系统导向。
这种变化,同样体现在产品层。自2025年5月起,Kimi密集推出了Researcher、PPT、Kimi Code等Agent功能;9月进一步上线OK Computer,可调用虚拟电脑中的工具完成开发、数据分析、多模态内容生成或制作PPT。Agent被放置在模型能力与商业化之间,逐渐成为关键中间层。
与此同时,月之暗面有意识地将部分能力验证场景放在海外。公开数据显示,K2系列模型发布后,在OpenRouter等模型调用平台上占据一定份额。
市场普遍认为,月之暗面不再追求“大而全”的炫技,而是将筹码押注在“用工程化能力解决实际问题”这一差异化的方向上。这一策略能否成功,关键取决于其Agent集群等核心功能在真实、复杂业务场景中的稳定性和可靠性能否经得起大规模验证。
同时,在面对DeepSeek等同样强劲的竞争对手时,如何平衡顶尖性能、使用成本与商业化速度,将是月之暗面接下来的核心挑战。
双重挤压:资源战与评价体系之变
更早阶段,月之暗面曾是国内较早将重心放在C端通用助手上的大模型公司之一。
成立初期,凭借杨植麟的学术背景,公司在行业内获得较高期待,被部分从业者视作“中国版OpenAI”,月之暗面很早便选择以产品形态承接模型能力。
2023年8月,在首个模型训练进入后期阶段时,月之暗面启动AI助理Kimi项目。当时公司规模约50人,Kimi在内部更像是模型能力的展示窗口。
产品上线后,Kimi月活用户一度保持较高增长,并通过投放完成冷启动,在通用对话类产品中进入头部梯队。QuestMobile数据显示,截至2024年底,Kimi月活用户超过2000万,仅次于豆包。多位从业者将那段时间视为月之暗面在C端最为风光的阶段。
但这种增长,很快就遭遇到了成长的烦恼。进入2025年后,随着字节豆包、腾讯元宝、阿里系产品线同步推进,这一赛道逐渐演变为高度依赖资源投入的竞争。对拥有平台入口和分发体系的大厂而言,投放成本可以被内部消化;而对独立创业公司来说,持续投流更像一项难以长期承担的支出。
一位接近月之暗面的人士直言:“创业公司很难跟大厂正面拼投流,比到最后,往往是钱烧得更快,用户却留不住。”
与此同时,行业对“好模型”的判断标准也在发生变化。2025年初,DeepSeek等模型的崛起重塑了行业的选择标准:其几乎零大规模推广、纯靠技术口碑驱动增长的现象,在业内引发了强烈震动。
一位月之暗面员工曾回忆,那段时间公司内部感受到的压力是双重的,投流层面打不过大厂,技术声量又被DeepSeek抢走。
但这种冲击,也促成一次内部认知转向。公司层面逐渐意识到,对技术型创业公司而言,C端通用助手的用户规模,并不天然构成技术壁垒。相比讲用户故事,更重要的是在模型能力上形成真实差距。
上述投资人将这种变化概括为:“过去是先占用户,再补模型;现在是模型能力决定你还能不能留住用户。”
在这一判断下,杨植麟更倾向于将规模视为阶段性结果,而非优先目标。在模型能力尚未形成稳定差距前,过早放大用户规模,反而可能放大资源消耗与路径误判的风险。
2025年,月之暗面开始对C端业务做出明显收敛。产品层面,公司逐步停止大规模投流,收缩泛娱乐方向,先后暂停或放缓Ohai、Noisee等多条C端产品线;技术层面,资源重新集中到基座模型训练与推理能力;市场层面,重心从国内用户规模竞赛中抽离,转向海外开发者生态与专业用户场景;战略层面,公司从闭源转向开源,并将产品与商业化的主要增量方向放到海外。
整体来看,这是一次主动退出C端正面战场、更换赛场的选择。但收缩的代价同样存在。上述投资人表示,从其了解的情况看,公司目前“基本只剩下大模型和Kimi这一条主线”,不少其他产品线已经被放弃,“甚至有多个产品线负责人后来离职创业”。
分水岭时刻:当上市成为同行的标准答案
战略上的主动收缩与聚焦,也让月之暗面在资本路径的选择上,展现出与同业公司截然不同的节奏。
成立初期,月之暗面展现出极强的融资能力。
公司成立仅三个月后即完成超2亿美元天使轮融资,投后估值约3亿美元;同年7月完成Pre-A轮融资。2024年进入融资高峰期:2月完成超10亿美元A+轮融资,估值升至25亿美元;8月完成超3亿美元B轮融资,估值提升至33亿美元。2025年底,月之暗面完成5亿美元C轮融资并实现超募,投后估值约43亿美元。
![]()
然而,与强劲的融资表现形成鲜明对比的是,月之暗面在上市进程上的“按兵不动”。在多家同梯队公司相继启动上市进程的背景下,月之暗面并未同步推进 IPO。对于一家已具备上市条件、且身处高关注赛道的公司而言,这一选择并不常见。
上述投资人提到,随着智谱、MiniMax 进入二级市场,大模型公司的评估标准正在发生变化:相比一级市场更强调愿景与潜力,二级市场更关注成本结构、毛利率水平与商业化兑现节奏。近期多家公司推动上市,本质上仍是现金流压力下的融资选择,而非成功与否的标志。
例如,继 H 股上市后,智谱仍在推进 A 股上市进程。中国证监会官网显示,其辅导机构中金公司已于 2026 年 1 月 15 日递交辅导报告。这意味着,“大模型第一股”并未止步于单一资本市场。
不同公司间的现金状况,正在成为决定其战略节奏的关键变量。
进入2025年底,行业格局进一步分化:12月中旬,同为“AI六小虎”的智谱和MiniMax相继通过港交所聆讯并开始招股。就在几天后的12月31日,久未公开露面的杨植麟内部信曝光,披露公司仍持有约100亿元现金,并直言“不急于上市”。
此后不久,2026年1月13日百川智能创始人王小川也在媒体沟通会上透露,公司账上存有30多亿元现金。三天后的1月26日,阶跃星辰完成超50亿元新一轮融资,印奇出任董事长。
然而,充足的现金并未消除压力。在看似从容的“不上市”宣背后,杨植麟、王小川和印奇实则面临着一个共同的难题:仅凭手中的资金,在技术爆炸的窗口期内建立起真正的护城河。
实际上,除了对外部技术竞赛的焦虑,对月之暗面来说,公司历史“旧账”也构成了另一种维度的压力。
有观点认为,月之暗面早期分拆相关的股权与仲裁问题尚未完全尘埃落定,在这一状态下贸然启动 IPO,本身就存在合规与信息披露层面的复杂性;相比之下,留在一级市场继续推进技术与产品演进,操作成本更低。
上述投资人补充道,他对月之暗面的判断依然复杂。公司能够持续推出模型、持续完成大额融资,说明其在技术能力与资本市场层面具备较强说服力;但月之暗面仍未向外界清晰回答产品形态如何确立、商业化如何展开、稳定用户从何而来等更基础的问题。
在他看来,月之暗面更像是一家技术能力已被验证,但公司形态仍在形成中的企业。这种技术先行、商业轮廓尚未完全浮现的状态,也在一定程度上映射了当前国产大模型行业所处的整体阶段。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.