10亿美金融资差点烧光，Kimi用9个月杀回牌桌|调用|黄仁勋|kimi|agent|马克·安德森|埃隆_马斯克

10亿美金融资差点烧光，Kimi用9个月杀回牌桌

2026-03-31 08:36:28　来源: 碳基打工人

北京举报

分享至

还记得2024年那个当红炸子鸡吗？Kimi，10亿美金融资、概念股涨停、200万字长文本碾压GPT——当时风光到连技术圈的不屑一顾都显得像嫉妒。

但那个200万字模型，后来几乎没人用过。实验性产品，单次运行成本接近三位数，根本不具备大规模服务的可能。Kimi靠这个噱头站住了「长文本」标签，却也在技术口碑上欠了债。

2025年初DeepSeek横空出世，Kimi这边快一年没融资消息，员工流失，业内基本判了死刑。如果你当时闭关9个月，2026年3月再睁眼，会看到一个完全不同的牌局。

AI领域9个月发生了什么？一句话：范式从Chat转向了Agent。

3000万程序员最推崇的工具从Cursor变成Claude Code；early adopter们更频繁地打开那个黑白命令行终端；AI公司们终于发现，会聊天的模型远不如会写代码、会调用工具的模型值钱。最酷的创业公司从OpenAI变成了Anthropic。

DeepSeek R1靠复刻o1的深度思考能力爆火，Manus则把Claude的多轮工具调用能力可视化呈现。一位技术专家写道：「绝大多数Agent产品，离了Claude什么都不是。」

中国公司大多忙着复现R1，少数意识到Manus背后的模型更值得追。或者意识到了，没资源，没方法。

直到2025年7月11日，Kimi K2发布，喊的是Open Agentic Intelligence。野心很明显：复刻Claude的Agent能力，开源出去，就像DeepSeek复刻o1那样。

5天后，Nature用「另一个DeepSeek时刻」形容它。10天后，Anthropic联合创始人Jack Clark评价：编码和工具调用分数已足够高，现实中会有人真正用它。

7月底，杨植麟在播客里解释K2为何先攻Agent而非深度思考。他用「缸中之脑」形容主打思考的模型——脑子再聪明，没有手脚也是白搭。这篇采访值得多看几遍，他讲了编程与Agent、思考与工具调用的深层关系。

K2和后续K2 Thinking的表现，让Kimi年底续上5亿美金融资。2026年春节，Kimi第一个交卷：K2.5，万亿参数、图片视频多模态、支持思考与非思考模式。同行们发布的都是纯文本模型，多模态旗舰只有大厂闭源模型玩得起。

3月16日，Kimi团队发布Attention Residuals论文，挑战沿用10年的残差连接机制。Andrej Karpathy锐评：「让我们意识到根本没把Attention is All You Need理解透彻。」考虑到AI圈的通词膨胀，这个评价高得离谱。据说第一作者是个17岁高中生。

3月17日，Kimi成为黄仁勋GTC 2026演讲的御用模型。3月18日，杨植麟作为唯一受邀的中国独立大模型代表，把优化器、注意力机制、残差连接比作8-11年的陈旧标准，说「每一项基础技术都值得重新思考」。

然后是这几天人尽皆知的「Cursor丑闻」：估值500亿美金的编程助手Cursor，重磅推出的Composer 2跑分超过Claude Opus 4.6——套的是Kimi K2.5的壳。

Cursor想摆脱对Anthropic和OpenAI的依赖，卡脖子不分国界，Anthropic确实断供过Windsurf。但能力和愿景的鸿沟，让Cursor选择抹掉Kimi的名字，靠代笔求融资。最后体面收场：联合创始人公开道歉，技术报告详细解释为何选Kimi K2.5做底座。

据小道消息，2026年春节前后Kimi以48亿、60亿、100亿美元估值完成近20亿融资，3月的180亿轮次要排队才能拿到。同行港股表现是助力，但更重要的是K2系列的实际表现——Cursor、Cloudflare、Perplexity、黄仁勋、马斯克、马克·安德森、查马斯们不断发来的「金水」，以及K2.5发布后20天收入超过去一年的财务表现。

一位Kimi的朋友说，制约业务发展的只有算力，现在至少还有10倍需求没满足。有多少卡，就有多少收入。据另一个大厂的朋友透露，有些大厂编程工具接入的Kimi模型，甚至要预购才能拿到额度。

DeepSeek V3不是一天炼成的。幻方量化基因让他们2023年起就走极致能效比路线，潜心自研MLA与DeepSeekMoE架构，在有限算力下压榨超越物理极限的性能。直到2025年成就自己，也给其他创业公司带来信心。

所有人都在期待DeepSeek的下一代模型，但媒体上「狼来了」太多次，技术突破哪有那么容易。我们完全有理由更耐心地等待。

Kimi K2同样不是一天炼成的。他们和DeepSeek R1同一天发布了无人问津的K1.5，被OpenAI官方认为是率先复现o1的两家公司之一。2025年初被唱衰最狠的时候，他们发布Moonlight系列小型MoE模型，验证下一代二阶优化器技术，最终应用到万亿参数的K2。现在Muon已取代用了10年的Adam，成为Kimi、GLM-5、DeepSeek Engram们的新标准。

出来混，总要还的。Kimi 2024年提前享受了C位和曝光，2026年没再复现该属于自己的流量。

作为几乎同时起步的两家创业公司，我佩服他们从来不认为市场格局已定、相信技术才是最大变量、敢于追逐AGI的勇气。年轻生猛，战绩可查，永远相信细水长流。

即使站在2026年3月底，2022年底开始的AI革命也才3年半。一位Kimi工程师在最近的技术分享里提到，他们内部测试K2.5时，有个bug让模型在工具调用循环里「钻牛角尖」——反复调用同一个API，像极了一个固执的实习生。后来修复了，但团队保留了那段日志：提醒自己Agent能力的边界，往往藏在那些看似愚蠢的细节里。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.