![]()
还记得2024年那个当红炸子鸡吗?Kimi,10亿美金融资、概念股涨停、200万字长文本碾压GPT——当时风光到连技术圈的不屑一顾都显得像嫉妒。
但那个200万字模型,后来几乎没人用过。实验性产品,单次运行成本接近三位数,根本不具备大规模服务的可能。Kimi靠这个噱头站住了「长文本」标签,却也在技术口碑上欠了债。
2025年初DeepSeek横空出世,Kimi这边快一年没融资消息,员工流失,业内基本判了死刑。如果你当时闭关9个月,2026年3月再睁眼,会看到一个完全不同的牌局。
AI领域9个月发生了什么?一句话:范式从Chat转向了Agent。
3000万程序员最推崇的工具从Cursor变成Claude Code;early adopter们更频繁地打开那个黑白命令行终端;AI公司们终于发现,会聊天的模型远不如会写代码、会调用工具的模型值钱。最酷的创业公司从OpenAI变成了Anthropic。
DeepSeek R1靠复刻o1的深度思考能力爆火,Manus则把Claude的多轮工具调用能力可视化呈现。一位技术专家写道:「绝大多数Agent产品,离了Claude什么都不是。」
中国公司大多忙着复现R1,少数意识到Manus背后的模型更值得追。或者意识到了,没资源,没方法。
![]()
直到2025年7月11日,Kimi K2发布,喊的是Open Agentic Intelligence。野心很明显:复刻Claude的Agent能力,开源出去,就像DeepSeek复刻o1那样。
5天后,Nature用「另一个DeepSeek时刻」形容它。10天后,Anthropic联合创始人Jack Clark评价:编码和工具调用分数已足够高,现实中会有人真正用它。
7月底,杨植麟在播客里解释K2为何先攻Agent而非深度思考。他用「缸中之脑」形容主打思考的模型——脑子再聪明,没有手脚也是白搭。这篇采访值得多看几遍,他讲了编程与Agent、思考与工具调用的深层关系。
K2和后续K2 Thinking的表现,让Kimi年底续上5亿美金融资。2026年春节,Kimi第一个交卷:K2.5,万亿参数、图片视频多模态、支持思考与非思考模式。同行们发布的都是纯文本模型,多模态旗舰只有大厂闭源模型玩得起。
3月16日,Kimi团队发布Attention Residuals论文,挑战沿用10年的残差连接机制。Andrej Karpathy锐评:「让我们意识到根本没把Attention is All You Need理解透彻。」考虑到AI圈的通词膨胀,这个评价高得离谱。据说第一作者是个17岁高中生。
3月17日,Kimi成为黄仁勋GTC 2026演讲的御用模型。3月18日,杨植麟作为唯一受邀的中国独立大模型代表,把优化器、注意力机制、残差连接比作8-11年的陈旧标准,说「每一项基础技术都值得重新思考」。
然后是这几天人尽皆知的「Cursor丑闻」:估值500亿美金的编程助手Cursor,重磅推出的Composer 2跑分超过Claude Opus 4.6——套的是Kimi K2.5的壳。
![]()
Cursor想摆脱对Anthropic和OpenAI的依赖,卡脖子不分国界,Anthropic确实断供过Windsurf。但能力和愿景的鸿沟,让Cursor选择抹掉Kimi的名字,靠代笔求融资。最后体面收场:联合创始人公开道歉,技术报告详细解释为何选Kimi K2.5做底座。
据小道消息,2026年春节前后Kimi以48亿、60亿、100亿美元估值完成近20亿融资,3月的180亿轮次要排队才能拿到。同行港股表现是助力,但更重要的是K2系列的实际表现——Cursor、Cloudflare、Perplexity、黄仁勋、马斯克、马克·安德森、查马斯们不断发来的「金水」,以及K2.5发布后20天收入超过去一年的财务表现。
一位Kimi的朋友说,制约业务发展的只有算力,现在至少还有10倍需求没满足。有多少卡,就有多少收入。据另一个大厂的朋友透露,有些大厂编程工具接入的Kimi模型,甚至要预购才能拿到额度。
DeepSeek V3不是一天炼成的。幻方量化基因让他们2023年起就走极致能效比路线,潜心自研MLA与DeepSeekMoE架构,在有限算力下压榨超越物理极限的性能。直到2025年成就自己,也给其他创业公司带来信心。
所有人都在期待DeepSeek的下一代模型,但媒体上「狼来了」太多次,技术突破哪有那么容易。我们完全有理由更耐心地等待。
Kimi K2同样不是一天炼成的。他们和DeepSeek R1同一天发布了无人问津的K1.5,被OpenAI官方认为是率先复现o1的两家公司之一。2025年初被唱衰最狠的时候,他们发布Moonlight系列小型MoE模型,验证下一代二阶优化器技术,最终应用到万亿参数的K2。现在Muon已取代用了10年的Adam,成为Kimi、GLM-5、DeepSeek Engram们的新标准。
出来混,总要还的。Kimi 2024年提前享受了C位和曝光,2026年没再复现该属于自己的流量。
作为几乎同时起步的两家创业公司,我佩服他们从来不认为市场格局已定、相信技术才是最大变量、敢于追逐AGI的勇气。年轻生猛,战绩可查,永远相信细水长流。
即使站在2026年3月底,2022年底开始的AI革命也才3年半。一位Kimi工程师在最近的技术分享里提到,他们内部测试K2.5时,有个bug让模型在工具调用循环里「钻牛角尖」——反复调用同一个API,像极了一个固执的实习生。后来修复了,但团队保留了那段日志:提醒自己Agent能力的边界,往往藏在那些看似愚蠢的细节里。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.