我很喜欢 K2.5,本文会非常主观
以及,本文使用 Kimi 配色,用以致敬
昨天下午,Kimi 的朋友跟我说:K2.5 发了。开始没当回事,想当成个快讯发一下,这是原生多模态
当我看完杨植麟那个 4 分钟的视频(这个没推送)之后,愣了好一会
有一种很难言说的感动,好像...我喜欢的那个 Kimi,回来了
先从客观的角度来说,我觉得:K2.5 是 Kimi 的一个分水岭
具体来说,是在两个维度:
行业
国产头部旗舰模型里,Kimi 首先突破了多模态这一关,并且实践得非常好
质感
Kimi 用这张答卷,回归到了那个有品位、有艺术、更有技术的天才少年形象
而这篇文章,会掺杂很多我的主观成分,因为我真的很喜欢
像音乐家一样优雅,像程序员一样可靠
多模态
从多模态说起吧
在过去的半年中,国内持续发旗舰模型的「非大厂」「非 DeepSeek」就三家:智谱、MiniMax、Kimi。它们的最新模型里,只有 Kimi 真正支持了多模态
K2.5 在 K2 基础上继续训练了约 15T 混合视觉-文本 tokens,原生多模态架构。能直接从视频输入生成代码,不需要额外的视觉 MCP
注意:原生多模态架构,不是额外调用
官方 Tech Report 里有一句话:At scale, the trade-off between vision and text capabilities disappears — they improve in unison.
规模够大之后,视觉和文本能力的权衡消失了,它们同步提升
在多模态这一关上,Kimi 的旗舰模型先过了。具体 Benchmark 我就不展开了。Agent、代码、视觉理解,都是对标 GPT-5.2 和 Claude 4.5 Opus
![]()
K2.5 Benchmark
具体如果想了解,可以在 Tech Blog 里找到完整数据:kimi.com/blog/kimi-k2-5.html
天才少年回归
我公众号里写的第一篇教程,是关于如何配合 AI 进行编程学习
那篇文章用的就是 Kimi 的 API 作为示例,因为真的喜欢当时的质感,就是一种...难以名状的...学术偶像?
杨植麟,93 年生人,清华本科年级第一,CMU 四年读完博士,Google Scholar 引用量中国 35 岁以下 NLP 领域最高。公司名字取自 Pink Floyd 的《The Dark Side of The Moon》
那时候觉得,这家公司有点意思,或者说...很有意思!
但后来,慢慢的,质感变了。海量广告投放、各种 Marketing 狠活....我有点疏远了。不是说营销不好,只是觉得那不太像最开始认识的那个 Kimi
K2.5 把那种曾经的质感,带了回来
同时带来的,还有更好的性能,以及更具竞争力的价格
![]()
![]()
从发布页说起
这个与模型无关,但在我看来,是这种气质回归的一个最典型的特征,现在打开 moonshot.cn 网站,它显示的内容和 GitHub 开源的网站是完全一样的:moonshotai.github.io
![]()
月之暗面官网
黑色背景,极简排版,技术派美学。GitHub 发布页和公司官网合二为一
一家公司能把主页做成这样,让开发者、让专业人员感到舒服,这在全世界都少见
然后,就看到了吾等开发者们,无论小齿佬还是大技霸,都兴奋了起来,Twitter Tech 榜一骑绝尘
![]()
Twitter 报错信息
我用 Agent 调用的时候报错了。打开 F12 找报错记录,准备联系 Kimi 的朋友看看是不是通路问题
然后发现,报错信息里直接标出了当前访问场景的 ID
这种细节,让人感觉他们是真的在用心干事
![]()
报错信息截图 产品里的小巧思
在 Kimi 的 Agent 产品里,最近更新了一个「Agent 集群」,说白了就是一堆 Agent 一起干活。技术上叫 Agent Swarm,最多 100 个子智能体,1500 个并行工具调用,运行时间最高缩短 4.5 倍。目前是 Beta,会逐步开放
对于虚拟出来的 Agent,我总觉得有点恶趣味,比如给我写代码的程序员叫「狄柯」
或许...只有「狄柯」,才能让代码「吊炸天」
![]()
狄柯,Web Developer,正在初始化 Next.js 项目
还有一个细节:在 Agent 模式下,如果它需要一张图片作为背景或插图,会自己画一个。不知道具体用的什么模型,但这个功能确实顺滑
![]()
官方给了一个更复杂的例子:投喂 40 篇心理学和 AI 的论文,Kimi 先通读一遍,然后衍生出几个子 agent 分别负责不同章节,最后主 agent 把关验收,生成一份几十页的 PDF 综述
品味
用 AI 生成的网站往往都是同一种风格。你一眼就能看出来这是 AI 做的。配色、布局、动效,有一种很难形容的「AI 味」
并且,非常喜欢用 Tailwind 紫
![]()
Tailwind 的老哥,还发了个「悔罪书」
K2.5 生成的东西不太一样,举个例子:我拿它给 AGI Bar 做了个品牌网站
给它的 prompt(大致上):
温暖的科技感,充满智识上的玩味但绝不冰冷。深炭灰主导,琥珀金黄强调,气泡泡沫图案充当数据可视化的隐喻
![]()
还加了点恶趣味:
AGI Bar(酒吧)也是 AGI Bar(门槛)。鼠标在线上方显示「You're above the bar」,在线下方显示「You're near the bar」
最后,效果超预期,真的实际可用,然后我真的把它部署到了 agi.bar (考虑到 DNS 缓存,有些地区可能现在就能刷到了,最迟 24小时)
这里再放几个官方 Case,我都很喜欢,以下这些,都是仅凭单条 Prompt 实现的
比如这个看着就很炸裂的开场
这种很有 style 的美妆
这种可交互的网站
还有这种,讲道理,我觉得这都是可以直接上发布会的
然后也可以传个录屏进去,K2.5 用干净专业的代码,从头到尾复现,讲道理,「从视频,直接到完美网页」,这种体验在其他模型上,是前所未有的
问题也有
长程 Agent 场景下,指令遵循经常出问题。整体体感依然无法达到海外主流模型的水平
与海外的代差在这里,这个谁也否认不了。可能再给 3 到 6 个月,能追上现在的海外主流
但我还是充值了他们最贵的会员,向探索者致敬
![]()
表达一下敬意
公众号后台的光标,走走停停
中间还专门给这篇文章,写了个样式,让它更像 MoonShot 的风格
昨天下午开始用,直到这里才写完
一边写就会有新的想法,一边尝试又在 Kimi 里找到了更多印证,真的,满怀期待,将话筒交给未来吧
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.