网易首页 > 网易号 > 正文 申请入驻

终于有国产模型能对标Gemini 3 Pro了!Kimi K2.5 强得不像开源模型

0
分享至


这是苍何的第 475 篇原创!

大家好,我是苍何。

今天,Kimi 带着他的最强模型 K2.5 强势来袭,我也第一时间做了测试,给大家带来一波分享。

这次,K2.5 是一个全能型的统一模型,最大的特点就是视觉、编程、Agent一口气全包。


先来一个省流版预览,K2.5 模型能力提升如下:

  • 支持多模态理解:Kimi 终于补全了多模态的空白,而且一次性支持图片+视频理解。

  • 思考模式切换:同时支持推理和非推理。


  • 前端审美设计能力个人感觉可以和 Gemini 3 Pro 一战了。



基于 K2.5,Kimi 一口气放出了 4 个产品:

1、开源的 Claude Code——Kimi code:全面支持 Skills,Benchmark 分数高,无需 MCP 即可支持视频输入。


2、Visual Coding:能看图或视频复刻网页,还能做视觉调整,并能一键部署。


3、Agent 集群:智能体军团,可根据任务创建多达 100 个 Agent 分身,并自主分工协作。


4、Office Agent:PPT、Word、Excel 审美和设计能力全面提升。

整体测试下来最大的感受是 K2.5 的 coding 能力提升比较明显,特别是前端审美能力,在一些 case 上甚至还超过 Gemini 3 Pro。

比如,这个是我用 K2.5 一句话复刻的 X 首页:


相对比之下,这是我当时同样的提示词用 Gemini 3 复刻的 X 页面:


可以看到 K2.5 除了复刻页面的每一个元素,甚至连页面中的图片都复刻了,而不是用占位符替代。

我又让它复刻小红书首页,也做的很好。


因为 K2.5 能理解视频,我又上传了一个点击交互的视频,K2.5 能理解视频中的交互,并像人一样能看清每一个交互后的页面,然后复刻。这是我复刻的带有交互的 B 站首页。


我还测试了个 APP 复刻的场景,直接录制了一段操作即刻的视频,然后丢给 K2.5,输入提示词:

复刻视频中的 APP 页面,包括交互,保证 APP 页面可用。


可以看到,复刻的挺不错,视频中的交互,K2.5 理解后并输出成了页面,而且效果相当好,这或许就是 Visual Coding 的魅力所在吧。

然后我又做了个带有手势交互的小游戏,需要唤起摄像头并理解我的手势,来模拟粒子炸开的效果。

K2.5 一次就完成了这个效果,效果相当棒,而且代码开发的速度非常快。

我记得当时 Gemini 3 我做过一个做 macos 操作系统的 case,当时挺震撼的,于是我输入同样的提示词给 K2.5。

同样一次,就出来了这样一个,很不错的效果。

真牛逼,而且整个一次性生成,就简简单单一个提示词,整个的 macos 风格的感觉就都出来了。

硅谷闭源模型不再等于性能的天花板,Kimi K2.5提供了更具性价比的选择。

为了继续捶打,我又做了个实验,把架构图传过去,希望生成可编辑的版本,K2.5 同样完成的非常出色。


然后我对 Agent Swarm 模式进行了测试,说的简单点,这是个 Agent 的军团,能创建无数个分身来帮扶完成复杂的任务。

我输入这样一大串提示词:

请模拟 5 位风格极度反差的知名艺术家或视觉流派,为当代「打工人」设计 5 个系列、每个系列 10 张的微信表情包。
主题是「职场求生记」,我希望看到的不仅是风格不同,
更是对职场情绪的不同维度的解读,比如愤怒、焦虑、躺平、假笑和疯狂

可以看到它开始并行调用 5 个 Agent 来帮我生成不同艺术风格的表情包。


表情包图片生成的远比我想象中的快,有智能体军团并行的效率太高了。


这些生成的表情包图片有些确实符合打工人的不同情绪了。


最后我针对 Kimi code 进行了测试,这就更有意思了,在 cli 中 input 图片变得如此丝滑,好像还是第一次。

比如我直接把这张图丢到 cli 终端中,让 K2.5 做下理解。这个是原图:


可以看到把图片拖到 Kimi Code 后,自动带出路径:


Kimi Code 先是调用 ReadMediaFile 这个读取图片和视频文件的 agent 来理解图片。

我看了下官方文档说明,这个 agent 最多能读取 100MB 大小的文件。


之后就给我一份详细的解释,效果不错,整个流程,我都没有调用外部的任何工具,模型自身就具备理解能力,这太舒服了啊。


同样将视频直接丢给 kimi code,也完全能理解。


然后我利用 remotion-best-practices 这个 skills 以及配音 skills,将刚才的视频做一下翻译配音。

这里 skills 有一个分层加载机制,并且会按照以下优先级加载。


其中 Kimi CLI 内置了 2 个 Skills:

  • kimi-cli-help

    :Kimi CLI 帮助。解答关于 Kimi CLI 安装、配置、斜杠命令、键盘快捷键、MCP 集成、供应商、环境变量等问题。

  • skill-creator

    :Skill 创建指南。当你需要创建新的 Skill(或更新现有 Skill)来扩展 Kimi 的能力时,可以使用此 Skill 获取详细的创建指导和最佳实践。

最终就出来一个做了中文配音的数字人混剪视频了,效果还是非常 nice 的。

写到这里,虽然测的有点累了,不过人还是相当的兴奋,就像当初熬夜测 Gemini 3 一样。

其实一开始 kimi 的 k2 模型在代码能力上已经表现的相当不错,还跑通了 obsidian 工作流。


这次 k2.5 的表现让人更加振奋,是那种肉眼可见的进步和爽感。

前端审美以及对图片视频的理解能力有了很大提升,特别是在 kimi code 中可以丝滑的不借助外力就可以理解图片和视频还是非常舒服的。

整体测试下来,k2.5 给我带来了不少的惊喜,接下来我也会尝试用它来进行工程化的实践。

也欢迎持续关注苍何,你将获得最新的关于 AI 大模型的一手真实评测。

好啦,感谢你喜欢我的文章,我们下一期见。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
实探芯片涨价潮下的手机、PC市场:16G内存从800元涨到2000多,有厂商笔记本提价上千元

实探芯片涨价潮下的手机、PC市场:16G内存从800元涨到2000多,有厂商笔记本提价上千元

搜狐科技
2026-02-13 18:12:43
恶魔检察官蒋英库 8 年杀 21 人,灭口同行,2001 年被枪决伏法

恶魔检察官蒋英库 8 年杀 21 人,灭口同行,2001 年被枪决伏法

有书
2026-02-13 21:45:04
西方专家也很纳闷:一年时间,全世界已经开始看不懂中国了!

西方专家也很纳闷:一年时间,全世界已经开始看不懂中国了!

花小猫的美食日常
2026-02-13 12:07:44
小鹏真把“大湾区揽胜”造出来了!官方:6座全是C位

小鹏真把“大湾区揽胜”造出来了!官方:6座全是C位

网上车市
2026-02-12 10:16:03
外贸寒冬来袭:工厂接不到大单,越南与印度迅速崛起

外贸寒冬来袭:工厂接不到大单,越南与印度迅速崛起

白浅娱乐聊
2026-02-08 10:19:52
女航天员王亚平,常年没回家,被问“如何维持丈夫的感情”

女航天员王亚平,常年没回家,被问“如何维持丈夫的感情”

无处遁形
2026-02-13 06:15:43
他到西安休养,兰空领导对他“不冷不热”,待遇有些困难,靠接济

他到西安休养,兰空领导对他“不冷不热”,待遇有些困难,靠接济

南书房
2026-02-11 12:50:15
内蒙古自治区政府原主席王莉霞被“双开”:贪慕虚荣追求享乐,对家属失管失教

内蒙古自治区政府原主席王莉霞被“双开”:贪慕虚荣追求享乐,对家属失管失教

界面新闻
2026-02-12 13:48:35
活塞队坎宁安计划从库里和詹姆斯手中接过火炬,征战2028年奥运会

活塞队坎宁安计划从库里和詹姆斯手中接过火炬,征战2028年奥运会

好火子
2026-02-14 03:47:52
至今仍健在的开国将帅只剩一位,今年103岁高龄,身体依旧硬朗

至今仍健在的开国将帅只剩一位,今年103岁高龄,身体依旧硬朗

鲸探所长
2026-02-05 16:41:09
特斯拉Model Y提车不到5小时被狗“吓坏”!车主:修车花了1.7万

特斯拉Model Y提车不到5小时被狗“吓坏”!车主:修车花了1.7万

快科技
2026-02-13 20:50:05
挤走董卿、靠爹上位、央视“穷鬼”,龙洋私生活谣言有多离谱?

挤走董卿、靠爹上位、央视“穷鬼”,龙洋私生活谣言有多离谱?

琴声飞扬
2026-02-06 11:52:11
怎么突然出现这么多性早熟的孩子?医生:曾经一天接诊30多例性早熟患者,女孩早熟是男孩的5倍

怎么突然出现这么多性早熟的孩子?医生:曾经一天接诊30多例性早熟患者,女孩早熟是男孩的5倍

观威海
2026-02-13 09:50:06
河南一老板投资黄金赚1316万 全部分给员工父母

河南一老板投资黄金赚1316万 全部分给员工父母

看看新闻Knews
2026-02-13 17:24:16
我国崩塌最彻底的专业,从年薪20万到找不到工作,毕业即失业!

我国崩塌最彻底的专业,从年薪20万到找不到工作,毕业即失业!

黯泉
2026-02-10 22:00:47
米兰冬奥|史上最精彩单板U池决赛无缘卫冕,平野步梦终究输给了伤病和岁月

米兰冬奥|史上最精彩单板U池决赛无缘卫冕,平野步梦终究输给了伤病和岁月

文汇报
2026-02-14 04:41:16
米兰冬奥奖牌榜:前三没变,德国上升4位,韩国升5位,我国降1位

米兰冬奥奖牌榜:前三没变,德国上升4位,韩国升5位,我国降1位

湘楚风云
2026-02-13 10:21:17
拳王邹市明自爆破产,不止赔光2亿,其妻子参加婚礼耍酒疯

拳王邹市明自爆破产,不止赔光2亿,其妻子参加婚礼耍酒疯

说历史的老牢
2026-01-20 14:17:37
约会时刺激女人荷尔蒙的方法,坏男人都会,越简单越有效

约会时刺激女人荷尔蒙的方法,坏男人都会,越简单越有效

游戏收藏指南
2026-02-14 06:08:42
【荷兰】中国国家队的荷兰籍教练就温内马尔斯与中国对手相撞事件道歉

【荷兰】中国国家队的荷兰籍教练就温内马尔斯与中国对手相撞事件道歉

一网荷兰
2026-02-13 01:28:26
2026-02-14 07:00:49
苍何
苍何
前大厂工程师,努力分享AI干货知识
64文章数 66关注度
往期回顾 全部

数码要闻

罗技Pro X2 Superstrike鼠标导致《Apex英雄》玩家遭永久封禁

头条要闻

8千元的迷你小马一夜爆火 马主:1天排泄次数达十几次

头条要闻

8千元的迷你小马一夜爆火 马主:1天排泄次数达十几次

体育要闻

这张照片背后,是米兰冬奥最催泪的故事

娱乐要闻

大衣哥女儿风光出嫁,农村婚礼超朴素

财经要闻

华莱士母公司退市 疯狂扩张下的食安隐忧

科技要闻

独家探访蔡磊:答不完的卷子 死磕最后一程

汽车要闻

探秘比亚迪巴西工厂 居然是这个画风!

态度原创

旅游
数码
游戏
亲子
军事航空

旅游要闻

土耳其自驾行记(八)地中海边的慢时光——卡什小镇

数码要闻

索尼WF-1000XM6新一代降噪豆正式发布,国行3月开售

癫疯之坐!今年年夜饭批准坐在黄金马桶上吃

亲子要闻

爸爸带的孩子是什么样的?妈妈看完沉默了,网友:活着就好!

军事要闻

多次成功应对外舰、外机挑衅 太原舰展示052D硬核实力

无障碍浏览 进入关怀版