网易首页 > 网易号 > 正文 申请入驻

Kimi K2新模型来了!多项测试超Claude、审美超前代,免费可用

0
分享至

智东西9月5日消息,刚刚,大模型独角兽月之暗面发布Kimi K2-0905,目前,Kimi应用和网页版中的K2模型已全量升级到Kimi K2-0905。

该模型的核心升级点为Agentic Coding能力增强、支持256K上下文、API支持高达60-100Token/s的输出速度、支持Claude Code

为了测试Kimi K2-0905的性能,智东西对比了其与Kimi K2-0711在生成个人网站上的表现。

提示词:开发一个美观的个人网站,使用Bootstrap作为前端框架,直接输出相关代码。

下图左上是Kimi K2-0711生成的结果、左下是Kimi K1.5的生成结果,右侧均为Kimi K2-0905的结果。

可以看出,网站整体的美观度以及整体风格的一致性相比前代模型都有了一定提升,且包含的信息更加完善。

▲左上为Kimi K2-0711生成、左下Kimi K1.5生成、中和右为Kimi K2-0905生成

在考察真实软件工程任务的基准测试中,Kimi K2-0905多项表现超过Claude Sonnet 4,其中在用于评估大模型在软件开发任务上能力的SWE-benchVerified、评估模型在实际软件开发工程中综合能力的SWE-Dev表现略逊色于Claude Sonnet 4。

Kimi K2首次发布是在7月11日,该模型总参数10000亿,激活参数320亿。2天前,月之暗面就公开了Kimi K2-0905的一些细节,其基于基础模型构建,增强了编程能力,仍不具备思考或视觉,但保留了颇受欢迎的Kimi K2-0711模型的个性和风格。

目前,Kimi开放平台已上架kimi-k2-0905-preview模型API,且定价与上一代一致,计费方案为每百万输入tokens/4元,每百万输出tokens/16元。

月之暗面的官宣文章中提到,目前,AI编程工具Cursor、Windsurf、Trae、Cline、RooCode、Kilo Code等已内置或接入了Kimi K2模型,国内外云服务厂商均部署了Kimi K2模型。

论文地址:https://arxiv.org/abs/2507.20534

Hugging Face地址:https://huggingface.co/moonshotai/Kimi-K2-Instruct-0905

GitHub地址:https://github.com/moonshotai/kimi-K2

一、真实软件工程任务能力升级,多项测试超Claude

Kimi K2-0905具体能力提升主要有以下四点:

Agentic Coding能力提升,在公开基准测试和真实的编程任务中均展现出更好的性能;

前端编程体验升级:提升了前端代码的美观度和实用性;

扩展上下文长度:从128K升级到256K,为复杂长线任务提供更好的支持;

提供高速版API:支持高达60-100Token/s的输出速度。

在侧重考察真实软件工程任务的SWE-bench Verified等基准测试,新版Kimi K2模型的表现如下:

Kimi开放平台已上架kimi-k2-0905-preview模型API

上下文升级到256K;Token Enforcer保证toolcall 100%格式正确;完全兼容Anthropic API、支持WebSearch Tool,提供更好的K2+Claude Code使用体验;支持全自动Context Caching,有助于节省Input Token;定价与之前的0711版相同;速度达60-100 Token/s的高速版API(kimi-k2-turbo-preview)已同步升级新模型。

二、拆解需求、规划步骤、实战演练都能应对

智东西还考察了Kimi K2-0905拆解需求、规划步骤、代码落地的能力。

提示词:写一个工具,输入一段英文文本(可能包含标点、大小写、空格),输出以下统计结果:①总单词数(忽略标点,大小写视为同一单词,如Hello和hello算一个);②出现频率最高的3个单词及频次(若频次相同,按字母序排序);③文本中最长的句子(以. ! ?为句末标志,若多个最长句,输出第一个)。

这一工具拆分了统计总单词数、频率最高3个单词、最长句子的需求。

第二个是在具体的图书馆场景中,智东西要求其开发一个简易的图书馆借阅管理系统

提示词为:设计一个图书馆借阅系统的核心功能,需支持:①书籍入库(记录书籍ID、书名、作者、库存数量);②读者借阅(记录读者ID、借阅书籍ID、借阅日期,需判断书籍是否有库存);③读者还书(记录还书日期,需判断是否超期,假设借阅期限为30天,超期按1元/天计算罚款);④查询功能(按书名查询书籍库存,按读者ID查询未还书籍及是否超期)。

Kimi K2-0905生成的系统界面中,明确包含了书籍入库、读者借阅、读者还书、查询库存、查询未还书籍的模块。

值得注意的是,智能文本统计工具和图书馆借阅系统生成整体风格相似,均为蓝白配色。

结语:AI编程或应对复杂编程挑战

当下,越来越多的开发者使用AI工具更高效便捷编写代码,具体用例包括自动补全代码行、修复代码错误和测试代码等。

Kimi K2在Agentic Coding能力方面的提升,意味着其模型在面对复杂编程任务时,能够更高效、自主地理解需求、规划步骤并生成高质量代码,以应对更多真实编程场景中。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
刘震云:当你一无所有时,死心塌地跟着你的女人,就是你的贵人

刘震云:当你一无所有时,死心塌地跟着你的女人,就是你的贵人

杏花烟雨江南的碧园
2026-04-29 14:15:03
世界首富押注的火箭发动机:折腾了60年,终于变成了流水线产品

世界首富押注的火箭发动机:折腾了60年,终于变成了流水线产品

平流层散步者
2026-05-27 08:04:47
伊媒:霍尔木兹海峡通行许可已开放申请

伊媒:霍尔木兹海峡通行许可已开放申请

新京报
2026-06-02 21:29:37
iPhone17销量再破纪录!国产手机疯狂内卷,为何用户仍选苹果?

iPhone17销量再破纪录!国产手机疯狂内卷,为何用户仍选苹果?

小柱解说游戏
2026-06-02 00:24:51
紫色风暴来袭:这台1997年手动RAV4,是丰田抛弃的“硬核基因”

紫色风暴来袭:这台1997年手动RAV4,是丰田抛弃的“硬核基因”

热血体育社
2026-06-03 02:14:24
乌克兰:俄袭击已致18人死亡 部分地区停电

乌克兰:俄袭击已致18人死亡 部分地区停电

新华社
2026-06-02 19:07:08
你胸口那个被遗忘的小器官,可能正在悄悄决定你能活多久

你胸口那个被遗忘的小器官,可能正在悄悄决定你能活多久

历史的尘埃发
2026-06-01 18:29:16
法网女双中国德比:郭涵煜赢张帅首进大满贯八强

法网女双中国德比:郭涵煜赢张帅首进大满贯八强

体坛周报
2026-06-02 09:45:20
当不成总统了?特朗普体检报告出来了,快80岁的他,或被迫下台

当不成总统了?特朗普体检报告出来了,快80岁的他,或被迫下台

原来仙女不讲理
2026-06-02 14:14:15
利物浦瞄准四千万铁卫,后防重建锁定厄瓜多尔新星

利物浦瞄准四千万铁卫,后防重建锁定厄瓜多尔新星

竞技风云录
2026-06-03 02:11:12
人气花被大佬甩了?刘亦菲不记得同学?侯明昊给虞书欣做配?邓为有靠山了?姨太问答

人气花被大佬甩了?刘亦菲不记得同学?侯明昊给虞书欣做配?邓为有靠山了?姨太问答

毒舌扒姨太
2026-06-01 22:39:10
集体狂飙,MLCC板块能否复刻存储的超级行情?

集体狂飙,MLCC板块能否复刻存储的超级行情?

第一财经资讯
2026-06-02 20:14:18
香港向国家提2请求,黎家盈开讲天宫课堂或先实现,会全粤语吗?

香港向国家提2请求,黎家盈开讲天宫课堂或先实现,会全粤语吗?

风云圈天气
2026-06-01 23:34:16
古籍记载龙长虎短手相 无名指更长之人晚年多有四种人生结局

古籍记载龙长虎短手相 无名指更长之人晚年多有四种人生结局

唠叨说历史
2026-03-31 14:25:43
中国电动车正以惊人速度贬值

中国电动车正以惊人速度贬值

体坛观察猿
2026-06-01 01:13:10
70岁以上人人有份!不看家境不看收入,每月按时打进社保卡

70岁以上人人有份!不看家境不看收入,每月按时打进社保卡

牛锅巴小钒
2026-06-02 01:37:33
一生拼命的中国80后:再不玩,就老了

一生拼命的中国80后:再不玩,就老了

视觉志
2026-06-02 14:18:48
星铉:德云社“四大金刚”一撸到底!直呼本名,17年师徒情分归零

星铉:德云社“四大金刚”一撸到底!直呼本名,17年师徒情分归零

星铉
2026-06-01 13:22:50
浙江一保洁员因井盖塌陷掉污水池中,消防员下井搜救竟发现池内还有一人:此前保安贸然施救也被困;消防提醒:请勿盲目施救

浙江一保洁员因井盖塌陷掉污水池中,消防员下井搜救竟发现池内还有一人:此前保安贸然施救也被困;消防提醒:请勿盲目施救

洪观新闻
2026-06-02 14:03:52
1比3!浙江广厦总决赛首胜,胡金秋爆发,塔克22分

1比3!浙江广厦总决赛首胜,胡金秋爆发,塔克22分

体坛瞎白话
2026-06-02 21:38:38
2026-06-03 03:31:00
智东西 incentive-icons
智东西
智东西,AI产业新媒体,专注报道人工智能的前沿技术发展,和技术应用带来的千行百业产业变革。
11958文章数 117090关注度
往期回顾 全部

科技要闻

烧掉千亿后,美团、阿里、京东谁先止血?

头条要闻

演员魏宗万去世 曾在94版《三国演义》中饰演"司马懿"

头条要闻

演员魏宗万去世 曾在94版《三国演义》中饰演"司马懿"

体育要闻

1米74的业余联赛替补,在英超踢中卫

娱乐要闻

奚梦瑶何猷君补办婚礼超幸福

财经要闻

智元和宇树的“暗战”愈演愈烈

汽车要闻

星途神秘新车轮廓曝光 又一款性能SUV要来了?

态度原创

艺术
本地
房产
时尚
公开课

艺术要闻

抖音砸60个亿,要盖一座“不像医院”的医院?

本地新闻

用剪纸的方式,打开江苏扬州

房产要闻

5200巨量投资曝光!未来五年,海南格局大变!

蓝色系下装看着清爽不闷,裤子、裙子都凉快,随便穿都不出错

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版