网易首页 > 网易号 > 正文 申请入驻

Kimi首个万亿参数模型开源!免费可用,超强Agent推理,附实测体验

0
分享至

智东西7月12日报道,昨夜,国内大模型独角兽月之暗面发布并开源了其最新一代MoE架构基础模型Kimi K2,总参数量达到1万亿(1T),激活参数为32B。Kimi K2已在Kimi Web端和App端中可用。

Kimi K2是月之暗面首款开源发布的旗舰模型,在SWE Bench Verified(编程)、Tau2(智能体)、AceBench(工具调用)这三项基准测试中,这一模型取得开源模型中的SOTA成绩。

在自主编程(Agentic Coding)、工具调用(Tool Use)和数学推理(Math & Reasoning)这三个能力维度上,Kimi K2的表现超过了DeepSeek-V3-0324、Qwen-235B-A22B等模型,但在部分基准测试中略逊于Claude 4 Opus、OpenAI GPT-4.1等模型。

Kimi K2在预训练阶段使用了“MuonClip”优化器实现万亿参数模型的训练。这一优化器能提高Token利用效率,缓解高质量人类数据的短缺问题。月之暗面还应用了大规模Agentic Tool Use数据合成和引入自我评价机制的通用强化学习等技术。

Kimi K2 API服务也同步上线。Kimi K2 API支持最长128K上下文,计费方案为每百万输入tokens/4元,每百万输出tokens/16元,输入输出价格均为DeepSeek V3的2倍。

Kimi K2系列中的两个模型版本现已开源,包括未经过指令微调的基础预训练模型Kimi-K2-Base和通用指令微调版本Kimi-K2-Instruct(非思考模型)。前者适合科研与自定义场景,后者则可用于大多数问答与Agent任务。

Kimi K2现已上线无问芯穹Infini-AI异构云平台(cloud.infini-ai.com/genstudio/),用户能以与官方API同样的价格调用Kimi K2。

开源链接:

https://huggingface.co/moonshotai/Kimi-K2-Instruct

体验链接:

https://www.kimi.com/

一、编程能力迎提升,实测效果差强人意

根据月之暗面博客文章,在前端开发任务中,Kimi K2能生成有设计感与视觉表现力的代码,支持粒子系统、可视化和3D场景等表现形式。官方Demo中,Kimi K2开发了一个支持昼夜循环的山川峡谷3D景观:

还生成了粒子特效银河:

为验证上述能力,智东西向Kimi K2发送了如下提示词:

最终,Kimi K2交付的网页渲染效果并未如官方Demo中那般逼真,交互性和功能丰富度也略逊一筹。

在难度较低的个人网站开发任务上,Kimi K2展现出一定规划能力。在未收到明确指示的情况下,Kimi K2主动梳理了网站的目录结构,打造出的网站可扩展性更好。

就智东西进行的个人网站开发测试而言,Kimi K2相较Kimi K1.5的UI审美水平进步有限。

▲上方为Kimi K2生成结果,下方为Kimi K1.5生成结果

同样的任务交由DeepSeek-V3-0324进行处理,最终生成的结果如下:

二、Agent工具调用能力增强,扩展风格化写作能力

月之暗面称,Kimi K2现具备复杂指令解析能力,可将需求自动拆解为一系列格式规范、可直接执行的ToolCall结构。

开发者可将Kimi K2接入owl、Cline、RooCode等Agent/Coding框架,完成复杂任务或自动化编码。

Agent能力已可通过API使用,更多工具能力即将在Kimi上线。在月之暗面内部测试环境中的实际演示里,Kimi K2展现出一定体验Agentic能力。

比如,将13万行的原始数据丢给Kimi K2,它可以帮用户分析远程办公比例对薪资的影响,分析显著差异,自动生成统计图表与回归模型解读,并用统一色调做出小提琴图(violin plot) 、箱线图(box plot)、散点图(scatter plot)等专业图表,整理成报告。

再比如,如果用户是Coldplay粉丝,Kimi K2可以帮忙制定今年的追星计划,完成演唱会所在城市的机酒与旅游规划,并且生成日历,再用html概括完整行程规划并发送邮件。

Kimi K2还拥有了更强的风格化写作能力。官方提供的Demo中,Kimi K2模仿了苹果广告文案风格:

此外,Kimi K2在通用知识推理、数学、规划等任务中的表现亦有提升,比数字大小的题目已经难不住Kimi K2了。

结语:探索新型优化器,未来将新增思考与视觉理解

根据月之暗面博客文章,Kimi K2用MuonClip优化器支撑万亿参数模型训练,提升token利用效率。结合大规模Agentic数据合成与通用强化学习,这一模型的通用智能能力获得提升。

为了缓解大规模训练中的attention logits偏大问题,月之暗面抛弃了传统的Adam优化器,提出MuonClip优化器,并将其扩展到万亿参数规模,提升了训练稳定性和token使用效率。Kimi K2完成了15.5T token的训练,全程无loss spike。

月之暗面还构建了可大规模生成多轮工具使用场景的合成pipeline,其大规模Agentic Tool Use数据合成可覆盖数百领域、数千工具,样本由LLM评估筛选后用于训练。

Kimi K2在可验证任务上(代码、数学)使用了强化学习,还通过引入自我评价机制(self-judging),解决了不可验证任务的奖励稀缺问题,实现通用强化学习,提升泛化任务表现。

目前,Kimi K2尚不支持视觉理解和思考能力,月之暗面称这些能力将在未来陆续加入。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
发春节红包的大厂都被约谈了

发春节红包的大厂都被约谈了

经济观察报
2026-02-15 08:10:04
超市里很多速冻水饺为何价格那么低?因为馅主料不是肉,而是大豆蛋白

超市里很多速冻水饺为何价格那么低?因为馅主料不是肉,而是大豆蛋白

爆角追踪
2026-02-14 22:27:44
8499元!iPhone 17 Pro Max 突然官宣:2月15日,正式官降

8499元!iPhone 17 Pro Max 突然官宣:2月15日,正式官降

科技堡垒
2026-02-15 11:19:04
中组部意见解读:公职人员退休后未经批准经商的,不再保留党政机关退休金等待遇

中组部意见解读:公职人员退休后未经批准经商的,不再保留党政机关退休金等待遇

审计之家
2026-02-15 09:35:47
大逆转!最低温-1℃!冷空气即将抵达广西

大逆转!最低温-1℃!冷空气即将抵达广西

环球网资讯
2026-02-15 15:34:20
人到底有多坏,才能做出这种丧尽天良的事!

人到底有多坏,才能做出这种丧尽天良的事!

槽三刀
2026-02-14 21:35:46
【真实故事】炊事员做了8年饭退伍,刚走到军区大门就被岗哨拦住:站着别动

【真实故事】炊事员做了8年饭退伍,刚走到军区大门就被岗哨拦住:站着别动

奶茶麦子
2026-02-15 10:25:26
欧洲小偷,都传疯了,达成了一个行业共识,中国人的钱包,随便拿

欧洲小偷,都传疯了,达成了一个行业共识,中国人的钱包,随便拿

西楼知趣杂谈
2026-02-14 18:35:51
闺蜜大婚我随了5000,她回礼雨伞,看见伞柄刻着地址和6个数字

闺蜜大婚我随了5000,她回礼雨伞,看见伞柄刻着地址和6个数字

磊子讲史
2026-01-23 16:54:49
56岁“恋爱脑”阿姨发现丈夫13年婚外情哭瞎右眼,离婚后10年游43国

56岁“恋爱脑”阿姨发现丈夫13年婚外情哭瞎右眼,离婚后10年游43国

上观新闻
2026-02-15 13:12:41
韩媒:中国或0金收官创最差纪录!离开主场原形毕露 只能靠谷爱凌

韩媒:中国或0金收官创最差纪录!离开主场原形毕露 只能靠谷爱凌

念洲
2026-02-14 16:28:58
大年初一千万别穿这三件衣,穿错瘦穷一年,全家跟着倒霉!

大年初一千万别穿这三件衣,穿错瘦穷一年,全家跟着倒霉!

凉湫瑾言
2026-02-15 11:55:10
担心的事还是发生,跑丢编制的女护士张水华,又回到了她的怪圈

担心的事还是发生,跑丢编制的女护士张水华,又回到了她的怪圈

天天热点见闻
2026-02-15 08:24:58
泽连斯基:已收到美国为期15年的安全保障提案,但乌方希望期限为30至50年

泽连斯基:已收到美国为期15年的安全保障提案,但乌方希望期限为30至50年

大风新闻
2026-02-15 15:23:15
亲戚蹭我车回家过年,路过超市他买3000元海鲜,结账时回头看我

亲戚蹭我车回家过年,路过超市他买3000元海鲜,结账时回头看我

船长与船1
2026-02-15 12:04:26
王毅在慕尼黑安全会议上,拿德国和日本作对比,日本媒体人不干了

王毅在慕尼黑安全会议上,拿德国和日本作对比,日本媒体人不干了

安安说
2026-02-15 12:43:39
热乎乎到账!贵阳一97年小伙晒出年终奖72210元,网友们陷入疯狂

热乎乎到账!贵阳一97年小伙晒出年终奖72210元,网友们陷入疯狂

火山詩话
2026-02-15 14:27:36
冯小刚一家三口拍春节全家福!冯朵被夸像王楚然,母女关系很微妙

冯小刚一家三口拍春节全家福!冯朵被夸像王楚然,母女关系很微妙

夜里的海风
2026-02-15 10:11:40
人间铁律!别人的儿子永远养不熟,天下的继父没有一个有好结果!

人间铁律!别人的儿子永远养不熟,天下的继父没有一个有好结果!

历史按察使司
2026-02-13 08:00:22
湖南一男子参加“同学聚会”被“下药”设赌局,药效发作后提前离场躲过一劫,5人被刑拘

湖南一男子参加“同学聚会”被“下药”设赌局,药效发作后提前离场躲过一劫,5人被刑拘

极目新闻
2026-02-15 14:27:05
2026-02-15 16:39:00
智东西 incentive-icons
智东西
聚焦智能变革,服务产业升级。
11235文章数 116972关注度
往期回顾 全部

科技要闻

发春节红包的大厂都被约谈了

头条要闻

重庆两套法拍房以192万余元起拍 物业欠费达108万余元

头条要闻

重庆两套法拍房以192万余元起拍 物业欠费达108万余元

体育要闻

最戏剧性的花滑男单,冠军为什么是他?

娱乐要闻

河南春晚被骂上热搜!大量广告满屏AI

财经要闻

谁在掌控你的胃?起底百亿"飘香剂"江湖

汽车要闻

奔驰中国换帅:段建军离任,李德思接棒

态度原创

游戏
艺术
房产
亲子
教育

《战神》新作IGN 8分!没有惊艳突破 但扎实有力

艺术要闻

宋徽宗耗费30年,寻得“二王”100幅真迹!

房产要闻

三亚新机场,又传出新消息!

亲子要闻

一位优秀保姆的下户

教育要闻

孩子的病让我们放下过去认为重要的东西

无障碍浏览 进入关怀版