网易首页 > 网易号 > 正文 申请入驻

Kimi首个万亿参数模型开源!免费可用,超强Agent推理,附实测体验

0
分享至

智东西7月12日报道,昨夜,国内大模型独角兽月之暗面发布并开源了其最新一代MoE架构基础模型Kimi K2,总参数量达到1万亿(1T),激活参数为32B。Kimi K2已在Kimi Web端和App端中可用。

Kimi K2是月之暗面首款开源发布的旗舰模型,在SWE Bench Verified(编程)、Tau2(智能体)、AceBench(工具调用)这三项基准测试中,这一模型取得开源模型中的SOTA成绩。

在自主编程(Agentic Coding)、工具调用(Tool Use)和数学推理(Math & Reasoning)这三个能力维度上,Kimi K2的表现超过了DeepSeek-V3-0324、Qwen-235B-A22B等模型,但在部分基准测试中略逊于Claude 4 Opus、OpenAI GPT-4.1等模型。

Kimi K2在预训练阶段使用了“MuonClip”优化器实现万亿参数模型的训练。这一优化器能提高Token利用效率,缓解高质量人类数据的短缺问题。月之暗面还应用了大规模Agentic Tool Use数据合成和引入自我评价机制的通用强化学习等技术。

Kimi K2 API服务也同步上线。Kimi K2 API支持最长128K上下文,计费方案为每百万输入tokens/4元,每百万输出tokens/16元,输入输出价格均为DeepSeek V3的2倍。

Kimi K2系列中的两个模型版本现已开源,包括未经过指令微调的基础预训练模型Kimi-K2-Base和通用指令微调版本Kimi-K2-Instruct(非思考模型)。前者适合科研与自定义场景,后者则可用于大多数问答与Agent任务。

Kimi K2现已上线无问芯穹Infini-AI异构云平台(cloud.infini-ai.com/genstudio/),用户能以与官方API同样的价格调用Kimi K2。

开源链接:

https://huggingface.co/moonshotai/Kimi-K2-Instruct

体验链接:

https://www.kimi.com/

一、编程能力迎提升,实测效果差强人意

根据月之暗面博客文章,在前端开发任务中,Kimi K2能生成有设计感与视觉表现力的代码,支持粒子系统、可视化和3D场景等表现形式。官方Demo中,Kimi K2开发了一个支持昼夜循环的山川峡谷3D景观:

还生成了粒子特效银河:

为验证上述能力,智东西向Kimi K2发送了如下提示词:

最终,Kimi K2交付的网页渲染效果并未如官方Demo中那般逼真,交互性和功能丰富度也略逊一筹。

在难度较低的个人网站开发任务上,Kimi K2展现出一定规划能力。在未收到明确指示的情况下,Kimi K2主动梳理了网站的目录结构,打造出的网站可扩展性更好。

就智东西进行的个人网站开发测试而言,Kimi K2相较Kimi K1.5的UI审美水平进步有限。

▲上方为Kimi K2生成结果,下方为Kimi K1.5生成结果

同样的任务交由DeepSeek-V3-0324进行处理,最终生成的结果如下:

二、Agent工具调用能力增强,扩展风格化写作能力

月之暗面称,Kimi K2现具备复杂指令解析能力,可将需求自动拆解为一系列格式规范、可直接执行的ToolCall结构。

开发者可将Kimi K2接入owl、Cline、RooCode等Agent/Coding框架,完成复杂任务或自动化编码。

Agent能力已可通过API使用,更多工具能力即将在Kimi上线。在月之暗面内部测试环境中的实际演示里,Kimi K2展现出一定体验Agentic能力。

比如,将13万行的原始数据丢给Kimi K2,它可以帮用户分析远程办公比例对薪资的影响,分析显著差异,自动生成统计图表与回归模型解读,并用统一色调做出小提琴图(violin plot) 、箱线图(box plot)、散点图(scatter plot)等专业图表,整理成报告。

再比如,如果用户是Coldplay粉丝,Kimi K2可以帮忙制定今年的追星计划,完成演唱会所在城市的机酒与旅游规划,并且生成日历,再用html概括完整行程规划并发送邮件。

Kimi K2还拥有了更强的风格化写作能力。官方提供的Demo中,Kimi K2模仿了苹果广告文案风格:

此外,Kimi K2在通用知识推理、数学、规划等任务中的表现亦有提升,比数字大小的题目已经难不住Kimi K2了。

结语:探索新型优化器,未来将新增思考与视觉理解

根据月之暗面博客文章,Kimi K2用MuonClip优化器支撑万亿参数模型训练,提升token利用效率。结合大规模Agentic数据合成与通用强化学习,这一模型的通用智能能力获得提升。

为了缓解大规模训练中的attention logits偏大问题,月之暗面抛弃了传统的Adam优化器,提出MuonClip优化器,并将其扩展到万亿参数规模,提升了训练稳定性和token使用效率。Kimi K2完成了15.5T token的训练,全程无loss spike。

月之暗面还构建了可大规模生成多轮工具使用场景的合成pipeline,其大规模Agentic Tool Use数据合成可覆盖数百领域、数千工具,样本由LLM评估筛选后用于训练。

Kimi K2在可验证任务上(代码、数学)使用了强化学习,还通过引入自我评价机制(self-judging),解决了不可验证任务的奖励稀缺问题,实现通用强化学习,提升泛化任务表现。

目前,Kimi K2尚不支持视觉理解和思考能力,月之暗面称这些能力将在未来陆续加入。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
美突遭斩首?无人机闯高官住所,特朗普一声令下,五角大楼行动了

美突遭斩首?无人机闯高官住所,特朗普一声令下,五角大楼行动了

健身狂人
2026-03-22 03:40:53
笑掉大牙!伊朗空天司令登上国家电视台,怕美以斩首不敢露真容

笑掉大牙!伊朗空天司令登上国家电视台,怕美以斩首不敢露真容

老马拉车莫少装
2026-03-21 17:30:29
伊朗军方消息人士:若美国“侵略”哈尔克岛将面临“前所未有的反击”

伊朗军方消息人士:若美国“侵略”哈尔克岛将面临“前所未有的反击”

财联社
2026-03-22 00:09:14
2026新晋女神盘点,两位传奇老师回归!

2026新晋女神盘点,两位传奇老师回归!

碧波万览
2026-03-22 01:17:40
香港发生9300万港元大劫案 5人洗劫73公斤黄金

香港发生9300万港元大劫案 5人洗劫73公斤黄金

看看新闻Knews
2026-03-21 23:01:07
王兴兴:26岁创办宇树科技,36岁身价67亿至今未婚,工作占据所有

王兴兴:26岁创办宇树科技,36岁身价67亿至今未婚,工作占据所有

以茶带书
2026-03-21 16:11:48
郑州一公司使用AI后立马大规模裁员,只留下前台和销售

郑州一公司使用AI后立马大规模裁员,只留下前台和销售

映射生活的身影
2026-03-21 20:36:56
地面战要来了?美军2艘“准航母”载数千士兵增援,第82空降师已待命!特朗普38年前就提出夺取哈尔克岛,伊朗:已准备好俘虏美军

地面战要来了?美军2艘“准航母”载数千士兵增援,第82空降师已待命!特朗普38年前就提出夺取哈尔克岛,伊朗:已准备好俘虏美军

每日经济新闻
2026-03-22 01:05:15
《好好的时光》收官,3人零差评1人翻红,她全程龇牙咧嘴差评一片

《好好的时光》收官,3人零差评1人翻红,她全程龇牙咧嘴差评一片

洲洲影视娱评
2026-03-21 14:20:20
伊方:击中F-16战机,已摧毁200多架飞行器!伊朗投入全新进攻战术和更现代化系统,发动大规模打击!伊朗先进导弹有多难拦?专家解读

伊方:击中F-16战机,已摧毁200多架飞行器!伊朗投入全新进攻战术和更现代化系统,发动大规模打击!伊朗先进导弹有多难拦?专家解读

每日经济新闻
2026-03-21 22:28:34
以色列迪莫纳被伊朗导弹“直接击中” 附近有敏感核设施

以色列迪莫纳被伊朗导弹“直接击中” 附近有敏感核设施

新华社
2026-03-22 02:48:03
陪玩仅仅是开胃菜,继关晓彤事件后,岳云鹏再次揭露内娱的阴暗面

陪玩仅仅是开胃菜,继关晓彤事件后,岳云鹏再次揭露内娱的阴暗面

素衣读史
2026-03-19 17:09:10
脸没恢复就别出来拍剧了,顶着肿胀脸、大刀双眼皮,太让人出戏了

脸没恢复就别出来拍剧了,顶着肿胀脸、大刀双眼皮,太让人出戏了

嘴角上翘的弧度
2026-03-22 03:56:36
她陪毛主席11年终身未嫁,临终前说了8个字,竟和主席同月同日离世

她陪毛主席11年终身未嫁,临终前说了8个字,竟和主席同月同日离世

寄史言志
2026-03-21 17:06:11
傅斯年怒斥苏联“集罪恶之大成”:那些敢向苏联开炮的中国硬骨头

傅斯年怒斥苏联“集罪恶之大成”:那些敢向苏联开炮的中国硬骨头

顾史
2026-03-21 19:52:44
被换下后连丢3球 蓉城外援与洋帅爆发激烈争吵 愤而离场+怒砸门框

被换下后连丢3球 蓉城外援与洋帅爆发激烈争吵 愤而离场+怒砸门框

我爱英超
2026-03-21 22:58:47
突发!美国宣布批准临时交付和销售滞留海上的伊朗石油,预计将新增1.4亿桶

突发!美国宣布批准临时交付和销售滞留海上的伊朗石油,预计将新增1.4亿桶

每日经济新闻
2026-03-21 08:11:08
物理学博士张朝阳出马!科普雷军“60+60”口误

物理学博士张朝阳出马!科普雷军“60+60”口误

超角度
2026-03-21 21:43:05
以军总参谋长批准在“所有战线”的空袭行动

以军总参谋长批准在“所有战线”的空袭行动

界面新闻
2026-03-22 07:31:17
涨幅史无前例!92号汽油或重回“9元时代”

涨幅史无前例!92号汽油或重回“9元时代”

新浪财经
2026-03-21 16:01:48
2026-03-22 07:48:49
智东西 incentive-icons
智东西
聚焦智能变革,服务产业升级。
11405文章数 117003关注度
往期回顾 全部

科技要闻

宇树招股书拆解,人形机器人出货量第一!

头条要闻

男子沉迷"打鸟":改装车辆买观鸟装备 一年花掉上百万

头条要闻

男子沉迷"打鸟":改装车辆买观鸟装备 一年花掉上百万

体育要闻

谁在决定字母哥未来?

娱乐要闻

田栩宁终于凉了?出轨风波影响恶劣

财经要闻

通胀警报拉响,加息潮要来了?

汽车要闻

小鹏汽车2025年Q4盈利净赚3.8亿 全年营收767亿

态度原创

游戏
教育
亲子
数码
公开课

魔兽世界:时光服P3阶段将至,新手该练什么职业,这个很重要!

教育要闻

多切图第2讲,一个视频学会!

亲子要闻

带娃宝妈用什么素颜霜,快速提气色不用卸妆?

数码要闻

炸锅!国产存储芯片再突破!手机固态价格大跳水,内存自由要来了

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版