网易首页 > 网易号 > 正文 申请入驻

深夜突袭!万亿参数MoE模型Kimi K2上线即开源,月之暗面能否重归C位?

0
分享至

2025年以来略显沉寂的月之暗面,在深夜突袭。

7月11日晚,月之暗面宣布正式发布Kimi K2模型,并同步开源。从介绍来看,Kimi K2是一款具备更强代码能力、更擅长通用Agent(智能体)任务的MoE(Mixture of Experts,混合专家模型)架构基础模型,总参数1T,激活参数为32B。

本次开源的Kimi K2模型分为Kimi-K2-Base和Kimi-K2-Instruct两个版本,前者是未经过指令微调的基础预训练模型,适合科研与自定义场景;而后者为通用指令微调版本(非思考模型),在大多数问答与Agent任务中有更好的表现。

2025年以来,“Kimi们”的处境正发生着改变。DeepSeek以低成本、高性能的开源模型强势入场;MinMax更是火力全开,今年6月在向开源社区投下一枚“重磅炸弹”,发布自主研发的MiniMax-M1系列模型后,在紧随其后的四个工作日里“一日一更”,直接“五连发”;而一众大厂对于AI(人工智能)热情和野心也在今年再上一个台阶,阿里、腾讯持续加码AI,字节来势汹汹,大模型格局的洗牌还在继续。

抛开一切变化,硬实力才是搏击市场的硬拳头。这次,月之暗面能否靠Kimi K2重归大模型C位?

Kimi K2上线即开源

月之暗面在官方介绍中称,在SWE Bench Verified、Tau2、AceBench等基准性能测试中,Kimi K2均取得开源模型中的SOTA(state-of-the-art)成绩。在其公布的测评结果中,Kimi K2在Agentic Coding(自主编程)、Tool Use(工具调用)和Math&Reasoning(数学推理)三个维度的表现上均超过了同为开源模型的DeepSeek-V3和阿里Qwen3。值得一提的是,Kimi评测中的所有模型均为非思考模型的Kimi-K2-Instruct。

目前,Kimi K2的API(应用程序编程接口)服务已上线,支持最长128K上下文,计费方案为4元/百万“输入”tokens(大模型处理文本时的最小单位),16元/百万“输出”tokens,兼容OpenAI和Anthropic两种API格式。

为了体现Kimi K2在代码、Agent工具调用、风格化写作三项能力上的提升,月之暗面也给出了具体任务下的展示。在前端开发任务中,Kimi K2支持粒子系统、可视化和3D(三维)场景等表现形式。

而在Agent工具调用能力方面,月之暗面表示Kimi K2现已具备稳定的复杂指令解析能力,可将需求自动拆解为一系列格式规范、可直接执行的ToolCall(工具调用)结构。在其释出的案例中,Kimi K2规划了参加Coldplay乐队巡演的行程,可以完成演唱会所在城市的机酒与旅游规划,并且生成日历,再用html概括完整行程规划。

《每日经济新闻》记者也使用Kimi K2进行了旅游规划的测试。根据“两个人计划8月份从北京出发,去日本东京以及大阪进行为期5天的旅游,希望能看到花火大会、吃到当地特色食物,帮我做一下包括机酒和行程在内的图文并茂的旅行规划”的需求,Kimi K2花费3分钟左右进行了一份详尽的旅游规划,规划中包括了具体的餐厅、食物、景点以及一些实用攻略。美中不足的是,这份规划是以文字以及表格的形式呈现的,虽然在最后附上了一个百度网盘链接表示可以自取图片内容,但实际上该链接是无法打开的。

随后,记者进一步提出将规划以HTML格式呈现,Kimi K2在随后交付的网页中补充了一些票务的信息,并完成了“图文并茂”的需求。不过,与官方演示的案例相比,网页整体的呈现质量还较为粗糙。

值得一提的是,此前记者还使用类似的提示词测试过字节的扣子空间。对比两次测试结果可以发现,扣子空间在网页的设计上完成度更高、更为美观。Kimi K2虽然在此略逊一筹,但旅游攻略制定上更为详细,给出了包括餐厅、景点在内的详细信息,还有如“交通卡当地退卡避免异地手续费”等注意事项。

此外,本次Kimi还特别展示了Kimi K2对文字输出风格的掌控,并且在虚构写作任务中,官方还表示:Kimi K2生成的文字更关注细节与情感,不再是抽象泛泛而谈。记者也以2025年北京高考的作文题目“数字闪耀时”为例,假设Kimi K2为高中生,完成一篇一类的记叙文。从完成结果上来说,整体呈现效果良好,但在最后收尾的部分隐约透露出一些“AI味”。

Kimi也从技术角度透露,为了支撑万亿参数模型训练的稳定性,Kimi K2没有使用传统的Adam优化器,而是使用Muon优化器。MuonClip优化器能够稳健支撑万亿参数模型训练,显著提升token利用效率。

Kimi的下一步要走向哪?

Kimi K2的突袭中,似乎隐含着要打一场翻身仗的决心。

2024年11月,月之暗面创始人杨植麟在接受《每日经济新闻》记者采访时表示,将提升用户留存视为Kimi眼下最核心的任务。而在当时,Kimi还是国产大模型之中备受瞩目的一个。

商业智能数据服务商QuestMobile数据显示,截至2024年12月份,豆包、Kimi、文小言的月活跃用户规模分别为7523万、2101万和1224万。Kimi位列原生App领域的“三强”之一。

随着今年年初DeepSeek的横空出世,整个市场格局被迅速打乱。

今年5月,《每日经济新闻》联合QuestMobile发布的《2025年一季度AI应用价值榜》显示,Kimi虽仍在月均活跃用户规模上位于第四,但其2000万出头的规模已经和以1.8亿排在第一的DeepSeek相差甚远。在“月均下载用户数环比增长”一项上,Kimi甚至出现了负增长,用户数环比下降3.8%。

2025年以来,Kimi对模型的更新升级速度明显放缓。但从2024年年底到今年5月份,Kimi在似乎瞄准了垂类领域,寻找新的用户群,先后和财新传媒、小红书、网易游戏《逆水寒》达成合作。

此前6月20日,Kimi发布第一个Agent——Kimi-Researcher(深度研究)。

据官方表示:“模型即Agent,Kimi-Researcher是基于端到端自主强化学习(end-to-end agentic RL)技术训练的新一代Agent模型,也是一个专为深度研究任务而生的Agent产品。”当时Kimi还表示将逐步开源Kimi-Researcher基础预训练模型,以及强化学习后的模型,如今来看的话应该就是本次发布的Kimi K2。

知名经济学者、工信部信息通信经济专家委员会委员盘和林在接受《每日经济新闻》记者微信采访时对Kimi上半年的努力进行了分析。在他看来,Kimi的努力方向是对的,但还不够,Kimi需要将自己的AI嵌入到一个生态当中。如今,互联网平台各大生态是封闭的,比如电商的AI可以帮助商家设计网站,自媒体的AI能够帮助自媒体制作视频,那么,Kimi的目标用户是谁?这方面,需要Kimi自己明确。

此外记者注意到,各家今年在升级大模型的时候往往也会“卷”到价格。

6月17日,MiniMax发布MiniMax-M1系列模型,并以token范围分段定价。在0~12.8万token范围内,据官方介绍,其定价均低于DeepSeek-R1。

6月11日,豆包大模型1.6正式发布时,火山引擎总裁谭待现场表示,豆包1.6首创按“输入长度”区间定价,深度思考、多模态能力与基础语言模型统一价格。豆包1.6的综合成本只有豆包1.5深度思考模型或DeepSeek-R1的三分之一。

而本次Kimi K2的定价和DeepSeek-R1基本持平。在盘和林看来,目前价格还不完全是竞争的关键因素,“因为同样价格的话,存在先入为主(的问题)。很多用户用过一个AI,如果价格相同,为什么要去用另一个AI?这个转换理由有两个,另一个AI更便宜,或者另一个AI更符合自己需要。我认为Kimi不能走低价,而是要走差异化路线。”

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
引而不发才是王道,封锁霍尔木兹海峡,伊朗打完了最后一张牌……

引而不发才是王道,封锁霍尔木兹海峡,伊朗打完了最后一张牌……

家传编辑部
2026-03-26 10:34:27
6900万元!摩洛哥要求塞内加尔归还非洲杯奖金+奖牌 后者强硬拒绝

6900万元!摩洛哥要求塞内加尔归还非洲杯奖金+奖牌 后者强硬拒绝

风过乡
2026-03-26 19:13:28
伊朗军方:中东地区内“所有美军基地已被摧毁” 部分美军指挥官和士兵已离开基地 伊朗武装力量正展开搜捕

伊朗军方:中东地区内“所有美军基地已被摧毁” 部分美军指挥官和士兵已离开基地 伊朗武装力量正展开搜捕

闪电新闻
2026-03-26 10:00:46
利空突袭,全线杀跌!

利空突袭,全线杀跌!

中国基金报
2026-03-26 13:16:51
全国高速明天大调整!车主集体欢呼:早该这么干了

全国高速明天大调整!车主集体欢呼:早该这么干了

沙雕小琳琳
2026-03-26 02:05:39
特朗普警告伊朗在和平协议问题上“认真起来”

特朗普警告伊朗在和平协议问题上“认真起来”

界面新闻
2026-03-26 19:29:30
张雪峰灵堂照曝光,门口摆满了花圈,网友看到遗像后心里酸酸的

张雪峰灵堂照曝光,门口摆满了花圈,网友看到遗像后心里酸酸的

180视角
2026-03-26 18:36:11
伊朗女药剂师拒绝撤离,空袭第10天在“精准”打击下被“误杀”

伊朗女药剂师拒绝撤离,空袭第10天在“精准”打击下被“误杀”

网易新闻出品
2026-03-26 11:16:13
张雪峰追悼会定于本周六,丧事从简不搞排场,11岁女儿成全家心病

张雪峰追悼会定于本周六,丧事从简不搞排场,11岁女儿成全家心病

未曾青梅
2026-03-26 22:48:49
痛心!张雪峰女儿哭成泪人!再多的财富也无法填补父爱的空缺

痛心!张雪峰女儿哭成泪人!再多的财富也无法填补父爱的空缺

魔都姐姐杂谈
2026-03-26 20:54:38
全线跳水!刚刚,伊朗发动攻击

全线跳水!刚刚,伊朗发动攻击

中国基金报
2026-03-26 16:15:26
京沪蓉之后,第四座“双机场”城市,来了

京沪蓉之后,第四座“双机场”城市,来了

西部城市
2026-03-25 21:43:15
塞尔维亚购买中国超音速导弹?国防部:正常军贸合作,不针对第三方

塞尔维亚购买中国超音速导弹?国防部:正常军贸合作,不针对第三方

澎湃新闻
2026-03-26 17:24:26
斯柯达退出中国?大众中国回应:销售持续至年中,客户将持续获得全面售后支持

斯柯达退出中国?大众中国回应:销售持续至年中,客户将持续获得全面售后支持

澎湃新闻
2026-03-26 17:02:26
网友在乌兹别克斯坦偶遇“佛山三水城巴”,佛山方面回应:车子被转卖到了国外

网友在乌兹别克斯坦偶遇“佛山三水城巴”,佛山方面回应:车子被转卖到了国外

极目新闻
2026-03-26 17:01:19
心源性猝死人数逐渐增多,医生建议:少吃鸡肉,多喝7样增强免疫

心源性猝死人数逐渐增多,医生建议:少吃鸡肉,多喝7样增强免疫

垚垚分享健康
2026-03-26 16:09:56
曾在恒大赚上亿!40岁郜林吐槽:在中乙当老总1个月工资不够油费

曾在恒大赚上亿!40岁郜林吐槽:在中乙当老总1个月工资不够油费

我爱英超
2026-03-26 20:47:14
41岁张雪峰去世后续,其婚姻被扒,已离婚6年,前妻很低调

41岁张雪峰去世后续,其婚姻被扒,已离婚6年,前妻很低调

180视角
2026-03-26 13:01:03
特朗普再次表态:伊朗正与美方对话

特朗普再次表态:伊朗正与美方对话

财联社
2026-03-26 23:10:07
广东女子十几万爱马仕包被狗啃坏,配色稀有没法修复,回应:心疼包,更担心狗子的肠胃

广东女子十几万爱马仕包被狗啃坏,配色稀有没法修复,回应:心疼包,更担心狗子的肠胃

大象新闻
2026-03-26 13:53:02
2026-03-26 23:55:00
每日经济新闻 incentive-icons
每日经济新闻
中国主流财经全媒体平台。
1519463文章数 2724759关注度
往期回顾 全部

科技要闻

美团发布外卖大战后成绩单:亏损超200亿

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

刘晓庆妹妹发声!称姐姐受身边人挑拨

财经要闻

油价"驯服"特朗普?一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

家居
亲子
数码
艺术
公开课

家居要闻

傍海而居 静观蝴蝶海

亲子要闻

看看把孩子吓得哈哈哈

数码要闻

英特尔发Q1.26版Arc Pro专业显卡驱动,支持B70 / B65显卡

艺术要闻

哪一座桥不是风景?

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版