网易首页 > 网易号 > 正文 申请入驻

月之暗面重返基模战场:发布首个开源万亿模型,押注“模型即Agent”

0
分享至

图片来源:视觉中国

蓝鲸新闻7月12日讯(记者 朱俊熹)时隔半年,"大模型六小龙"之一的月之暗面终于推出新一代基座模型Kimi K2。据官方介绍,Kimi K2是一款具备更强代码能力、更擅长通用Agent任务的MoE架构基础模型,总参数达1万亿,激活参数为320亿。

7月11日发布并同步开源的新模型包括两个版本:基础模型Kimi-K2-Base、更适合通用聊天和智能体任务的后训练模型Kimi-K2-Instruct。在自主编程、工具调用和数学推理相关的能力评测中,Kimi K2均取得了较优的表现。以SWE-bench Verified、AIME 2025等评测集为例,Kimi-K2-Instruct的得分超过了同为开源模型的DeepSeek-V3、阿里Qwen3,逼近甚至能够反超OpenAI GPT-4.1、Anthropic Claude 4 Opus等领先闭源模型。

结合6月底开启内测的新Agent"Kimi-Researcher"不难看出,月之暗面的思路正转向"模型即Agent"。模型自身就集成了自主决策和执行任务的能力,能够作为智能体解决复杂任务。

在官方释出的用例中,用户要求Kimi K2帮忙规划参加Coldplay乐队巡演的行程。该模型通过17次工具调用,涵盖搜索、日历、邮箱、航班、餐厅预订等环节,制定出一份完整的机酒与旅游规划,并形成可视化报告。

智能体能力正在成为国内外大模型厂商竞相押注的进化方向。本周,马斯克旗下的人工智能初创公司xAI发布新一代大模型Grok 4,包括单智能体、多智能体两个版本,具备工具使用、实时搜索等功能。Anthropic在推出Claude 4系列模型时也强调,在编程、推理和Agent方面"树立了全新标准",能够处理复杂且长时间运行的任务。

月之暗面在Kimi K2的技术博客里分享了对构建开放智能体智能的看法。其指出,预训练是智能体智能的关键基础,它让模型拥有基本的知识、理解和推理能力,从而在后续的强化学习中更有效地学习。但"人类数据就像是有限的‘化石燃料’",因此如何在预训练阶段提升对有限数据的利用效率,成为当前AI扩展的关键挑战。

而在后训练阶段,大模型不再只依赖人类数据,开始从自己的行为和结果中获得奖励、进行自我优化,以实现超越人类能力的可能。

"Kimi K2正是在这些洞见之上锻造而成的。"月之暗面表示。其同时强调,Kimi K2是构建通用Agent能力的坚实基础,但通用Agent还需要更高级的能力,比如思考和视觉理解,计划未来为该模型加入这些能力。此外,长文本处理能力曾是Kimi的核心优势,此次Kimi K2的上下文长度为128k,不及部分新发布的模型。

值得注意的是,Kimi K2是国内首个开源的万亿参数级别模型。此前虽有其他大模型厂商训练出万亿参数模型,如腾讯混元Turbo、MiniMax abab 6.5等,但都采取了闭源路线。

在训练Kimi K2这样的万亿参数级别的大模型时,月之暗面采用了自主创新的Muon优化器。与传统的Adam优化器相比,Muon在token利用效率上表现更优,能让大模型学得更快、更有效率。同时为解决Muon在超大规模训练时遇到的不稳定问题,团队还提出了MuonClip这一稳定性增强技术,支撑Kimi K2顺利完成15.5万亿tokens的预训练,未出现训练损失值的异常峰值。

自年初DeepSeek横空出世以来,月之暗面虽然陆续释出了一些技术或产品上的更新,但始终未能重拾外界对其的热切期待,一度表现得颇为低调沉寂。而此次Kimi K2的发布,让这家明星创企终于重回基模舞台的聚光灯下,这场牌局仍未见定论。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
周启豪陈幸同分手不是因为金钱?有网友爆料周启豪是广州城中村的

周启豪陈幸同分手不是因为金钱?有网友爆料周启豪是广州城中村的

凤幻洋
2026-01-31 16:40:23
我54岁鳏夫,她33岁瑶族姑娘,洞房夜那晚我傻愣了

我54岁鳏夫,她33岁瑶族姑娘,洞房夜那晚我傻愣了

小月文史
2024-05-27 18:48:10
徐杰焦泊乔复出!广东vs宁波12人名单 杜锋冲击队史交手9连胜

徐杰焦泊乔复出!广东vs宁波12人名单 杜锋冲击队史交手9连胜

狼叔评论
2026-02-01 18:46:02
仗打了一千多天后,美国才后知后觉发现不对劲:中国三年前的抉择竟早已是正确答案!

仗打了一千多天后,美国才后知后觉发现不对劲:中国三年前的抉择竟早已是正确答案!

源溯历史
2026-01-13 23:29:12
向华强每月给前妻丁佩5000抚养费,向太嫁过来把这个数字抬到10万

向华强每月给前妻丁佩5000抚养费,向太嫁过来把这个数字抬到10万

静若梨花
2026-02-01 10:08:17
大连一小区供暖不理想,室温不足15℃!供热公司:正规划检修管道

大连一小区供暖不理想,室温不足15℃!供热公司:正规划检修管道

半岛晨报
2026-02-01 13:45:05
父亲住我家19年,80大寿时说房子给哥哥,第二天父亲后悔了

父亲住我家19年,80大寿时说房子给哥哥,第二天父亲后悔了

小秋情感说
2026-02-01 13:51:36
吸烟有害健康是大骗局,尼古丁其实根本不致癌?告诉你真相

吸烟有害健康是大骗局,尼古丁其实根本不致癌?告诉你真相

健康之光
2026-02-01 08:40:05
央媒就扶起老人反被讹发声!如果要自证清白,公安机关要主动介入

央媒就扶起老人反被讹发声!如果要自证清白,公安机关要主动介入

小熊侃史
2026-01-19 07:35:08
央媒怒批、坑害老百姓!臭名昭著的几个相声演员,各个难以原谅

央媒怒批、坑害老百姓!臭名昭著的几个相声演员,各个难以原谅

无力的滋味
2026-02-01 11:32:33
电池巨头遭全球专利围剿!

电池巨头遭全球专利围剿!

电动知家
2026-01-31 17:11:07
心梗去世逐年增多?医生:牢记“3不喝、2不吃、1坚持”,别大意

心梗去世逐年增多?医生:牢记“3不喝、2不吃、1坚持”,别大意

袁医生课堂
2026-01-24 17:33:06
斯塔默访日一天就离开,高市布下晚宴,要让英方当面说出中国错了

斯塔默访日一天就离开,高市布下晚宴,要让英方当面说出中国错了

小陆搞笑日常
2026-02-01 01:48:40
天津一村干部占用集体土地,无任何手续盖房出租,累计获利数千万

天津一村干部占用集体土地,无任何手续盖房出租,累计获利数千万

报人老张
2026-02-01 08:00:12
元宵节的血光12:南宁问罪,铁拳惩嚣

元宵节的血光12:南宁问罪,铁拳惩嚣

金昔说故事
2026-02-01 17:39:14
1949年,袁世凯后人在美国的罕见合影,个个文质彬彬,出类拔萃

1949年,袁世凯后人在美国的罕见合影,个个文质彬彬,出类拔萃

万物知识圈
2025-12-13 09:20:48
贵州毕节临街门面被砌墙封堵?官方通报:业主矛盾,已全部拆除

贵州毕节临街门面被砌墙封堵?官方通报:业主矛盾,已全部拆除

新京报
2026-02-01 17:34:07
重要赛事!2月1晚上19:30,中央5套CCTV5、CCTV5+直播节目表

重要赛事!2月1晚上19:30,中央5套CCTV5、CCTV5+直播节目表

皮皮观天下
2026-02-01 12:23:41
霍震霆没有想到,离过年不到一月,77岁的弟弟霍震寰给霍家争光了

霍震霆没有想到,离过年不到一月,77岁的弟弟霍震寰给霍家争光了

寒士之言本尊
2026-01-30 15:08:40
罗塞尼尔中场神奇三连换,三人2球2助导演切尔西大逆转

罗塞尼尔中场神奇三连换,三人2球2助导演切尔西大逆转

懂球帝
2026-02-01 19:21:05
2026-02-01 19:32:49
蓝鲸新闻 incentive-icons
蓝鲸新闻
财经信息服务平台
126424文章数 193588关注度
往期回顾 全部

科技要闻

腾讯元宝宣布:10亿现金红包,今日开抢

头条要闻

老人狱中离世14年后获无罪 孙子专门就读法律专业申诉

头条要闻

老人狱中离世14年后获无罪 孙子专门就读法律专业申诉

体育要闻

锁喉吃红牌+扇耳光 英超15人打群架

娱乐要闻

马年春晚第三次联排,多位明星现身

财经要闻

黄仁勋台北"夜宴":汇聚近40位台企高管

汽车要闻

岚图汽车1月交付10515辆 同比增长31%

态度原创

健康
旅游
家居
房产
公开课

耳石症分类型,症状大不同

旅游要闻

“你好!中国”国家旅游形象展台亮相瑞士苏黎世

家居要闻

蓝调空舍 自由与个性

房产要闻

藏不住的小城大事,海澄新城执掌自贸港风口,进阶兑现美好生活新篇

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版