网易首页 > 网易号 > 正文 申请入驻

新版 Kimi 突然发布!首个万亿开源模型不是 R2 是 K2,OpenAI 临时推迟开源 | 附实测体验

0
分享至

  不到半年,国产开源大模型的牌局已经翻了一轮。

  年初还是「AI 六小虎」齐头并进,如今却只剩寥寥几家还能站上牌桌。DeepSeek 一招「开源即发布」,凭借高性能和极致性价比迅速占据用户的心智,也顺势拿下了国产大模型开源叙事的话语权。

  此后,六小虎中不少公司接连遭遇融资受阻、产品停更、团队重组,甚至逐渐淡出公众视野。与此同时,当 DeepSeek 把开源模型卷出了实用门槛,也让其他玩家不得不加速入局。

  

  今天,轮到 Kimi 接棒出手,正式发布并开源 Kimi K2 模型。

  Kimi-K2-Base:未经过指令微调的基础预训练模型,适合科研与自定义场景;

  Kimi-K2-Instruct:通用指令微调版本(非思考模型),擅长大多数问答与 Agent 任务

  官方介绍称,Kimi K2 基于 MoE 架构打造,参数总规模达 1T,激活参数 32B,在代码生成、Agent 调度、数学推理等任务中具备竞争力。

  在 SWE Bench Verified、Tau2、AceBench 等基准测试中,K2 均取得开源模型中的 SOTA 成绩。其中,自主编程(Agentic Coding)、工具调用(Tool Use)和数学推理(Math & Reasoning)三大能力维度都有不错的表现。

  

  值得注意的是,上述评测中的所有模型均为非思考模型。在 Tau2-Bench 测试中,平均值按照任务加权计算。在 Swe-Bench 多语言测试中,仅评估了 Claude 4 Sonnet,因为 Claude 4 Opus 的成本过高。

  实际体验下来,写作能力的提升是这次版本升级中比较明显的一环。

  比如面对「描写一个夏天的午后,一碗西瓜、一个电风扇、一张旧沙发。要求不出现『热』字,也不直接写『我很舒服』,要让人读出闷热与松弛」时,K2 给出的文本既有画面感,又不失情绪的克制表达。语言克制、节奏松弛,甚至带有文学感。

  

  再比如这个相对复杂的案例:「写一篇看似是『在便利店偶遇前任』的平淡故事,但要隐藏一个副线:主角其实身患重病,正在做最后的生活整理。请控制情绪层次,不能直说,结尾只用一句隐喻点明真相。」

  K2 完全没有写出生病或死亡字眼,而是通过道具、行为、细节缓缓推进情绪张力。故事结构完整,结尾一瓶未开的汽水安静地躺在垃圾桶顶端,成为情绪隐线的收束。令我惊喜的是,甚至还补上了人物小传。

  

  上下滑动查看更多内容

  不过,隐喻密度偏高且引用并不合理,却也犯了和 DeepSeek 同样的毛病,尤其少量句式略显设计感过重,仍有提升的空间。

  在 Agent/Coding 任务上,Kimi K2 宣称支持 ToolCall 架构,可无缝接入 Owl、Cline、RooCode 等主流框架,具备自动指令拆解和任务链构建能力。目前 Agent 能力已开放 API 使用。

  在编程类任务上,K2 虽然整体完成度高,但瑕疵也比较明显,比如还是那个经典的天气卡片案例,Kimi 能完成基础的构建,但 UI 粗糙、动效生硬,在视觉体验上逊色不少。

  

  再拉高难度,我要求生成一个按周划分的前端学习计划,输出为 HTML 页面,支持模块展开与收起交互。这一任务对结构组织、内容节奏和 JS 逻辑的要求更高。K2 给出的结果中规中矩。

  

  我输入任务:「用 three.js 和 cannon-es.js 实现烟囱倒塌爆破效果」。K2 尝试联网查找资料并组合代码,整体思路在线,执行力尚可,但视觉效果依然较弱。

  

  当然,也有一些比较不错的案例。比如海外博主 @chetaslua 使用提示词「make a website that shows 3D Simulation of Asteroids hitting Earth in html」,产出效果更为成熟,得到的画面如下:

  

  由于 K2 兼容 OpenAI 和 Anthropic 的 API 协议,网友 @Khazzz1c 也使用 K2 在 Claude Code 上开发了一个打字游戏,并评价这个模型 「cracked AF」,这是俚语,意思是「强到离谱、好得不正常」。

  

  在 Kimi K2 背后,是月之暗面 Kimi 团队自研的一整套技术路径。

  技术博客显示,他们在训练万亿参数大模型时,摒弃传统的 Adam 优化器,改用自研的 Muon 体系,并引入 MuonClip 机制,有效缓解 attention logits 过大的问题,从而确保模型在 15.5T token 训练过程中无一次 loss spike,训练稳定性和 token 使用效率双双提升。

  同时,团队还构建了一条可大规模生成多轮工具使用场景的数据合成 pipeline,覆盖数百领域、数千种工具,并且,训练样本则由 LLM 自动筛选评估,确保数据质量。

  

  在训练策略上,Kimi K2 进一步强化了通用强化学习能力,不仅在代码、数学等可验证任务上进行强化学习,还通过「自我评价」机制解决奖励稀缺问题,显著增强了模型的泛化能力。

  开源层面,Kimi K2 的 Instruct 模型及 FP8 权重文件已上传至 Hugging Face,(传送门:https://huggingface.co/moonshotai/Kimi-K2-Instruct) 根据官方部署说明,Kimi K2 的 FP8 版本可在主流 H200 等平台上运行,支持最长 128K 上下文,最低部署要求为 16 张 GPU 的集群环境。

  目前包括 vLLM、SGLang、ktransformers 在内的主流推理引擎均已支持该模型,部署路径已被打通,但对普通开发者而言,算力的门槛仍不容忽视。

  商业化方面,Kimi K2 的 API 服务也已正式上线,提供最长 128K 上下文支持,定价为每百万输入 tokens 收费 4 元、输出 tokens 收费 16 元。

  

  而有趣的是,与 Kimi 的大方开源相比,OpenAI CEO Sam Altman 刚刚宣布推迟原定下周发布的开放权重模型,理由是仍需补充安全测试与高风险区域审查,且未确定延期时长。

  这么一对比,Kimi 还是敞亮太多了。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
钉在耻辱柱上!国家文物局出手,这三个跳梁小丑,真的彻底凉凉了

钉在耻辱柱上!国家文物局出手,这三个跳梁小丑,真的彻底凉凉了

户外阿崭
2025-12-28 17:07:24
女卡车司机“半挂西施”去世后,网友分析网名,4个字竟字字应验

女卡车司机“半挂西施”去世后,网友分析网名,4个字竟字字应验

千言娱乐记
2025-12-28 20:02:42
苦等5年,蒙古熟鸭子还是飞了,中俄谁也不让步,坐视大项目泡汤

苦等5年,蒙古熟鸭子还是飞了,中俄谁也不让步,坐视大项目泡汤

科普100克克
2025-12-07 18:20:34
美国国务院发火,要求中国大陆“必须停止”,岛内一个时代或终结

美国国务院发火,要求中国大陆“必须停止”,岛内一个时代或终结

三石记
2025-12-27 15:03:24
米兰20天首胜!暂登顶意甲,10战维罗纳全胜,连刷4大纪录

米兰20天首胜!暂登顶意甲,10战维罗纳全胜,连刷4大纪录

奥拜尔
2025-12-28 21:33:44
杭州姑娘“兔子警官”主动回应“哄孩子式执法”:“他们需要外力推一下……”

杭州姑娘“兔子警官”主动回应“哄孩子式执法”:“他们需要外力推一下……”

都市快报橙柿互动
2025-12-28 14:07:18
保定大量商户突然关闭,整个街道冷冷清清

保定大量商户突然关闭,整个街道冷冷清清

映射生活的身影
2025-12-27 18:09:05
统治澳洲!韩旭26分钟12中9高效22+5 加盟6战全胜狂胜138分

统治澳洲!韩旭26分钟12中9高效22+5 加盟6战全胜狂胜138分

醉卧浮生
2025-12-28 18:09:56
瓜子二手车发布榜单,保值排名出乎意料

瓜子二手车发布榜单,保值排名出乎意料

ZAKER新闻
2025-12-26 15:23:34
1960年春节,周总理请溥仪吃饭,酒桌上溥仪讲了个慈禧的“笑话”,总理听完,当场陷入了沉思

1960年春节,周总理请溥仪吃饭,酒桌上溥仪讲了个慈禧的“笑话”,总理听完,当场陷入了沉思

历史回忆室
2025-12-24 10:29:12
香港男子命丧天水围桥底,嫌疑人在深圳湾口岸落网!押回现场

香港男子命丧天水围桥底,嫌疑人在深圳湾口岸落网!押回现场

南方都市报
2025-12-28 12:18:04
直击:日本发生重大交通事故,67辆车连环撞,幸存者颤抖回忆惨烈现场……

直击:日本发生重大交通事故,67辆车连环撞,幸存者颤抖回忆惨烈现场……

日本物语
2025-12-27 20:32:22
闪评丨泽连斯基访美之际 普京再就俄乌冲突局势表态

闪评丨泽连斯基访美之际 普京再就俄乌冲突局势表态

国际在线
2025-12-28 15:07:02
畸形儿风波反转!医院回应透露2个关键信息 阚清子的沉默早有预兆

畸形儿风波反转!医院回应透露2个关键信息 阚清子的沉默早有预兆

观察鉴娱
2025-12-28 10:26:06
201米!40亿!腾讯西南总部,世界“第一扭”摩天楼

201米!40亿!腾讯西南总部,世界“第一扭”摩天楼

GA环球建筑
2025-12-25 23:00:32
羽球天王杯:铜牌诞生!世界第8复仇乔纳坦,石宇奇首局7-11落后

羽球天王杯:铜牌诞生!世界第8复仇乔纳坦,石宇奇首局7-11落后

刘姚尧的文字城堡
2025-12-28 20:01:00
61岁奥巴马夫人暴瘦后“逆生长”,与前总统丈夫合照笑开了花

61岁奥巴马夫人暴瘦后“逆生长”,与前总统丈夫合照笑开了花

艳儿说电影
2025-12-27 21:11:14
甚至来不及准备,湘超冠军永州队巡游花车为临时切割公交车改造而成

甚至来不及准备,湘超冠军永州队巡游花车为临时切割公交车改造而成

懂球帝
2025-12-28 16:35:07
广东一小伙,因入住毛坯房而走红,花费仅1万,却无一丝穷酸气!

广东一小伙,因入住毛坯房而走红,花费仅1万,却无一丝穷酸气!

阿离家居
2025-12-28 10:19:49
冲上热搜!黄子韬因脑淤血接受开颅手术缝了43针,本人回应

冲上热搜!黄子韬因脑淤血接受开颅手术缝了43针,本人回应

半岛晨报
2025-12-28 18:04:45
2025-12-28 21:52:49
AppSo incentive-icons
AppSo
让智能手机更好用的秘密
5968文章数 26734关注度
往期回顾 全部

科技要闻

特斯拉将在华布局自动驾驶?记者求证→

头条要闻

新华社发文:积蓄统一大势

头条要闻

新华社发文:积蓄统一大势

体育要闻

83分钟绝杀!曼城2-1年度收官:英超6连胜狂飙

娱乐要闻

白敬亭现身冰雪大世界 拍视频还翻车了

财经要闻

英伟达的收购史

汽车要闻

理想的2026:L9不容有失,i9再战纯电?

态度原创

教育
手机
健康
时尚
家居

教育要闻

从2026年北京选调拟录用名单看升学:这些大学最受青睐

手机要闻

1486.41万台!iPhone17系列中国市场销量刷新纪录,力压国产机!

这些新疗法,让化疗不再那么痛苦

2026年了,最好看还是这件大衣!

家居要闻

格调时尚 智慧品质居所

无障碍浏览 进入关怀版