网易首页 > 网易号 > 正文 申请入驻

迄今为止最强大的开源模型:Kimi K2 Thinking ,比肩闭源模型

0
分享至

大家好,我是 Ai 学习的老章

Kimi 也算我们的常客,尤其是 K2 模型,十分亮眼,目前也是我 Agent 常配模型之一

昨晚 ,刚刚模型文件开源,技术博客也发布了,本文做个梳理。
K2 Thinking 实测

先看几个网友实测:

启用 Kimi 工具调用,直接生成数学和物理解释动画

将公式渲染进行量子场论的动画推理

太空侵略者游戏

K2 Thinking 简介

kimi-k2-thinking模型是具有通用 Agentic 能力和推理能力的思考模型,它擅长深度推理,并可通过多步工具调用,帮助解决各类难题。

什么让它与众不同:
⚡ 原生 INT4 量化 → 2 倍快速推理
占用内存减半,无精度损失
256K 上下文,支持 200-300 次工具调用


Kimi K2 Thinking 上下文长度为 256k。(从常规的 Kimi K2 的 128k 提升而来),总参数 1T,激活参数 32B

官方释放的基准测试结果:

在 HLE (44.9%) 和 BrowseComp (60.2%) 上达到 SOTA
最多可以执行 200 – 300 个连续的工具调用 无需人工干预
在推理、自主搜索和编程方面表现出色


需要指出的是,Kimi 非常自信的与最强的闭源模型进行对比,在多个基准中结果反超闭源模型。

下面是更全面的对比结果,确实不需要与其他开源模型比参数了:


artificialanalysis.ai 也对 Kimi K2 Thinking 做了基准测试,结果也十分优秀

➤ Kimi K2 Thinking 在 ²-Bench Telecom 代理工具使用基准测试中获得了 93% 的成绩,这是一个 agentic tool 基准测试,模型作为客户服务代理进行操作。在长期代理上下文中的工具使用是 Kimi K2 Instruct 的强项,而新的 Thinking 变体在此方面取得了显著进步。


K2 Thinking 本地部署

K2 Thinking 的模型文件只有 594GB


https://huggingface.co/moonshotai/Kimi-K2-Thinking

K2 Instruct 和 K2 Instruct 0905 的大小则超过 1TB,为何 Thinking 之后 594GB 呢?

这是因为 K2 Thinking 使用 INT4 精度而非 FP8,Moonshot 在后训练阶段使用量化感知训练来实现这一点,这意味着推理和训练的效率提升。使用 INT4 的一个潜在原因是,Blackwell 的 NVIDIA GPU 不支持 FP4,因此 INT4 更适合在较陈旧的硬件上实现效率提升。

vLLM Day 0 支持 K2 Thinking 的部署,命令如下

# 安装
uv venv
source .venv/bin/activate
uv pip install -U vllm --pre --extra-index-url https://wheels.vllm.ai/nightly --extra-index-url https://download.pytorch.org/whl/cu129 --index-strategy unsafe-best-match # for xformers

# 部署
vllm serve moonshotai/Kimi-K2-Thinking \
--trust-remote-code \
--tensor-parallel-size 8 \
--enable-auto-tool-choice \
--tool-call-parser kimi_k2 \
--reasoning-parser kimi_k2 \

## `--reasoning-parser` 标志指定用于从模型输出中提取推理内容的推理解析器。

要启动 Kimi-K2-Thinking 需要 8 个 141GB 的 H200/H20,成本还是蛮高的,不过即便再量化,估计向下空间也不大了吧?已经 int4 了,还能怎样。

推荐使用 解码上下文(DCP)并行部署,添加 --decode-context-parallel-size number 来启用解码上下文并行:

vllm serve moonshotai/Kimi-K2-Thinking \
--trust-remote-code \
--tensor-parallel-size 8 \
--decode-context-parallel-size 8 \
--enable-auto-tool-choice \
--tool-call-parser kimi_k2 \
--reasoning-parser kimi_k2 \

配合 DCP 后,优势显著(43% 更快的 Token 生成,26% 更高的吞吐量),同时几乎没有缺点(中位数延迟改善微乎其微)

指标

TP8

TP8+DCP8

变更

改进 (%)

请求吞吐量 (req/s)

1.25

1.57

+25.6%

输出标记吞吐量 (tok/s)

+43.1%

平均 TTFT(秒)

+16.0%

中位数 TTFT(秒)

后面我会拿之前的用例详细测试一下,同时也把 Claude code 后台模型改成 K2 Thinking 多用一用

如有能再量化同时保障效果不打大折扣,把部署成本控制在 4 卡就好了,我也可以本地部署试试了。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
张柏芝素颜照,有斑有痣还有法令纹…很真实…骨相绝了

张柏芝素颜照,有斑有痣还有法令纹…很真实…骨相绝了

东方不败然多多
2025-11-08 02:22:10
圆满了?C罗已不在乎史上最佳,因为他已为葡萄牙拿到三座冠军!

圆满了?C罗已不在乎史上最佳,因为他已为葡萄牙拿到三座冠军!

田先生篮球
2025-11-07 09:11:11
有个比自己有钱的兄弟姐妹是啥体验?网友:大家只是有点血缘关系

有个比自己有钱的兄弟姐妹是啥体验?网友:大家只是有点血缘关系

解读热点事件
2025-11-03 00:15:03
水洗貂皮退货后续:买家宝妈被堵小区,商家起诉,女老板口碑暴涨

水洗貂皮退货后续:买家宝妈被堵小区,商家起诉,女老板口碑暴涨

子芫伴你成长
2025-11-06 18:49:11
老年人如何应对肌肉流失?医生提醒:坚持这两个方法,效果非常好

老年人如何应对肌肉流失?医生提醒:坚持这两个方法,效果非常好

老嘪科普
2025-10-23 19:21:38
WTT冠军赛连爆大冷门!男单前三号种子全军覆没,雨果苦战4局崩盘

WTT冠军赛连爆大冷门!男单前三号种子全军覆没,雨果苦战4局崩盘

全言作品
2025-11-07 22:14:20
西方卫星盯大连船厂,004航母轮廓让美揪心,中美航母博弈新阶段

西方卫星盯大连船厂,004航母轮廓让美揪心,中美航母博弈新阶段

科学知识点秀
2025-11-08 08:00:03
火箭憾负!申京25+9+8,赛后谁留意杜兰特,低头直接走向球员通道

火箭憾负!申京25+9+8,赛后谁留意杜兰特,低头直接走向球员通道

担酒
2025-11-08 11:16:41
特斯拉官宣!这款车正式开售,28.85万元起!特斯拉第三季度全球交付49.7万辆创新高,公司股价上涨了约40%

特斯拉官宣!这款车正式开售,28.85万元起!特斯拉第三季度全球交付49.7万辆创新高,公司股价上涨了约40%

每日经济新闻
2025-11-08 11:20:08
女子离婚后和前夫有染,借看娃之机行夫妻之实,自录视频发网分享

女子离婚后和前夫有染,借看娃之机行夫妻之实,自录视频发网分享

吾观専欗
2025-11-05 18:09:58
深圳37家印度人空壳公司被端,网友:那些印度“寄生者”开始慌了

深圳37家印度人空壳公司被端,网友:那些印度“寄生者”开始慌了

丫头舫
2025-11-06 23:15:12
纪实 蛇蝎美人劳荣枝被抬上执行车,突然放声大哭,律师:她会演

纪实 蛇蝎美人劳荣枝被抬上执行车,突然放声大哭,律师:她会演

谈史论天地
2025-10-15 15:46:35
郑丽文将出席追思吴石,民进党竟恼羞成怒?马英九说了一句大实话

郑丽文将出席追思吴石,民进党竟恼羞成怒?马英九说了一句大实话

南宫一二
2025-11-08 12:11:05
俄总理回国,把中方的话一字不落念给普京,他听后做两个重大决定

俄总理回国,把中方的话一字不落念给普京,他听后做两个重大决定

混沌录
2025-11-07 23:23:07
中共中国科学院党组发布人事任免通知

中共中国科学院党组发布人事任免通知

中国能源网
2025-11-07 17:54:06
古代夫妻在进行房事时,为何总会有丫鬟守在床边?

古代夫妻在进行房事时,为何总会有丫鬟守在床边?

忠于法纪
2025-11-01 09:13:34
撕奖最大的受害者出现了,不是喊冤的白百何,而是不吭声的蒋奇明

撕奖最大的受害者出现了,不是喊冤的白百何,而是不吭声的蒋奇明

木子爱娱乐大号
2025-11-06 19:35:11
3年夺8冠!皇马愿与32岁铁汉续约:等到伤愈复出 开启谈判

3年夺8冠!皇马愿与32岁铁汉续约:等到伤愈复出 开启谈判

叶青足球世界
2025-11-07 11:24:23
初三学生被霸凌者打断肋骨,母亲不去派出所,隔天校园来六辆商务车

初三学生被霸凌者打断肋骨,母亲不去派出所,隔天校园来六辆商务车

悬案解密档案
2025-10-21 09:24:49
这次轮到白家了,7人被判死刑!

这次轮到白家了,7人被判死刑!

谈芯说科技
2025-11-05 19:44:35
2025-11-08 13:12:49
机器学习与Python社区 incentive-icons
机器学习与Python社区
机器学习算法与Python
3189文章数 11067关注度
往期回顾 全部

科技要闻

美股“AI八巨头”单周市值损失8000亿美元

头条要闻

萧美琴等在欧洲议会大楼进行"台独"分裂活动 中方回应

头条要闻

萧美琴等在欧洲议会大楼进行"台独"分裂活动 中方回应

体育要闻

邵佳一准备好了,但中国足球准备好了吗?

娱乐要闻

梁婷为辛芷蕾发声:没什么可质疑的

财经要闻

小马、文远回港上市 但自动驾驶还没赢家

汽车要闻

特斯拉Model Y后驱长续航版上线:28.85 万元

态度原创

健康
旅游
艺术
房产
公开课

超声探头会加重受伤情况吗?

旅游要闻

“古道联达州·文旅共长安”达州文旅推介活动(西安站)成功举办

艺术要闻

江西深山的“亚洲第一铀矿”,曾为原子弹做贡献,如今怎样了?

房产要闻

封关倒计时!三亚主城 2.3 万 /㎡+ 即买即住,手慢无!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版