11月6日晚,月之暗面(Moonshot AI)发布全新模型 Kimi K2 Thinking,称其为“Kimi 迄今能力最强的开源思考模型”。
据介绍,该模型基于“模型即 Agent”的理念训练,原生具备“边思考,边使用工具”的能力,在多项国际基准测试中达到 SOTA(业界最优)水平。
![]()
官方数据显示,Kimi K2 Thinking 在 “Humanity’s Last Exam”(人类最后的考试)、自主网络浏览(BrowseComp)、复杂信息收集推理(SEAL-0)等测试中均表现出领先成绩,在 Agentic 搜索、Agentic 编程、写作与综合推理 等任务中全面提升。
此外,据悉该模型可在 无人工干预 情况下,持续进行300轮以上工具调用与多轮思考。月之暗面称,这是其在 Test-Time Scaling(测试时扩展) 领域的最新进展,通过扩展思考 token 数与调用轮次,显著增强模型的持续推理与执行能力。
Kimi K2 Thinking 已同步上线 kimi.com 和最新版 Kimi 手机应用,用户在常规对话模式中即可体验升级后的推理性能。Kimi Agent 模式的底层模型也将陆续替换为 K2 Thinking,以支持完整的多轮思考与工具使用功能。(袁宁)
本文来自网易科技报道,更多资讯和深度内容,关注我们。
