网易首页 > 网易号 > 正文 申请入驻

Kimi K2思考模型来了!实测3分钟做精美网页,IMO数学题翻车

0
分享至


智东西
作者 云鹏
编辑 李水青

智东西11月6日消息,刚刚,月之暗面正式发布了Kimi-k2 thinking模型,其为具有通用Agentic能力和推理能力的思考模型,擅长深度推理,可以通过多轮工具调用,解决各类复杂的难题。


▲月之暗面官方发布页面

Kimi K2首次发布是在7月11日,该模型总参数10000亿,激活参数320亿。Kimi K2-0905于9月5日发布,其核心升级了Agentic Coding能力、支持256K上下文、API支持60-100Token/s的输出速度、支持Claude Code。

价格方面,kimi-k2-thinking每百万tokens的输入价格(缓存未命中)为4元、输出价格为16元;“高速版”kimi-k2-thinking-turbo每百万tokens的输入价格(缓存未命中)为8元、输出价格为58元,适用于需要深度推理和追求极致高速的场景。


▲Kimi K2系列模型价格

在实际体验环节,我们主要测试了Kimi-k2 thinking在编程、数学和逻辑推理能力三个方面的表现。

在编程方面,我们令其生成一个开源模型分享网站的HTML网页原型,包括顶部导航栏、主体展示区、设计风格要求,还要求其构思两个特色功能。

从生成结果来看,我们对网页主要部分提出的要求都可以很好地被执行,包括导航栏有哪些部分、主题展示区由哪些模块组成,简洁现代的设计风格也有较好体现,一键复现、模型对比这两个特色功能也做了出来。


▲网页编程

整体网页的完成度是比较高的,并且不论是搜索框、按钮、筛选标签都是可以实际选中交互操作的,点击后会有对应的提示,比如点击上传模型,会提示需要准备的问题件、文件大小限制等信息。


▲网页按钮功能说明

生成网页项目的tokens总计消耗为9K,大约花费了3分钟左右的时间。不过在尝试多次生成结果时,偶尔会遇到崩溃状况。


在数学能力方面,今年国际数学奥林匹克竞赛(IMO)第六题被认为最具挑战性:


Kimi-k2 thinking在解题过程中,思考过程有21188字,经过4分钟左右时间,给出了错误答案4048块,正确答案为2112块。


▲Kimi-k2 thinking解答2025 IMO数学竞赛题第六题

这一过程总共消耗了23.5K的tokens。

在切换为高速版kimi-k2-thinking-turbo后,模型仍然给出了同样的4048错误答案,花费时间明显缩短至2分钟左右,但tokens消耗数却提升至38.5K。


▲Kimi-k2 thinking-turbo解答2025 IMO数学竞赛题第六题

对于另一道IMO数学竞赛题,Kimi-k2 thinking在经历了10多分钟的深度思考后,最终停止了思考,思考过程47684字,但并未给出答案。再次尝试后,思考过程同样卡住在了47940字上,未能给出答案。


▲Kimi-k2 thinking解答2025 IMO数学竞赛题第四题

由于Kimi-k2 thinking不支持图片输入自动识别公式,因此一些复杂的数学题目很难输入。

在常识逻辑推理方面,对于一般的问题,Kimi-k2 thinking可以很快给出答案,并且可以轻松绕开逻辑陷阱。


▲Kimi-k2 thinking解答逻辑推理问题

对于更进一步的逻辑推理考察题目,Kimi-k2 thinking也可以在1分钟左右的时间内给出答案,准确率较高,消耗tokens为16.6K。


▲Kimi-k2 thinking解答逻辑推理问题

结语:“思考”模型之战愈发焦灼

11月4日,阿里刚刚发布了Qwen 3系列中最强推理模型Qwen3-Max-Thinking早期预览版,Kimi今天就发布了自家K2系列的思考模型,同样主打深度推理能力。

在Agentic AI成为主流趋势之下,模型的思考推理能力愈发受到重视,这也是模型能否解决复杂现实问题的关键。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
23岁懒死家中,“中国第一懒人”杨锁到底有多懒,守着肉菜被饿死

23岁懒死家中,“中国第一懒人”杨锁到底有多懒,守着肉菜被饿死

荷兰豆爱健康
2026-02-15 23:40:22
刚刚,马斯克新模型撞车Claude,口碑崩了

刚刚,马斯克新模型撞车Claude,口碑崩了

AppSo
2026-02-18 07:12:23
欧洲小偷,都传疯了,达成了一个行业共识,中国人的钱包,随便拿

欧洲小偷,都传疯了,达成了一个行业共识,中国人的钱包,随便拿

西楼知趣杂谈
2026-02-14 18:35:51
平台喊冤:10%抽成恐难覆盖成本!代表回怼:不能总让司机买单

平台喊冤:10%抽成恐难覆盖成本!代表回怼:不能总让司机买单

小熊侃史
2026-02-18 20:11:01
纽约期银失守72美元/盎司,日内跌7.73%

纽约期银失守72美元/盎司,日内跌7.73%

每日经济新闻
2026-02-17 23:12:21
泰国取消春节活动,闹哪样?

泰国取消春节活动,闹哪样?

观察者网
2026-02-18 09:28:07
男子花80块钱请人画画,付款时,要了张收据,50年后,这张收据卖了180万

男子花80块钱请人画画,付款时,要了张收据,50年后,这张收据卖了180万

霹雳炮
2026-02-14 20:47:47
35岁教授辞铁饭碗收废电池,20年狂赚400亿,如今车企抢着送钱

35岁教授辞铁饭碗收废电池,20年狂赚400亿,如今车企抢着送钱

青眼财经
2026-01-21 22:47:48
图片报:沃尔特马德在纽卡不开心,他愿意加盟拜仁或斯图加特

图片报:沃尔特马德在纽卡不开心,他愿意加盟拜仁或斯图加特

懂球帝
2026-02-18 14:36:09
这就是徐志摩爱而不得的林徽因中年时的真实长相,大家看看吧!

这就是徐志摩爱而不得的林徽因中年时的真实长相,大家看看吧!

趣文说娱
2026-02-15 11:42:49
洪森最大的失误:低估了西哈莫尼国王,高估了儿子洪玛奈!

洪森最大的失误:低估了西哈莫尼国王,高估了儿子洪玛奈!

阿柒的讯
2025-12-23 18:22:55
欧冠4强全胜:皇马大巴黎晋级在望,四大强队领跑,意甲深陷绝境

欧冠4强全胜:皇马大巴黎晋级在望,四大强队领跑,意甲深陷绝境

罗纳尔说个球
2026-02-18 20:20:10
神童张炘炀现状:博士毕业,没有无业啃老,坦言父母不欠他一套房

神童张炘炀现状:博士毕业,没有无业啃老,坦言父母不欠他一套房

阿讯说天下
2026-02-17 11:59:53
7小时票房破2.8亿,《飞驰人生3》春节档首日夺冠,吴京回本无望

7小时票房破2.8亿,《飞驰人生3》春节档首日夺冠,吴京回本无望

靠谱电影君
2026-02-17 07:09:15
徐波生了300个孩子?揭露了人类社会的本质问题

徐波生了300个孩子?揭露了人类社会的本质问题

历史总在押韵
2025-11-17 00:05:07
阿富汗塔利班恢复奴隶制。

阿富汗塔利班恢复奴隶制。

荆楚寰宇文枢
2026-01-29 23:23:47
世界上最便宜的长寿药,就一个字!

世界上最便宜的长寿药,就一个字!

尚曦读史
2026-02-17 09:19:08
胡春华发表署名文章

胡春华发表署名文章

社评
2025-10-31 10:11:37
王楚然仙气满满

王楚然仙气满满

草莓解说体育
2026-02-18 18:21:44
国乒新加坡大名单全出炉!孙颖莎节日苦练备战 各种商务接到手软

国乒新加坡大名单全出炉!孙颖莎节日苦练备战 各种商务接到手软

颜小白的篮球梦
2026-02-18 19:46:35
2026-02-18 21:19:00
智东西 incentive-icons
智东西
聚焦智能变革,服务产业升级。
11243文章数 116972关注度
往期回顾 全部

科技要闻

怒烧45亿,腾讯字节阿里决战春节

头条要闻

5位新能源车主春运开车出行 特斯拉车主:电车更好开

头条要闻

5位新能源车主春运开车出行 特斯拉车主:电车更好开

体育要闻

夺银被问丢金,谷爱凌回击外媒:很荒谬

娱乐要闻

6大卫视春晚收视出炉 北京台稳居第一

财经要闻

面条火腿香菇酱!上市公司这些年请你吃

汽车要闻

量产甲醇插混 吉利银河星耀6甲醇插混版申报图

态度原创

时尚
房产
游戏
家居
公开课

冬天穿衣一点都不难!裤子宽松、大衣简约,高级舒适又耐看

房产要闻

三亚新机场,又传出新消息!

PS6将搭载RDNA 5架构?开发者内部文档或坐实传闻

家居要闻

中古雅韵 乐韵伴日常

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版