网易首页 > 网易号 > 正文 申请入驻

Kimi K2思考模型来了!实测3分钟做精美网页,IMO数学题翻车

0
分享至


智东西
作者 云鹏
编辑 李水青

智东西11月6日消息,刚刚,月之暗面正式发布了Kimi-k2 thinking模型,其为具有通用Agentic能力和推理能力的思考模型,擅长深度推理,可以通过多轮工具调用,解决各类复杂的难题。


▲月之暗面官方发布页面

Kimi K2首次发布是在7月11日,该模型总参数10000亿,激活参数320亿。Kimi K2-0905于9月5日发布,其核心升级了Agentic Coding能力、支持256K上下文、API支持60-100Token/s的输出速度、支持Claude Code。

价格方面,kimi-k2-thinking每百万tokens的输入价格(缓存未命中)为4元、输出价格为16元;“高速版”kimi-k2-thinking-turbo每百万tokens的输入价格(缓存未命中)为8元、输出价格为58元,适用于需要深度推理和追求极致高速的场景。


▲Kimi K2系列模型价格

在实际体验环节,我们主要测试了Kimi-k2 thinking在编程、数学和逻辑推理能力三个方面的表现。

在编程方面,我们令其生成一个开源模型分享网站的HTML网页原型,包括顶部导航栏、主体展示区、设计风格要求,还要求其构思两个特色功能。

从生成结果来看,我们对网页主要部分提出的要求都可以很好地被执行,包括导航栏有哪些部分、主题展示区由哪些模块组成,简洁现代的设计风格也有较好体现,一键复现、模型对比这两个特色功能也做了出来。


▲网页编程

整体网页的完成度是比较高的,并且不论是搜索框、按钮、筛选标签都是可以实际选中交互操作的,点击后会有对应的提示,比如点击上传模型,会提示需要准备的问题件、文件大小限制等信息。


▲网页按钮功能说明

生成网页项目的tokens总计消耗为9K,大约花费了3分钟左右的时间。不过在尝试多次生成结果时,偶尔会遇到崩溃状况。


在数学能力方面,今年国际数学奥林匹克竞赛(IMO)第六题被认为最具挑战性:


Kimi-k2 thinking在解题过程中,思考过程有21188字,经过4分钟左右时间,给出了错误答案4048块,正确答案为2112块。


▲Kimi-k2 thinking解答2025 IMO数学竞赛题第六题

这一过程总共消耗了23.5K的tokens。

在切换为高速版kimi-k2-thinking-turbo后,模型仍然给出了同样的4048错误答案,花费时间明显缩短至2分钟左右,但tokens消耗数却提升至38.5K。


▲Kimi-k2 thinking-turbo解答2025 IMO数学竞赛题第六题

对于另一道IMO数学竞赛题,Kimi-k2 thinking在经历了10多分钟的深度思考后,最终停止了思考,思考过程47684字,但并未给出答案。再次尝试后,思考过程同样卡住在了47940字上,未能给出答案。


▲Kimi-k2 thinking解答2025 IMO数学竞赛题第四题

由于Kimi-k2 thinking不支持图片输入自动识别公式,因此一些复杂的数学题目很难输入。

在常识逻辑推理方面,对于一般的问题,Kimi-k2 thinking可以很快给出答案,并且可以轻松绕开逻辑陷阱。


▲Kimi-k2 thinking解答逻辑推理问题

对于更进一步的逻辑推理考察题目,Kimi-k2 thinking也可以在1分钟左右的时间内给出答案,准确率较高,消耗tokens为16.6K。


▲Kimi-k2 thinking解答逻辑推理问题

结语:“思考”模型之战愈发焦灼

11月4日,阿里刚刚发布了Qwen 3系列中最强推理模型Qwen3-Max-Thinking早期预览版,Kimi今天就发布了自家K2系列的思考模型,同样主打深度推理能力。

在Agentic AI成为主流趋势之下,模型的思考推理能力愈发受到重视,这也是模型能否解决复杂现实问题的关键。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
新闻多一度丨神二十推迟返回 空间碎片影响有多大?

新闻多一度丨神二十推迟返回 空间碎片影响有多大?

新京报
2025-11-05 18:11:09
国民党新人事公布“柱系”班师回朝,郝龙斌的美女智囊掌管国际部

国民党新人事公布“柱系”班师回朝,郝龙斌的美女智囊掌管国际部

海峡导报社
2025-11-06 16:39:06
湖南前主持田源,直播间哭诉:维嘉能回去,求求前东家也让我回去

湖南前主持田源,直播间哭诉:维嘉能回去,求求前东家也让我回去

乐悠悠娱乐
2025-11-05 10:38:51
河北拦婚车要50条香烟后续:双方僵持一小时,新人无奈打车离开

河北拦婚车要50条香烟后续:双方僵持一小时,新人无奈打车离开

石辰搞笑日常
2025-11-06 13:20:26
“有仇必还”!告别陈伟霆,携手百亿继承人,家世显赫无人能敌

“有仇必还”!告别陈伟霆,携手百亿继承人,家世显赫无人能敌

可乐谈情感
2025-11-06 12:56:31
许家印可能只是替罪羊,恒大幕后黑手另有其人,早已逃之夭夭!

许家印可能只是替罪羊,恒大幕后黑手另有其人,早已逃之夭夭!

保德全
2025-11-02 19:30:03
山东人为什么不愿意做生意?

山东人为什么不愿意做生意?

李倩说品牌
2025-11-06 12:37:21
赛力斯为何突然大跌?

赛力斯为何突然大跌?

东针商略
2025-11-06 22:19:20
万万没想到!湾湾博主击碎具俊晔最后的体面,原来他留台原因很多

万万没想到!湾湾博主击碎具俊晔最后的体面,原来他留台原因很多

小娱乐悠悠
2025-11-05 09:33:40
Shams:詹姆斯已获准参加对抗训练,1-2周后重新评估伤情

Shams:詹姆斯已获准参加对抗训练,1-2周后重新评估伤情

懂球帝
2025-11-07 01:16:05
刚刚宣布!不降息了

刚刚宣布!不降息了

中国基金报
2025-11-06 22:23:42
小鹏机器人被疑藏真人?一镜到底拉开拉链,82 个自由度太逼真

小鹏机器人被疑藏真人?一镜到底拉开拉链,82 个自由度太逼真

小南看车
2025-11-06 16:39:36
心爱的硅胶娃娃被室友锁上门猛干,男子“抓奸在床”气哭报警获赔7766元

心爱的硅胶娃娃被室友锁上门猛干,男子“抓奸在床”气哭报警获赔7766元

可达鸭面面观
2025-10-11 15:09:06
四川这三名同学,保送清北

四川这三名同学,保送清北

红星新闻
2025-11-06 21:08:22
就在今天!11月7日凌晨,中超传来北京国安、上海海港、蓉城消息

就在今天!11月7日凌晨,中超传来北京国安、上海海港、蓉城消息

皮皮观天下
2025-11-07 04:25:29
海南首富,坐拥数百亿却没有儿子,花了10亿买别墅送明星妻子

海南首富,坐拥数百亿却没有儿子,花了10亿买别墅送明星妻子

冷夜说
2025-11-05 21:55:31
本土大哥邵佳一:足协刚拿到批文就官宣 已有国脚主动申请回国足

本土大哥邵佳一:足协刚拿到批文就官宣 已有国脚主动申请回国足

刘哥谈体育
2025-11-07 01:39:42
全红婵未夺冠并不意外,教练陈若琳到场为爱徒加油,满眼都是心疼

全红婵未夺冠并不意外,教练陈若琳到场为爱徒加油,满眼都是心疼

喜欢历史的阿繁
2025-11-07 01:00:07
你见过最离奇的案件是什么?网友:我一个变态都觉得这些人太变态

你见过最离奇的案件是什么?网友:我一个变态都觉得这些人太变态

带你感受人间冷暖
2025-11-01 00:05:14
网友晒家里的腊肠犬,看懵了,第一眼还以为是烧猪!

网友晒家里的腊肠犬,看懵了,第一眼还以为是烧猪!

美芽
2025-11-05 19:02:11
2025-11-07 07:55:00
智东西 incentive-icons
智东西
聚焦智能变革,服务产业升级。
10708文章数 116894关注度
往期回顾 全部

科技要闻

小鹏机器人里藏真人?何小鹏发一镜到底视频

头条要闻

"一键投诚"APP在台湾引热议 台当局破防

头条要闻

"一键投诚"APP在台湾引热议 台当局破防

体育要闻

送走两位全明星,公牛成了东部第一

娱乐要闻

“黑料缠身”的白百何 谁给她的勇气?

财经要闻

南银法巴加速发展背后:资金饥渴症待解

汽车要闻

是我眼花了么?怎么大猩猩都来参加新车发布了?

态度原创

健康
手机
亲子
旅游
数码

超声探头会加重受伤情况吗?

手机要闻

苹果折叠屏iPhone配置曝光:将首次搭载2400万屏下摄像头

亲子要闻

让宝宝少咳嗽、让孩子晚近视、为罕见病早行动 进博展商交出儿童健康民生答卷

旅游要闻

首周末五千人次打卡拉动乡村消费

数码要闻

苹果Apple TV全新开场动画幕后:相机结合玻璃Logo实拍

无障碍浏览 进入关怀版