网易首页 > 网易号 > 正文 申请入驻

长江证券:Kimi K2 Thinking训练成本460万美元 推理能力达SOTA水平

0
分享至

11月14日,长江证券发布媒体行业AI系列跟踪报告,称多模型相继发布,高性价比模型表现亮眼。

11月6日,KimiK2Thinking模型发布并开源,全面提升Agent能力与推理能力,并在训练成本方面再创新低。11月8日,OpenAI宣布上线GPT-5Codex-Mini,并针对ChatGPTPlus、Business和Edu用户提升了约50%的速率限制,为ChatGPTPro和Enterprise用户提供了任务优先处理服务。

KimiK2Thinking模型发布,Agent与推理性能实现跃升,训练成本再创新低。KimiK2Thinking模型的核心亮点在于通过多轮调用工具和多步思考,掌握“边思考、边使用工具”的能力,大幅提升Agent能力与推理能力。1)Agent能力:能够持续进行200-300次工具调用,并在调用过程中交错思考,根据ArtificialAnalysis,KimiK2Thinking在2-BenchTelecom智能体工具使用基准中以93%的得分达到SOTA水平,优于CPT-5Codex87%的得分,以及KimiK2Instruct73%的得分。2)推理能力:该模型在“人类最后的考试”评测中取得SOTA成绩,展现强劲推理能力与问题解决能力。此外,该模型通过INT4量化技术等实现了较高性能与较低成本的平衡,根据CNBC报道,KimiK2Thinking模型的训练成本仅为460万美元,显著低于DeepSeek-V3、OpenAI系列模型的成本投入。KimiK2Thinking模型价格与KimiK2模型持平,价格为每百万Token输入4元、输出16元、命中缓存输入1元。目前该模型已上线Kimi网页版和最新版Kimi手机应用的常规对话模式,后续KimiAgent模式的底层模型也将升级为该模型。认为KimiK2Thinking模型以较低成本实现较高性能,在一定程度上验证了国产大模型的开源低成本路线具备较强潜力。

OpenAI上线GPT-5Codex-Mini模型,具备更高性价比。11月8日,OpenAI上线轻量级模型GPT-5Codex-Mini模型,相较于标准版,GPT-5Codex-Mini模型更加紧凑且具备更优成本。其轻量化设计能在一定程度上降低开发者的使用成本,主要适用于简单的软件工程任务处理,以及一些即将到达调用限制的场景,当调用量达到配额的90%时,Codex会自动推荐用户切换至GPT-5-Codex-Mini。在SWE-benchVerified测试中,GPT5-Codex的得分为74.5%,而GPT-5-Codex-Mini的得分为71.3%,两者在性能上的差距较小。在现有订阅体系下,用户使用GPT-5Codex-Mini将获得标准版约4倍的调用量。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
社评:德国副总理访华的正常与不寻常

社评:德国副总理访华的正常与不寻常

环球网资讯
2025-11-18 00:06:14
云南师范大学党委原书记饶卫被查,曾任云南省发改委副主任

云南师范大学党委原书记饶卫被查,曾任云南省发改委副主任

澎湃新闻
2025-11-18 12:26:26
泰国华裔王后在故宫太和殿前拍美照!美如电影海报,东方气质太绝

泰国华裔王后在故宫太和殿前拍美照!美如电影海报,东方气质太绝

近史博览
2025-11-18 14:41:25
朱拉尼结束访美后,叙外长访华,请求中国帮助,中方有个强硬要求

朱拉尼结束访美后,叙外长访华,请求中国帮助,中方有个强硬要求

阿离家居
2025-11-18 14:18:56
樊振东卫冕全运冠军又能如何?相比王楚钦,至少存在三点差距

樊振东卫冕全运冠军又能如何?相比王楚钦,至少存在三点差距

姜大叔侃球
2025-11-18 12:06:27
又一个克雷桑!27岁巴西中场有望加盟中超:未来可归化!

又一个克雷桑!27岁巴西中场有望加盟中超:未来可归化!

邱泽云
2025-11-18 14:56:19
中日交锋之际,美军导弹撤离日本!中部战区空军直言:准备打胜仗

中日交锋之际,美军导弹撤离日本!中部战区空军直言:准备打胜仗

小柨拍客在北漂
2025-11-18 11:28:13
涉嫌严重违纪违法,邱舰被查

涉嫌严重违纪违法,邱舰被查

极目新闻
2025-11-18 12:26:15
4000吨“沉睡氢弹”被击中,北约火速大撤退,乌:都怪俄干的好事

4000吨“沉睡氢弹”被击中,北约火速大撤退,乌:都怪俄干的好事

南宫一二
2025-11-18 14:41:53
宝马X4才跑一年多,四条轮胎均出现龟裂 4S店:经检测存在老化,非轮胎品质问题

宝马X4才跑一年多,四条轮胎均出现龟裂 4S店:经检测存在老化,非轮胎品质问题

大风新闻
2025-11-17 18:00:05
泰王拉玛十世:有华裔血统,中文名叫郑冕,看似风流实则是个高手

泰王拉玛十世:有华裔血统,中文名叫郑冕,看似风流实则是个高手

照见古今
2025-11-17 18:14:22
小孩到底几岁才有正常审美?网友:这些小朋友上辈子过得不好!

小孩到底几岁才有正常审美?网友:这些小朋友上辈子过得不好!

解读热点事件
2025-11-16 00:05:03
为何说年龄超过76岁的人:即便身体健康,也没有多少来日方长?

为何说年龄超过76岁的人:即便身体健康,也没有多少来日方长?

坠入二次元的海洋
2025-11-11 13:11:34
不顾央视警告顶风作案,与刘涛传出绯闻的杨烁,究竟是谁给的底气

不顾央视警告顶风作案,与刘涛传出绯闻的杨烁,究竟是谁给的底气

芳芳历史烩
2025-09-24 20:13:19
美军下任务,逼韩国对付解放军,话音刚落,李在明对中国表述变了

美军下任务,逼韩国对付解放军,话音刚落,李在明对中国表述变了

书中自有颜如玉
2025-11-18 14:44:24
解晓东,经抢救无效去世!

解晓东,经抢救无效去世!

华人星光
2025-11-16 13:19:17
朝鲜弹药库见底!俄军前线七成炮弹竟是“古董”,现代战争揭开资源黑洞

朝鲜弹药库见底!俄军前线七成炮弹竟是“古董”,现代战争揭开资源黑洞

Hi秒懂科普
2025-11-17 14:35:18
被逼迫辞职后,高市体面认输,再也不敢叫板中国,洪秀柱一语成谶

被逼迫辞职后,高市体面认输,再也不敢叫板中国,洪秀柱一语成谶

墨兰史书
2025-11-18 03:15:03
1994年,父亲贷款买下北京二环的9套四合院,25年后开发商来拆迁

1994年,父亲贷款买下北京二环的9套四合院,25年后开发商来拆迁

如烟若梦
2025-11-17 18:10:03
为啥混混不去大公司收保护费?网友:大公司背后势力他们惹不起

为啥混混不去大公司收保护费?网友:大公司背后势力他们惹不起

带你感受人间冷暖
2025-11-16 00:15:05
2025-11-18 16:08:49
财中社 incentive-icons
财中社
国内领先的以人工智能驱动的新型金融信息服务商
99236文章数 223关注度
往期回顾 全部

科技要闻

OPPO Reno15系列深评:实况封神+颜值暴击

头条要闻

女子投诉借剪刀被保安限时20分钟还疑遭威胁 酒店回应

头条要闻

女子投诉借剪刀被保安限时20分钟还疑遭威胁 酒店回应

体育要闻

结束最后一次对决,陈梦和朱雨玲笑着相拥

娱乐要闻

曝喻恩泰离婚2年前转移走300箱茅台?

财经要闻

青云租陷兑付危机 集资与放贷的双面生意

汽车要闻

更加豪华 更加全地形 极石ADAMAS

态度原创

本地
家居
游戏
房产
公开课

本地新闻

这档古早综艺,怎么就成了年轻人的哆啦A梦?

家居要闻

彰显奢华 意式经典风格

《命运石之门 RE:BOOT》延期至明年发售 更多细节将公开

房产要闻

29.4亿!海南“地王”片区,要卖超级宅地!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版