网易首页 > 网易号 > 正文 申请入驻

DeepSeek-R1之后,Kimi K2 Thinking又给OpenAI们亿点点震撼

0
分享至

【TechWeb】11月10日消息,“这是又一次DeepSeek式的辉煌时刻吗?开源软件再次超越闭源软件。”国际知名开源平台Hugging Face联合创始人Thomas Wolf在社交媒体上这样评价Kimi K2 Thinking的发布。

11月6日,中国AI初创公司月之暗面(Moonshot AI)推出并开源了其最新生成式人工智能模型——Kimi K2 Thinking。这款模型在多项核心基准测试中超越了OpenAI的GPT-5和Anthropic的Claude Sonnet 4.5。


而更令人震惊的是,媒体援引据一位知情人士透露,Kimi K2 Thinking模型的训练成本为460万美元,这一数字不到GPT-3训练成本的百分之一。

开源大模型正在全球AI领域掀起一场效率革命与成本风暴,而这场风暴的中心,正逐渐转向东方。

训练成本仅460万美元?小成本模型实现大性能突破

Kimi K2 Thinking的出现,彻底刷新了业界对AI模型成本与性能的认知。这个拥有1万亿参数的混合专家模型,每次推理仅激活320亿参数。

在技术设计上,它完美平衡了模型规模与计算效率,支持256k的上下文窗口,并采用原生INT4量化技术。



在权威基准测试中,Kimi K2 Thinking展现出了令人瞩目的实力:在Humanity‘s Last Exam中取得44.9%的优异成绩,在BrowseComp测试中获得60.2%,在SWE-Bench Verified和LiveCodeBench v6两个编码评估中分别达到71.3%和83.1%。


Kimi K2 Thinking模型的核心优势之一是它的Agent能力,能够连续执行200-300次工具调用,无需人工干预即可解决复杂问题。


在编程实践中,开发者只需一句指令,就能生成一个类似Mac OS的网页操作系统,具备文本编辑器、文件管理器、画图工具等完整功能。

如果说性能表现令人赞叹,那么Kimi K2 Thinking的成本控制则堪称革命。460万美元的训练成本,放在动辄数亿美元投入的大模型赛道,几乎是一个可以忽略不计的数字。

这一数字甚至低于DeepSeek V3模型的560万美元,更是与GPT-3等国际同类大模型高达数十亿美元的训练投入形成鲜明对比。

低成本的训练并未牺牲性能,Kimi K2 Thinking在保持顶尖性能的同时,运行成本也大幅降低。

Kimi K2 Thinking团队介绍,这种成本优势源于多方面的技术创新。一方面,模型采用了改进的MuonClip优化器,在长达15.5万亿tokens的预训练过程中实现了 “零损失尖峰” ,意味着训练过程极其稳定。

另一方面,原生INT4量化技术不仅将推理速度提升了约2倍,还显著降低了部署所需的GPU显存,使模型对硬件更加友好。

Kimi K2 Thinking的API调用价格为每百万token输入1元(缓存命中)/4元(缓存未命中),输出为每百万token 16元,相比GPT-5低一个数量级。


月之暗面2025年7月11日发布初代Kimi K2模型;9月5日升级为Kimi K2-0905版本,强化Agentic Coding能力;11月6日发布Kimi-k2 thinking

以至于,有国外AI发烧友在X上直接@了 OpenAl 的 CEO 奧特曼抛出了一个极其尖锐的问题:“你(Sam)凭什么需要数万亿美元才能做出顶尖模型而现在来自中国的模型,只花了区区460万美元就已经做得和你一样好,甚至更好?这到底是为什么?”

有网友评论:这个问题,简直是把所有的硅谷 AI巨头们架在火上烤。它用一种无可辩驳的方式证明了:更聪明的算法、更专注的团队以及站在巨人(开源社区)的肩膀上,完全可以以小博大。

同时,Kimi也升级了C端的会员计划。


规则改写:开源协议的反向输出

Kimi K2 Thinking的发布,迅速引发了全球AI社区的强烈反响。Hugging Face联合创始人Thomas Wolf的评价绝非个例,来自各方的反馈都肯定了这款模型的重要意义。

业内普遍认为,Kimi K2 Thinking极大地缩小了开源模型与闭源模型之间的差距,甚至在多个关键领域实现了反超。

开源的、可自由使用和修改的模型,首次在推理、编程和Agent能力等多个维度与顶尖闭源模型站在同一水平线上。

开发者社区对模型的实际表现给予了积极评价。有开发者测试后表示,Kimi K2 Thinking在创意写作方面表现出色,能够“将粗略的灵感转化为清晰、动人且意图明确的叙述”。

同时,其在处理复杂编程任务时展现出的逻辑性和完整性也令人印象深刻。

Kimi K2 Thinking引发广泛讨论的,不仅是其技术实力,还有其独特的开源规则。

模型采用Modified MIT许可证,在保留标准MIT许可证绝大多数自由的基础上,添加了一项关键限制:“如果此模型被用于超过一亿月活用户,或者2000万美元月收入的商业产品中,需要注明商品底层使用了 Kimi K2模型”。

有美国的科技博主表示,Kimi K2为防止美国一些公司继续白剽这些开源模型并套牌说是自己的,出现了比较“奇怪”的modifiedMIT License,并感叹:“世界颠倒了,这可不好”。

这一条款为开源软件协议带来了新思路。对于绝大多数研究机构和企业应用,这只是一项轻量级的 attribution要求,不影响商业使用和衍生开发。

但当项目规模达到巨头级别时,仍需保留对原始开发者的尊重和认可。

这种规则设计,可视为中国AI企业首次在开源协议中引入如此影响力的条款,开创了开源规则“反向输出”的先例。

长期以来,中国科技企业更多是国际开源规则的接受者,而Kimi K2 Thinking的开源协议标志着这一格局正在改变。

以小博大,重塑AI竞争格局

DeepSeek-R1和Kimi K2 Thinking这类小成本模型的崛起,正在从根本上改变全球大模型行业的竞争规则和未来走向。

这些模型证明了,通过架构创新和工程优化,完全可以在控制成本的同时实现顶尖性能。

传统的“规模至上”的发展模式遭到挑战。过去,OpenAI及美国AI公司的核心护城河之一是强大的融资能力和大规模算力基础。

而今,一个依赖数十亿美元投入、指望高价API收回成本的商业模式,突然要面对一个性能接近、但API成本低10倍的竞争者。

猎豹移动CEO傅盛的评价就指出Kimi K2 Thinking的真正价值:“Kimi真正‘可怕’的地方不是性能的绝对超越,而是来自其极不对称的性价比。”

他强调,当一个开源模型以极低的训练成本达到了最先进模型90%的纸面能力和75%的实际能力时,整个战局有彻底改变的可能。

行业已告别“比参数、比算力”的粗放阶段,进入“比落地、比价值”的精耕时代。企业应用不再盲目追求模型的“大而全”,而是更关注“刚刚好”的智能——在成本、速度和隐私间找到平衡点。

更为深远的是,小成本模型可能成为中国在全球AI竞赛中的差异化路径。

没有人会再质疑——开源模型的“星星之火,可以燎原”。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
太嚣张!山西反杀案当晚申家儿子不在场,郭某夫妇竟对警方撂狠话

太嚣张!山西反杀案当晚申家儿子不在场,郭某夫妇竟对警方撂狠话

爱写的樱桃
2025-11-16 21:36:38
印度“光辉”战机在迪拜航展上漏油?印度军事网站忙发文澄清

印度“光辉”战机在迪拜航展上漏油?印度军事网站忙发文澄清

新浪财经
2025-11-19 06:18:55
比特币跌破9万美元关口

比特币跌破9万美元关口

界面新闻
2025-11-18 12:10:03
全运会女子团体半决赛:孙颖莎轻松横扫,河北队3-0完胜黑龙江

全运会女子团体半决赛:孙颖莎轻松横扫,河北队3-0完胜黑龙江

全景体育V
2025-11-18 19:26:15
『高分佳作』凉森玲梦丨湿身OL

『高分佳作』凉森玲梦丨湿身OL

吃瓜党二号头目
2025-11-19 08:13:58
19岁男孩喝百草枯苦熬18天,逼外出打工母亲回家,母亲:你放心去

19岁男孩喝百草枯苦熬18天,逼外出打工母亲回家,母亲:你放心去

林子说事
2025-11-12 10:40:27
轰6成群出动,信号非同一般,解放军这次,要同时收拾三个国家

轰6成群出动,信号非同一般,解放军这次,要同时收拾三个国家

乐天闲聊
2025-11-18 13:55:48
1994年,父亲贷款买下北京二环的9套四合院,25年后开发商来拆迁

1994年,父亲贷款买下北京二环的9套四合院,25年后开发商来拆迁

如烟若梦
2025-11-17 18:10:03
71岁成龙去世?最新消息!

71岁成龙去世?最新消息!

乡野小珥
2025-11-18 13:40:40
赵雅芝一脸疲惫终于回香港了!脸上的粉抹得好厚,走路得人搀扶!

赵雅芝一脸疲惫终于回香港了!脸上的粉抹得好厚,走路得人搀扶!

柠檬有娱乐
2025-11-18 10:23:13
唐嫣罗晋冲上热搜!两人商业已无直接关联,结婚7年育有一女,唐嫣曾称“理解分居两地”

唐嫣罗晋冲上热搜!两人商业已无直接关联,结婚7年育有一女,唐嫣曾称“理解分居两地”

鲁中晨报
2025-11-18 21:22:07
扒裤!强吻!西安一女子逛街被男子扑倒欲强奸,获刑8个月引争议

扒裤!强吻!西安一女子逛街被男子扑倒欲强奸,获刑8个月引争议

火山诗话
2025-11-16 11:26:15
套现356亿全身而退,潘石屹夫妇狠狠给美国房地产上了一课

套现356亿全身而退,潘石屹夫妇狠狠给美国房地产上了一课

林子说事
2025-11-16 05:26:48
曾医生日常容颜,没有美颜的样子才是真实的

曾医生日常容颜,没有美颜的样子才是真实的

诗意世界
2025-11-12 20:52:54
反转!女网红柬埔寨失踪,家属求救却隐瞒真相,网友曝猛料揭幕

反转!女网红柬埔寨失踪,家属求救却隐瞒真相,网友曝猛料揭幕

天天热点见闻
2025-11-18 08:18:32
余承东公布华为Mate X7真机

余承东公布华为Mate X7真机

每日经济新闻
2025-11-18 10:00:06
44岁董洁和男友大连聚餐时被人偶遇 可是纯素颜,那模样简直美翻了

44岁董洁和男友大连聚餐时被人偶遇 可是纯素颜,那模样简直美翻了

阿废冷眼观察所
2025-11-18 06:05:17
中日破裂,这是53年来对日最强硬的外交表态!

中日破裂,这是53年来对日最强硬的外交表态!

见闻致
2025-11-15 21:21:56
三位勇士以一身伤痕,为14亿人辟出法治生路

三位勇士以一身伤痕,为14亿人辟出法治生路

深度报
2025-11-07 22:56:16
1-1,巴西险翻船,28岁AC米兰旧将失点,18岁切尔西新星救主

1-1,巴西险翻船,28岁AC米兰旧将失点,18岁切尔西新星救主

侧身凌空斩
2025-11-19 05:25:08
2025-11-19 09:31:00
TechWeb incentive-icons
TechWeb
做有态度的互联网资讯。
14089文章数 43036关注度
往期回顾 全部

科技要闻

一夜封神,Gemini 3让谷歌找回“碾压感”

头条要闻

美女主播设"同城约会"骗局:刷礼物换"香艳"视频

头条要闻

美女主播设"同城约会"骗局:刷礼物换"香艳"视频

体育要闻

结束最后一次对决,陈梦和朱雨玲笑着相拥

娱乐要闻

宋佳夺影后动了谁的奶酪

财经要闻

大规模宕机!美国多个网站崩了

汽车要闻

硬核配置旗舰气场 岚图泰山售37.99万起

态度原创

亲子
健康
房产
公开课
军事航空

亲子要闻

冬季克服寒冷锻炼孩子意志力

警惕超声报告这六大"坑"

房产要闻

29.4亿!海南“地王”片区,要卖超级宅地!

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

中方代表:日本毫无资格要求成为安理会常任理事国

无障碍浏览 进入关怀版