网易首页 > 网易号 > 正文 申请入驻

DeepSeek终于丢了开源第一王座,但继任者依然来自中国

0
分享至

几千人盲投,Kimi K2超越DeepSeek拿下全球开源第一

歪果网友们直接炸了,评论区秒变夸夸打卡现场:



今天,竞技场终于更新了Kimi K2的排名情况——

开源第一,总榜第五,而且紧追马斯克Grok 4这样的顶尖闭源模型



并且各类单项能力也不差,能和一水儿闭源模型打得有来有回:

  • 连续多轮对话并列第一,o3和Grok 4均为第四;
  • 编程能力第二,和GPT 4.5、Grok 4持平;
  • 应对复杂提示词能力第二,和o3、4o位于同一梯队;

甚至眼尖的朋友也发现了,唯二闯入总榜TOP 10的开源模型都来自中国。(DeepSeek R1总榜第8)



当然了,即使抛开榜单不谈,Kimi这款新模型过去一周也确实火热——

K2过去一周真热啊

公开可查战绩包括但不限于下面这些:

从实打实的数据来看,发布这一周里,Kimi K2在开源社区就获得了相当关注度和下载量。

GitHub标星5.6K,Hugging Face下载量近10万,这还不算它在中国社区的应用。





连AI搜索引擎明星创企Perplexity CEO也亲自为它站台,并透露:

  • Kimi K2在内部评估中表现出色,Perplexity计划接下来基于K2模型进行后训练。



甚至由于访问的用户太多了,逼得Kimi官方也出来发公告:

  • 访问量大+模型体积大,导致API过慢。



不过就在一片向好之时,人们关于“Kimi K2采用了DeepSeek V3架构”的质疑声再度升温。



对此,我们也找到了Kimi团队成员关于K2架构的相关回应。

总结下来就是,确实继承了DeepSeek V3的架构,不过后续还有一系列参数调整。

p.s. 以下分享均来自知乎@刘少伟,内容经概括总结如下~

一开始,他们尝试了各种架构方案,结果发现V3架构是最能打的(其他顶多旗鼓相当)

所以问题就变成了,要不要为了不同而不同?

经过深思熟虑,团队给出了否定答案。理由有两点:

一是V3架构珠玉在前且已经经过大规模验证,没必要强行“标新立异”;二是自己和DeepSeek一样,训练和推理资源非常有限,而经过评估V3架构符合相关成本预算。

所以他们选择了完全继承V3架构,并引入适合自己的模型结构参数。

具体而言,K2的结构参数改动有四点:

  • 增加专家数量:团队验证了在激活参数量不变的情况下,MoE总参数增加仍有益于loss下降。
  • 注意力头head数减半:减少head数节省的成本,刚好抵消MoE参数变大带来的开销,且效果影响很小。
  • 只保留第一层Dense:只保留第一层为dense,其余都用MoE,结果对推理几乎无影响。
  • 专家无分组:通过自由路由+动态重排(EPLB)可以应对负载不均衡,同时让专家组合更灵活,模型能力更强。



最终得到的推理方案就是,在相同专家数量下:

  • 虽然总参数增大到1.5倍,但除去通信部分,理论的prefill和decode耗时都更小。即使考虑与通信overlap等复杂因素,这个方案也不会比V3有显著的成本增加。

就是说,这是一种更“精打细算”的结构调优。

而且这种放弃自己的模型架构路线,彻底走DeepSeek路线的做法,也被国内网友评价为“相当大胆”

△来源:知乎网友@蛙哥

OK,以上关于Kimi和DeepSeek架构之争的问题落定后,我们再把目光拉回到这次最新排名。

开源追平or超越闭源ing

一个很明显的趋势是:「开源=性能弱」的刻板印象正在被打破,开源模型已经越来越厉害了。

不仅榜单上的整体排名在上升,而且分数差距也越来越小。

仔细看,模型TOP 10总分均为1400+,开源和闭源几乎可以看成位于同一起跑线。

而且这次拿下开源第一的Kimi K2,总分已经非常接近Grok 4、GPT 4.5等顶尖闭源模型了。



换句话说,以前我们可能还要在模型能力和成本之间作取舍,但随着开源力量的崛起,多思考一秒钟都是对开源的不尊重(doge)。

与此同时,越来越多的行业人士也表达了对开源崛起的判断。

艾伦人工智能研究所研究科学家Tim Dettmers表示:

  • 开源击败闭源将变得越来越普遍。



Perplexity CEO也多次在公开场合表示:

  • 开源模型将在塑造AI能力的全球扩散路径中扮演重要角色。它们对于因地制宜地定制和本地化AI体验至关重要。

而在已经逐渐崛起的开源模型领域,TOP 10中唯二开源、且都是国产模型的含金量还在上升。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
河南一邪教头目自封“玉皇大帝”:奸淫妇女10人,敛财超500万元

河南一邪教头目自封“玉皇大帝”:奸淫妇女10人,敛财超500万元

界面新闻
2025-09-15 08:37:27
闪购引发的全场景消费背后,今年双11的经营战场已变

闪购引发的全场景消费背后,今年双11的经营战场已变

晚点LatePost
2025-09-12 21:44:44
欧锦赛:德国男篮险胜土耳其9战全胜夺冠 施罗德MVP+邦加FMVP

欧锦赛:德国男篮险胜土耳其9战全胜夺冠 施罗德MVP+邦加FMVP

醉卧浮生
2025-09-15 07:34:32
上海暴雨范围扩大!两黄一蓝预警高挂!天气即将转折,降温就在这天→

上海暴雨范围扩大!两黄一蓝预警高挂!天气即将转折,降温就在这天→

新民晚报
2025-09-15 13:52:47
“预制菜之王萨莉亚为啥没人骂”冲上热搜!网友:它都不嫌我穷

“预制菜之王萨莉亚为啥没人骂”冲上热搜!网友:它都不嫌我穷

狐狸先森讲升学规划
2025-09-14 20:43:21
贾国龙诉苦称西贝利润仅 5%,业内人士痛批:偷换概念,骗你为他高收入买单

贾国龙诉苦称西贝利润仅 5%,业内人士痛批:偷换概念,骗你为他高收入买单

西虹市闲话
2025-09-14 22:14:01
享受文明果实却反噬文明根脉---美国大学何以成为白左大本营?

享受文明果实却反噬文明根脉---美国大学何以成为白左大本营?

通往远方的路
2025-09-15 07:50:03
赢麻了!1.5万撬动300万,苏超最小赞助商老板娘泪洒最后比赛现场

赢麻了!1.5万撬动300万,苏超最小赞助商老板娘泪洒最后比赛现场

明月杂谈
2025-09-15 05:21:37
最强冷空气来袭!江苏高温终结、气温暴跌!

最强冷空气来袭!江苏高温终结、气温暴跌!

鲁中晨报
2025-09-15 07:31:04
人狂自有天收

人狂自有天收

李老逵乱摆龙门阵
2025-09-11 09:01:28
媒体人:吴艳妮“亚洲第一”彻底沦为营销,她被日本选手全面压制

媒体人:吴艳妮“亚洲第一”彻底沦为营销,她被日本选手全面压制

直播吧
2025-09-14 17:03:06
雷军:小米 17 系列全面对标 iPhone,正面迎战

雷军:小米 17 系列全面对标 iPhone,正面迎战

IT之家
2025-09-15 11:17:05
罗永浩称华与华老板已道歉,但西贝贾老板道歉也来不及了

罗永浩称华与华老板已道歉,但西贝贾老板道歉也来不及了

潇湘晨报
2025-09-15 13:57:43
正厅顾兆文,任上被查

正厅顾兆文,任上被查

新京报政事儿
2025-09-15 12:36:38
上海人注意!冷空气正在赶来,即将断崖式降温!

上海人注意!冷空气正在赶来,即将断崖式降温!

鲁中晨报
2025-09-15 11:39:18
于东来再次发声力挺西贝:很多方面很优秀,希望大家理性理解,相信他们会改的

于东来再次发声力挺西贝:很多方面很优秀,希望大家理性理解,相信他们会改的

极目新闻
2025-09-15 13:34:20
西贝背后的隐藏BOSS

西贝背后的隐藏BOSS

城市局
2025-09-15 09:13:29
欧盟与俄罗斯都在加急,争抢购买中国同一关键物品,究竟是什么让他们如此着急?

欧盟与俄罗斯都在加急,争抢购买中国同一关键物品,究竟是什么让他们如此着急?

文雅笔墨
2025-09-14 19:31:37
局部大暴雨+10级风+8℃降温!山东今天下午起将有大范围强降雨和大风降温

局部大暴雨+10级风+8℃降温!山东今天下午起将有大范围强降雨和大风降温

闪电新闻
2025-09-15 11:46:29
妈妈亲手缝的NIKE书包火了!品牌留言要送礼物,当事人:已经联系礼物还未寄到

妈妈亲手缝的NIKE书包火了!品牌留言要送礼物,当事人:已经联系礼物还未寄到

现代快报
2025-09-14 15:13:20
2025-09-15 14:43:00
量子位 incentive-icons
量子位
追踪人工智能动态
11317文章数 176268关注度
往期回顾 全部

科技要闻

小米新旗舰跳过"16",雷军称正面迎战苹果

头条要闻

罗永浩回应西贝道歉信:顾客虐你什么了 谁虐谁呢

头条要闻

罗永浩回应西贝道歉信:顾客虐你什么了 谁虐谁呢

体育要闻

诺维茨基退役十年后,德国篮球走向巅峰

娱乐要闻

知名男演员官宣三胎

财经要闻

西贝发布致歉信:10月1日前完成整改

汽车要闻

空间、科技、驾控全在线 Q5L现款优惠不容错过

态度原创

家居
房产
数码
亲子
艺术

家居要闻

典雅大气 舒适中带童趣

房产要闻

当海口书包房卷向「未来」,这里的孩子和房价,都在高速超车!

数码要闻

重量超1吨、3.75MB容量:世界上第一块机械硬盘迎69岁生日

亲子要闻

爸爸问儿子:等我老了你会怎么做?5岁儿子的回答让人泪目

艺术要闻

故宫珍藏的墨迹《十七帖》,比拓本更精良,这才是地道的魏晋写法

无障碍浏览 进入关怀版