网易首页 > 网易号 > 正文 申请入驻

热点丨DeepSeek与Kimi“心有灵犀”,国产AI的突破与路线共识

0
分享至


·聚焦:人工智能、芯片等行业

欢迎各位客官关注、转发

前言

4月的AI圈,月之暗面发布Kimi K2.6开源模型,将Agent集群能力推至300个子Agent并行协同的新高度。

深度求索DeepSeek V4如约而至,把百万级上下文的推理成本压缩至前代的27%。

一周之内,两个总参数超万亿的开源模型先后落地,全球技术社区的讨论热度持续攀升。

过去15个月里,两家公司在关键技术节点上的同步,已经到了让人会心一笑的程度。

从同日发布推理模型、前后脚更新底层架构论文,到互相复用验证过的核心技术、不约而同攻坚Transformer底层基石。

这种被网友戏称[心有灵犀]的默契,早已不是简单的巧合。

作者| 方文三

图片来源 | 网络


被精准对齐的技术节奏

两家公司的技术演进路径,每一个关键节点的同步,都指向行业最核心的技术命题。

2025年1月,DeepSeek-R1推理模型与Kimi K1.5多模态思考模型同日上线,相隔仅两个小时。

二者均是国内最早复现OpenAI o1思维链技术的团队,直接把国产大模型的复杂推理能力拉到了全球第一梯队。

2025年7月,Kimi发布K2开源模型,被《自然》杂志称为[又一个DeepSeek时刻]。

这个万亿参数模型的技术报告里,明确采用了DeepSeek-V3首创的MLA多隐头注意力机制。

同时首次在万亿级规模上验证了二阶优化器Muon的可行性,替代了行业沿用十年的Adam优化器。

九个月后,DeepSeek V4正式官宣,绝大多数模块改用Muon优化器,完成了对这项技术的进一步优化与落地。


在Transformer底层架构的重构上,两家的动作同样高度同频。

2026年初,DeepSeek推出mHC流形约束超连接技术,改造深度学习网络的残差连接,将训练效率提升30%。

仅两个月后,Kimi发布的注意力残差技术论文,同样针对Transformer的核心结构实现突破。

甚至在长上下文这条核心赛道上,两家也选择了不同解法、同一目标。

Kimi深耕线性注意力机制,将长文本计算复杂度从O(n²)降至O(n),从理论层面实现极致优化。


DeepSeek则聚焦DSA稀疏注意力架构,把百万级上下文的KV Cache显存占用压缩至原有10%。

这种同步没有陷入同质化内卷,反而形成了清晰的能力互补。

DeepSeek始终聚焦模型底层的效率重构,把训练与推理成本打到极致,用全栈开源建立开发者信任。

Kimi则从长文本能力出发,逐步向长程编码、Agent集群、复杂工程任务落地延伸,解决模型如何真正融入工作流的核心问题。

一个筑牢底层技术底座,一个拓宽产业落地边界,路线看似不同,却共同撑起了国产开源模型的全球竞争力。


默契背后的国产AI路线共识

DeepSeek与Kimi的技术同频,是行业浪潮奔涌到临界点时,技术规律与时代大势共同书写的答案。

经过三年多的摸石过河,中国AI终于走出了一条区别于硅谷的、属于自己的发展道路。

开源生态的正向循环,是这份默契形成的核心基石。

开源从来不是简单的代码开放,而是一套[创新-验证-复用-再创新]的飞轮机制。

当DeepSeek将验证成熟的MLA注意力机制开源,Kimi便跳过了无数试错的深坑,直接在万亿级模型上完成规模化验证。

当Kimi分享Muon优化器的万亿级落地经验,DeepSeek又能在此基础上迭代优化,适配更多产业场景。


与OpenAI、Anthropic等海外巨头将技术锁在闭源黑箱中不同,中国的头部玩家选择把创新变成全行业的公共财富,让单点突破快速裂变成为集体跃迁。

如今,二者已是中国唯二总参数超万亿、权重完全公开的模型,连英伟达GTC大会都用它们来演示下一代芯片性能,这正是开源生态赢得的全球尊重。

行业核心命题的转变,让所有真正的探索者走向了同一条赛道。

当[堆参数]的内卷走到尽头,行业的终极考题变成了:如何在有限的算力约束下,实现模型能力的持续突破,让技术真正转化为生产力。

这个命题直接决定了技术路线的收敛,用更低的成本,造更强的模型,做更实的落地。

DeepSeek与Kimi的同频,本质上是两家都精准击中了行业的核心矛盾。

他们没有满足于在海外巨头划定的框架里做微创新,而是不约而同地扎进了大模型最硬核的根技术:优化器、注意力机制、残差连接。


选择重构底层框架这条路注定艰难,但正是这份对底层创新的执念,让国产AI第一次拥有了和海外巨头掰手腕的底气。

海外持续升级的算力管制,则是这份路线共识形成的最强外部推力。

无限堆砌高端算力的路径早已被堵死,中国AI必须在算法创新与工程优化上杀出一条血路,用更少的算力,实现更好的效果。

Kimi直言不具备无限算力的条件,因此始终死磕算法与系统效率。

DeepSeek则用极致的工程优化,将模型推理成本降到了行业顶尖水平,V4-Flash的API价格仅为海外同类产品的百分之一。


真正的技术普惠,从来不是喊出来的口号,而是用极致的工程创新,把AI的门槛踩到泥土里,让千行百业都能轻松踏上去,用得起、用得好。

站在行业的坐标系中回望,DeepSeek与Kimi虽选择了不同的突围路径,却正奔赴同一个终点,而中国AI的三大核心共识已清晰成型。

①全面拥抱开源,与美国[闭源为主+高定价]的模式形成鲜明对比。

②锚定自主可控的算力底座,模型的能力上限,终究取决于算力体系的可控底线。

③让应用需求重新定义技术方向,彻底脱离[为参数而参数]的内卷,回归[为价值而创新]的本质。

硅谷在[造墙],中国在[修路]。

墙的核心是控制与垄断,试图用技术壁垒守住先发优势。

路的核心是连接与开放,用生态的繁荣撬动更长远的未来。

从DeepSeek为华为昇腾重写200多个核心算子,到Kimi K2.6在昇腾、壁仞等国产芯片上快速跑通......

黄仁勋那句[如果DeepSeek先在华为平台发布,对美国将是可怕的结果],恰恰印证了这条路的力量。

这条路是被逼出来的,但历史无数次证明,被迫的创新往往能打开全新的天地。


全球AI格局发生微妙的变化

2026年一季度,OpenRouter官方数据显示,Kimi K2.6在调用量榜单上冲到全球第一,DeepSeek V3.2排名第四。

这个平台是全球最大的AI API聚合市场,调用量排名反映的是真实的市场选择。

更耐人寻味的是下游应用的变化,Cursor Composer 2发布时,对外宣称是[自研]。

但很快被技术社区扒出底座是Kimi K2.5,不是简单调用API,是直接拿K2.5微调出来的。

Cursor创始人后来接受采访时承认:[Kimi K2.5是我们测试过的最强基座模型]。

日本乐天Rakuten的AI助手也用上了DeepSeek V3作为底座,当一个开源模型的性能足以对标闭源顶级选手时,理性的选择就是用它。

斯坦福大学的一份报告显示,中美顶级AI大模型性能差距已从2024年的17.5%,缩小到2025年的0.3%。这个数字可能有些理想化,但趋势是明确的。

中国AI的新叙事,正在从Copy to China变成Copy from China。


结尾:

十四个月前,梁文锋说:中国AI最需要证明的是[能不能做出一款世界级的基础模型]。

十四个月后,杨植麟说:问题已经变成[在被封锁的算力生态里,能不能持续地做、一起做,让基础能力的跃迁变成常态]。

现在,DeepSeek和Kimi,两个广东年轻人,正在用万亿参数的开源模型,把这句话翻译成现实。

部分资料参考:字母榜:《这一次,梁文锋和杨植麟隔空握手》,机器之心:《翻完DeepSeek报告,我们发现了中国AI的默契》,APPSO:《扒完 DeepSeek V4 报告,我翻出了这个隐藏彩蛋》,凤凰网科技:《两个广东人的五次撞车,撞出最强开源双雄的底气?》,腾讯科技:《中国芯片,DeepSeek与Kimi的隐秘交点》

本公众号所刊发稿件及图片来源于网络,仅用于交流使用,如有侵权请联系回复,我们收到信息后会在24小时内处理。

请务必注明:

「姓名 + 公司 + 合作需求」

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
多年医改为什么总是触及不了根本

多年医改为什么总是触及不了根本

职场资深秘书
2026-05-05 17:04:47
赖清德吓破胆!丧事喜办,派四架F-16接机护航,解放军或有大动作

赖清德吓破胆!丧事喜办,派四架F-16接机护航,解放军或有大动作

阿凫爱吐槽
2026-05-05 15:30:58
看了54岁俞飞鸿的打扮,我悟了:穿基础款,简约配色,到老也高级

看了54岁俞飞鸿的打扮,我悟了:穿基础款,简约配色,到老也高级

蓓小西
2026-05-05 09:26:27
外交部发言人就美方升级对古巴制裁答记者问

外交部发言人就美方升级对古巴制裁答记者问

界面新闻
2026-05-05 17:06:23
宣扬“美国优先”的美防长,他的夫人竟然也穿“中国货”?美国人“吵翻天”了

宣扬“美国优先”的美防长,他的夫人竟然也穿“中国货”?美国人“吵翻天”了

新民周刊
2026-05-04 16:33:44
电影里自尽,为什么欧美人喜欢吞枪饮弹,而我们喜欢枪打太阳穴?

电影里自尽,为什么欧美人喜欢吞枪饮弹,而我们喜欢枪打太阳穴?

小兰聊历史
2026-04-30 10:07:24
上层乱插手+派系林立,李金羽下课不冤!但徐正源并不适合铁人

上层乱插手+派系林立,李金羽下课不冤!但徐正源并不适合铁人

中国足球的那些事儿
2026-05-05 07:00:11
活久见!卫生巾印彩花被吐槽,网友呼吁:禁止男性参与卫生巾设计

活久见!卫生巾印彩花被吐槽,网友呼吁:禁止男性参与卫生巾设计

火山詩话
2026-05-04 17:49:20
乌军扎波罗热进展神速

乌军扎波罗热进展神速

名人苟或
2026-05-05 15:56:16
中国女排 5 人登海报,李盈莹不在龚翔宇没眼看,还有 3 人受追捧

中国女排 5 人登海报,李盈莹不在龚翔宇没眼看,还有 3 人受追捧

体育快递小哥哥
2026-05-05 18:01:10
吃他汀不想肝损伤,记住4个时间、记住5不要,帮你避免肝脏受损

吃他汀不想肝损伤,记住4个时间、记住5不要,帮你避免肝脏受损

健康之光
2026-05-04 15:10:05
有没有人敢爆自己的瓜?网友:确定玩这么大吗?

有没有人敢爆自己的瓜?网友:确定玩这么大吗?

夜深爱杂谈
2026-02-18 20:55:58
张雪机车冠军奖金4万,德比斯年薪近500万,这钱到底怎么算的?

张雪机车冠军奖金4万,德比斯年薪近500万,这钱到底怎么算的?

乐悠悠娱乐
2026-05-04 13:00:24
徐正源周二将亮相!已与铁人签约,年薪近200万美元,超成都时期

徐正源周二将亮相!已与铁人签约,年薪近200万美元,超成都时期

奥拜尔
2026-05-05 12:26:01
莫氏鸡煲上线汤料包5分钟售罄4000多份,累计卖出4万多份,总销售额破160万元,记者实测:1分钟抢到两包

莫氏鸡煲上线汤料包5分钟售罄4000多份,累计卖出4万多份,总销售额破160万元,记者实测:1分钟抢到两包

极目新闻
2026-05-04 09:46:46
伦敦世乒赛:5月5日赛程出炉!日本晋级,中国男乒遇“生死战”

伦敦世乒赛:5月5日赛程出炉!日本晋级,中国男乒遇“生死战”

阿策聊实事
2026-05-05 12:43:52
舒梅切尔:希望英格兰别带梅努,肖踢完欧洲杯躺了半年

舒梅切尔:希望英格兰别带梅努,肖踢完欧洲杯躺了半年

懂球帝
2026-05-05 18:58:09
魔术3-1惨遭活塞逆转,老前辈麦迪贴脸开大:这阵容赶紧散伙吧!

魔术3-1惨遭活塞逆转,老前辈麦迪贴脸开大:这阵容赶紧散伙吧!

仰卧撑FTUer
2026-05-05 15:02:39
中美同时向全球发出禁令,各国都懵了!这下到底应该听谁的?

中美同时向全球发出禁令,各国都懵了!这下到底应该听谁的?

点燃好奇心
2026-05-05 14:56:25
特朗普官宣中国之行,直言将很精彩,推迟后终要启程

特朗普官宣中国之行,直言将很精彩,推迟后终要启程

许穋很机智
2026-05-05 17:49:44
2026-05-05 19:24:49
AI芯天下 incentive-icons
AI芯天下
从芯出发,用心服务
6702文章数 169关注度
往期回顾 全部

科技要闻

传苹果考虑让英特尔、三星代工设备处理器

头条要闻

伊朗发射导弹袭击美军舰船和商船及阿联酋 特朗普表态

头条要闻

伊朗发射导弹袭击美军舰船和商船及阿联酋 特朗普表态

体育要闻

全世界都等着看他笑话,他带国米拿下冠军

娱乐要闻

英皇25周年演唱会 张敬轩被救护车拉走

财经要闻

浏阳烟花往事

汽车要闻

同比大涨190% 方程豹4月销量29138台

态度原创

房产
本地
家居
游戏
军事航空

房产要闻

五一楼市彻底明牌!塔尖人群都在重仓凯旋新世界

本地新闻

用青花瓷的方式,打开西溪湿地

家居要闻

灵动实用 生活艺术场

日本玩家疯抢!Steam手柄开售即售罄 官网临时关闭

军事要闻

特朗普威胁伊朗不要向美国船开火

无障碍浏览 进入关怀版