网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

小成本DeepSeek和Kimi，正攻破奥特曼的「算力护城河」

2025-11-09 19:06:11　来源: 新智元

北京举报

0

分享至

　　

　　新智元报道

　　编辑：艾伦

　　【新智元导读】2025年前盛行的闭源+重资本范式正被DeepSeek-R1与月之暗面Kimi K2 Thinking改写，二者以数百万美元成本、开源权重，凭MoE与MuonClip等优化，在SWE-Bench与BrowseComp等基准追平或超越GPT-5，并以更低API价格与本地部署撬动市场预期，促使行业从砸钱堆料转向以架构创新与稳定训练为核心的高效路线。

　　2025年以前，AI界盛行着一种信念：只有闭源、巨额投入和疯狂堆算力才能打造最强大的模型。

　　OpenAI作为这一思路的旗手，不仅将模型训练秘而不宣，更与合作伙伴绘制了高达1.4万亿美元的基础设施蓝图。

　　八年内烧掉1.4万亿美元来构建数据中心，被视作确保领先的唯一途径。

　　在这种思维下，OpenAI旗舰模型的研发成本节节攀升：据报道，训练GPT-4就花费了约1亿美元。

　　闭源+重资本模式一度令人信服，OpenAI因此获得了天价估值和汹涌资本支持。

　　然而，这一「用钱砸出智能」的神话，正随着一系列意料之外的挑战而动摇。

　　信念的第一次动摇

　　DeepSeek-R1横空出世

　　今年年初，一家彼时名不见经传的中国初创公司深度求索掀起了巨浪。

　　它发布的DeepSeek-R1模型不仅开源，而且号称性能可与OpenAI顶级模型比肩。

　　

　　更令人瞠目的是，DeepSeek宣称训练这款模型只花了约560万美元，连旧金山一套像样的房子都买不起。

　　这个成本数字相比业内普遍认为的「烧钱」级别相差悬殊，仅为Meta开发Llama模型成本的约十分之一。

　　事实证明，这并非夸夸其谈。

　　DeepSeek-R1发布后一周内，DeepSeek App下载量迅猛攀升，一举超越ChatGPT，登顶美国苹果App Store免费榜。

　　一款开源AI应用在美国用户中的受欢迎程度超过了OpenAI的王牌产品，这一幕令业界震惊。

　　DeepSeek以微薄成本实现高性能，直接质疑了开发AI必须投入天量资金和算力的传统观念。

　　华尔街对此反应剧烈，微软和谷歌股价应声下挫，而AI芯片巨头英伟达的市值甚至蒸发了约17%，相当于约6000亿美元。

　　资本市场用脚投票，开始重新审视AI赛道的投入产出模型：烧钱打造封闭模型的路线，或许并非高枕无忧的康庄大道。

　　开源低成本路线的核弹

　　Kimi K2 Thinking震撼登场

　　DeepSeek年初点燃的星星之火尚未平息，中国另一家初创公司月之暗面在年末投下了一枚震撼弹。

　　本周，月之暗面发布了最新的开源巨模型Kimi K2 Thinking（以下简称K2 Thinking），以开源身份在多个关键基准上追平甚至超越了OpenAI的旗舰GPT-5。

　　

　　要知道，GPT-5可是闭源巨头最先进的成果之一，而K2 Thinking仅用几百万美元训练，却在高难度推理和编码测试上正面较量并拔得头筹。

　　K2 Thinking在综合编程挑战「SWE-Bench Verified」上取得了71.3%的通过率，略高于GPT-5的成绩，甚至在复杂网页搜索推理任务BrowseComp上，以60.2%对54.9%的得分大幅领先GPT-5。

　　

　　这些数字宣示了一个历史拐点：开源模型与顶级闭源模型之间性能鸿沟的实质性塌陷。

　　K2 Thinking的问世标志着开源免费模型在高端推理和编码能力上与封闭系统平起平坐，这一点在过去几乎难以想象。

　　而实现这一壮举，月之暗面投入的算力成本据传约为460万美元，比起OpenAI宏图中的万亿投入，几乎可忽略不计。

　　一边是几百万美元造就的开放奇迹，另一边是幻想烧钱万亿的巨无霸帝国，鲜明对比令人不禁怀疑：AI行业过去坚持的大投入逻辑，难道真的站不住脚了？

　　技术路径的胜利

　　巧用架构胜过砸钱堆料

　　K2 Thinking并非魔法横空出世，而是技术路线差异带来的成本逆袭。

　　传统的GPT-5这类闭源模型采用的是「通用大脑」式架构，每个参数对每个输入都会发动运算，因而模型越大推理开销越惊人。

　　K2 Thinking则采用混合专家架构，将庞大模型划分为384个专长各异的专家模块。

　　每次仅有8个专家（外加1个通用专家）被激活参与计算，相当于只动用320亿参数来解决特定问题。

　　换言之，K2-Thinking拥有一个「万智百宝箱」，每个token只调用其中不到3.5%的智力，却能享受近似万亿参数的知识储备。

　　这一架构设计让K2 Thinking在推理时既聪明又节省：「大而不笨重」。

　　架构优化带来的成本效率提升达百倍之多，令人叹为观止。

　　更关键的是，月之暗面研发了名为「MuonClip」的自定义优化器，在训练过程中自动稳压梯度，成功杜绝了超大模型常见的梯度爆炸和损失发散问题。

　　Kimi-K2在长达15.5万亿token的训练中实现了「零训练崩溃」，无需人为中途干预重启，这意味着即使资金设备相对有限的团队也能可靠地训练超大模型。

　　DeepSeek也在工程上强调「强化学习后训练」等高效策略，使得小团队得以攀登AI高峰。

　　这些技术路径上的创新，等于是用聪明才智破解了过去只有砸钱才能解决的难题。

　　曾经只有巨头烧钱才能铺就的康庄大道，如今民间高手另辟蹊径，用技术巧思抄了近路。

　　开源风暴的经济学冲击

　　当技术壁垒被攻克，开源路线在经济层面的优势便愈发凸显。

　　K2 Thinking的模型权重可在相应许可证条款下自由下载部署。

　　这与OpenAI等闭源模式形成鲜明对比，它们的模型被封藏于云端，只能通过昂贵API租用它们的大脑。

　　以K2 Thinking为例，其官方提供的API价格是每百万输入token收费4元（命中缓存时更低至1元）、输出token16元。

　　

　　相比之下，OpenAI的GPT-5 API价格约为每百万输入token收1.25美元（约9元），输出token高达10美元（约71元）。

　　

　　换算下来，同样百万token的处理，K2 Thinking的费用仅为GPT-5的十分之一不到。

　　对开发者和企业而言，这无疑极具诱惑力，更何况K2完全可以本地部署，不愿付API费的话，大可以自建服务。

　　正因如此，我们已看到市场正在迅速响应：越来越多AI工具和平台开始集成K2 Thinking模型，许多开发者在社区分享如何用K2 Thinking微调自定义应用。

　　DeepSeek-R1发布后，其MIT开源权重更是被无数开源社区下载、魔改，用于各种插件和研究项目。

　　

　　甚至政府机构和大型企业也开始重新考虑，与其斥资购买封闭模型的算力配额，不如采用开源模型作为基础，掌控自主可控的AI能力——尤其当这些开源模型已经足够好且成本低廉。

　　这种用脚投票的风向转变，不仅出现在技术圈，更在资本圈引发连锁反应：OpenAI此前天价的数据中心投资承诺，正面对质疑和压力。

　　OpenAI高管甚至在公共场合暗示需要政府贷款支持，事后又忙不迭出来「灭火」澄清不寻求政府背书，以平息外界对其烧钱计划的担忧。

　　当巨头为融资「续命」四处游说时，开源对手们正用实际成绩证明，也许根本不需要那么多钱，也能把事情办成。

　　行业叙事的改写与泡沫的冷却

　　DeepSeek和Kimi K2 Thinking带来的并非单纯的「追赶」，而更像是一场对旧路线的证伪。

　　过去，封闭巨头们的护城河建立在一种假设之上：只有不断投入数量级增长的资金和算力，才能保持模型性能的领先。

　　这一假设曾让OpenAI们在资本市场上如日中天，甚至形成了某种估值泡沫，AI公司和底层芯片厂商的价值被无限推高，因为所有人相信烧钱会带来奇迹。

　　然而当开源挑战者以区区百万量级美元达到同类水准，这个故事的结局便不再那么线性。

　　事实证明，「性能领先的最后20%」或许并非大多数用户真正需要的，尤其如果为此要付出十倍乃至百倍的价格。

　　从普通消费者到中小企业，更青睐的是「够用+便宜」的实惠。

　　OpenAI等公司无疑依然握有行业顶尖的研究人才和技术积累，但他们再难宣称自己的路线是「唯一正确且必不可少」的。

　　行业叙事正在转向：与其痴迷于砸钱堆出更大模型，不如在架构创新和工程稳定性上下功夫，以换取成本效率和开放生态。

　　投资者也日趋清醒，过去见谁谈AI就砸钱的狂热减退了许多，现在更关注实际效能和商业可行性。

　　最危险的对手，不是那个跟你拼烧钱的人，而是那个证明根本不需要烧那么多钱的人。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

月之暗面杨植麟：未来每个研究员将配海量Token，AI研发将进入AI 主导时代

每日经济新闻 2026-03-25 14:51:04
14 跟贴 14
一篇论文引发存储芯片股暴跌，Google 的「DeepSeek 时刻」来了？

爱范儿 2026-03-26 13:50:20
0 跟贴 0

AI写CUDA算子国产芯片不行？上交方法直线拉升，DeepSeek也适用

机器之心Pro 2026-03-26 15:59:24
0 跟贴 0

大学无用？奥特曼辍学当了CEO，但名校生撑起了整个OpenAI！

36氪 2026-01-18 10:45:08
37 跟贴 37
00后小孩哥10天AI编程，陈天桥24小时砸3000万！靠大四作业当上CEO

36氪 2026-03-08 17:24:08
0 跟贴 0

拒绝智能手机，炮轰ChatGPT，没有他就没有今天的互联网

DeepTech深科技 2025-12-26 18:07:26
0 跟贴 0

英伟达23人梦之队，让AI用7天干翻了自己的GPU专家

钛媒体APP 2026-03-26 17:44:44
0 跟贴 0
谷歌杀入AI音乐牌桌！实测一键生成3分钟歌曲，可精细控制段落

智东西 2026-03-26 18:50:06
0 跟贴 0

全球顶尖大模型一夜惨遭血洗！最难测试人类拿满分，AI第一名得0.2%分

新智元 2026-03-26 18:14:12
0 跟贴 0
千问上车：统一智能中枢隐现

智东西 2026-03-26 18:05:22
0 跟贴 0
五八智能四足机器人平台Q20A，适用于千行百业

量子位 2025-09-30 15:35:41
0 跟贴 0
对话「哈萨比斯传」作者：“他不喜欢奥特曼”

量子位 2026-03-11 17:20:42
4 跟贴 4
月之暗面据称考虑赴香港进行IPO

财联社 2026-03-26 17:46:09
0 跟贴 0
大晚上看到奥特曼，看他展示技术，这个好像是真的偶像！

大红爱搞笑 2026-03-25 13:05:45
3 跟贴 3
奥特曼配色回归，C罗09年经典战靴即将复刻发售

懂球帝 2026-03-26 11:24:21
3 跟贴 3
男子体验景区飞刀节目，奥特曼坐那儿也得捏把汗

搞笑本事大 2026-03-24 18:47:08
1 跟贴 1
电商平台心脏用药品类搜索量暴涨30倍

达哥说事儿 2026-03-25 16:49:02
0 跟贴 0
为什么这张大嘴奥特曼的照片，会让无数的网友大呼诡异呢？

舊事別提 2026-03-25 08:08:41
2 跟贴 2
当视频难以被表征1

机器之心Pro 2026-03-03 17:21:59
0 跟贴 0
伊朗快艇围猎美军，蚊子舰队杀入海峡，美军应对策略为何失效？

阅尽天下精彩 2026-03-25 01:14:50
0 跟贴 0
小米回应新SU7争议/谷歌说安卓已超越iOS/Sora停服迪士尼深感震惊

雷科技 2026-03-26 09:21:57
1 跟贴 1
日本被指多年搞反华教育

北京日报 2026-03-25 09:16:49
78834 跟贴 78834
OpenAI关停Sora！25个月从封神到退场

量子位 2026-03-25 20:15:20
0 跟贴 0
从工业体系看常规战争中东大为何难被战胜的底层逻辑

Boba奔波儿灞 2026-03-26 01:16:42
0 跟贴 0
CVPR 2026 | BiMotion：用 B 样条曲线重新定义 3D 角色运动生成

机器之心Pro 2026-03-26 11:42:56
0 跟贴 0
中国向沙特交付全球最大石油平台，美国网友：我们有最好的

笑饮孤鸿非 2026-03-25 01:56:46
0 跟贴 0
Unity说一键移植，Jagex团队用20年MMO打脸

薛定谔的BUG 2026-03-26 12:43:49
1 跟贴 1
于东来从30岁开始吃药，拍CT上百次，身体出什么问题都不足为奇，哪天说不定没了就没了

新闻晨报 2026-03-25 21:24:37
4286 跟贴 4286
“根本不敢上路”！深圳男子买全新百万豪车，修了15次还是坏的！很多车主受害

南方都市报 2026-03-26 09:26:45
28 跟贴 28
一天蒸发6200亿！谷歌算法黑科技击溃存储股，华尔街痛批市场“不懂技术”

每日经济新闻 2026-03-26 19:00:13
0 跟贴 0
张少康辞去广东省人民政府副省长职务

新快报新闻 2026-03-26 11:50:03
14 跟贴 14
OpenAI宣布关停Sora！独立应用推出6个月后下架

财经网科技 2026-03-26 02:26:19
0 跟贴 0
千万粉丝大V，微博账号被禁止关注

第一财经资讯 2026-03-26 12:19:47
1 跟贴 1
理想缺一场找回自己的胜仗

财经无忌 2026-03-26 15:19:15
0 跟贴 0
OpenClaw最猛升级！底层架构大换血全网等了9天

新智元 2026-03-25 04:02:12
0 跟贴 0
中远海运恢复海湾国家订舱船舶暂不过霍尔木兹海峡

财联社 2026-03-25 20:20:04
11992 跟贴 11992
俄罗斯意外成为中东战场外最大赢家拿下越南大单

澎湃新闻 2026-03-25 19:52:29
1305 跟贴 1305
逐帧拆解，维尼修斯的内切逻辑！

动感丸子 2026-03-24 13:12:48
3 跟贴 3
攻破闭源多模态大模型：一种基于特征最优对齐的新型对抗攻击方法

机器之心Pro 2025-10-17 13:52:35
0 跟贴 0
美议员称反对美国政府向伊朗派遣地面部队

财联社 2026-03-26 17:54:17
0 跟贴 0

逃亡沙特不久，马步芳强取亲侄女为妻，蒋介石：他让我颜面尽失

逃亡沙特不久，马步芳强取亲侄女为妻，蒋介石：他让我颜面尽失

史笔似尘钩

2026-03-17 20:35:07

汪小菲马筱梅基因太绝！家中“小炸毛”萌翻全网这颜值太招人疼！

汪小菲马筱梅基因太绝！家中“小炸毛”萌翻全网这颜值太招人疼！

孤酒老巷QA

2026-03-24 05:34:17

410次开房记录流出：央企“女老虎”陶荔芳，背后还有多少同伙

410次开房记录流出：央企“女老虎”陶荔芳，背后还有多少同伙

深度报

2025-12-14 22:36:54

张雪峰早就防着这一天了：为女儿注册40枚商标，防亲戚父爱太沉重

张雪峰早就防着这一天了：为女儿注册40枚商标，防亲戚父爱太沉重

墨染时光

2026-03-26 07:50:31

美国懵了，能摧毁伊朗电力的石墨炸弹，竟让中国两座城市联手废了

美国懵了，能摧毁伊朗电力的石墨炸弹，竟让中国两座城市联手废了

瑛派儿老黄

2026-03-25 23:46:07

史前大洪水掩盖什么真相？所有文明都曾记录，是人类共同的记忆？

史前大洪水掩盖什么真相？所有文明都曾记录，是人类共同的记忆？

历史甄有趣

2026-03-20 15:40:07

基辛格坦言：如果爆发核战争，中国可能只有5个地方可以躲避危险

基辛格坦言：如果爆发核战争，中国可能只有5个地方可以躲避危险

鹤羽说个事

2026-03-25 22:21:29

向鹏林诗栋退出世界杯

乒乓11分

2026-03-26 09:48:25

如果美国解体，犹太财阀的巨资何处安放下一个宿主，答案超乎想象

如果美国解体，犹太财阀的巨资何处安放下一个宿主，答案超乎想象

芳芳历史烩

2026-03-25 22:24:25

现实中的大龄剩女最后妥协了吗？网友爆笑评论，真是一言难尽。

现实中的大龄剩女最后妥协了吗？网友爆笑评论，真是一言难尽。

侃神评故事

2026-03-25 11:30:09

油价反转！95号汽油破9元后迎下调，4月7日调价最新预测

油价反转！95号汽油破9元后迎下调，4月7日调价最新预测

复转这些年

2026-03-26 09:40:14

小米公布实情，大家都被雷军骗了

小米公布实情，大家都被雷军骗了

鸣金网

2026-03-26 09:08:36

特朗普希望破灭了，但是福特号航母上4500名美军士兵却彻底安全了

特朗普希望破灭了，但是福特号航母上4500名美军士兵却彻底安全了

安安说

2026-03-26 11:41:14

英媒：以色列是特朗普的战争伙伴而非和平伙伴

英媒：以色列是特朗普的战争伙伴而非和平伙伴

参考消息

2026-03-25 18:54:05

蔡正元即将入狱，国台办做出回应，内容不寻常，已看透他的真面目

蔡正元即将入狱，国台办做出回应，内容不寻常，已看透他的真面目

牛锅巴小钒

2026-03-26 17:09:02

演员因商演获赠股权卷入债务纠纷，账户上30万元被法院冻结

演员因商演获赠股权卷入债务纠纷，账户上30万元被法院冻结

半岛晨报

2026-03-26 17:15:03

库里可以接着休息了！东部只剩理论！

库里可以接着休息了！东部只剩理论！

篮球大图

2026-03-26 11:25:14

A股:今天收3889.08，尾盘已明确，做好准备，明天周五，要变盘了

A股:今天收3889.08，尾盘已明确，做好准备，明天周五，要变盘了

虎哥闲聊

2026-03-26 15:09:13

心眼坏的人，最爱问这3件事，别傻乎乎全说！

心眼坏的人，最爱问这3件事，别傻乎乎全说！

唯晨说

2026-03-25 13:12:14

国产螺丝刀在海外蹿红，在TikTok狂卖2800万

国产螺丝刀在海外蹿红，在TikTok狂卖2800万

跨境派Pro

2026-03-23 14:16:59

AI产业主平台领航智能+时代

14821文章数 66721关注度

往期回顾全部

科技要闻

Meta高管狂分百亿期权，700名员工却下岗

头条要闻

原正部级刘慧被开除党籍：结交政治骗子匿名诬告他人

头条要闻

原正部级刘慧被开除党籍：结交政治骗子匿名诬告他人

体育要闻

申京努力了，然而杜兰特啊

娱乐要闻

张雪峰家人首发声不设追思会丧事从简

财经要闻

油价"驯服"特朗普？一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

本地

艺术

亲子

公开课

军事航空

本地新闻

救命，这只酱板鸭已经在我手机复仇了一万遍

艺术要闻

哪一座桥不是风景？

亲子要闻

上海美华妇儿医院"康复中心"完成全面升级并正式焕新启幕

公开课

李玫瑾：为什么性格比能力更重要？

军事要闻

担心特朗普突然停战以总理下令48小时尽力摧毁伊设施

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版