网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

小成本DeepSeek和Kimi，正攻破奥特曼的「算力护城河」

2025-11-09 19:06:11　来源: 新智元

北京举报

0

分享至

新智元报道

编辑：艾伦

【新智元导读】2025年前盛行的闭源+重资本范式正被DeepSeek-R1与月之暗面Kimi K2 Thinking改写，二者以数百万美元成本、开源权重，凭MoE与MuonClip等优化，在SWE-Bench与BrowseComp等基准追平或超越GPT-5，并以更低API价格与本地部署撬动市场预期，促使行业从砸钱堆料转向以架构创新与稳定训练为核心的高效路线。

2025年以前，AI界盛行着一种信念：只有闭源、巨额投入和疯狂堆算力才能打造最强大的模型。

OpenAI作为这一思路的旗手，不仅将模型训练秘而不宣，更与合作伙伴绘制了高达1.4万亿美元的基础设施蓝图。

八年内烧掉1.4万亿美元来构建数据中心，被视作确保领先的唯一途径。

在这种思维下，OpenAI旗舰模型的研发成本节节攀升：据报道，训练GPT-4就花费了约1亿美元。

闭源+重资本模式一度令人信服，OpenAI因此获得了天价估值和汹涌资本支持。

然而，这一「用钱砸出智能」的神话，正随着一系列意料之外的挑战而动摇。

信念的第一次动摇

DeepSeek-R1横空出世

今年年初，一家彼时名不见经传的中国初创公司深度求索掀起了巨浪。

它发布的DeepSeek-R1模型不仅开源，而且号称性能可与OpenAI顶级模型比肩。

更令人瞠目的是，DeepSeek宣称训练这款模型只花了约560万美元，连旧金山一套像样的房子都买不起。

这个成本数字相比业内普遍认为的「烧钱」级别相差悬殊，仅为Meta开发Llama模型成本的约十分之一。

事实证明，这并非夸夸其谈。

DeepSeek-R1发布后一周内，DeepSeek App下载量迅猛攀升，一举超越ChatGPT，登顶美国苹果App Store免费榜。

一款开源AI应用在美国用户中的受欢迎程度超过了OpenAI的王牌产品，这一幕令业界震惊。

DeepSeek以微薄成本实现高性能，直接质疑了开发AI必须投入天量资金和算力的传统观念。

华尔街对此反应剧烈，微软和谷歌股价应声下挫，而AI芯片巨头英伟达的市值甚至蒸发了约17%，相当于约6000亿美元。

资本市场用脚投票，开始重新审视AI赛道的投入产出模型：烧钱打造封闭模型的路线，或许并非高枕无忧的康庄大道。

开源低成本路线的核弹

Kimi K2 Thinking震撼登场

DeepSeek年初点燃的星星之火尚未平息，中国另一家初创公司月之暗面在年末投下了一枚震撼弹。

本周，月之暗面发布了最新的开源巨模型Kimi K2 Thinking（以下简称K2 Thinking），以开源身份在多个关键基准上追平甚至超越了OpenAI的旗舰GPT-5。

要知道，GPT-5可是闭源巨头最先进的成果之一，而K2 Thinking仅用几百万美元训练，却在高难度推理和编码测试上正面较量并拔得头筹。

K2 Thinking在综合编程挑战「SWE-Bench Verified」上取得了71.3%的通过率，略高于GPT-5的成绩，甚至在复杂网页搜索推理任务BrowseComp上，以60.2%对54.9%的得分大幅领先GPT-5。

这些数字宣示了一个历史拐点：开源模型与顶级闭源模型之间性能鸿沟的实质性塌陷。

K2 Thinking的问世标志着开源免费模型在高端推理和编码能力上与封闭系统平起平坐，这一点在过去几乎难以想象。

而实现这一壮举，月之暗面投入的算力成本据传约为460万美元，比起OpenAI宏图中的万亿投入，几乎可忽略不计。

一边是几百万美元造就的开放奇迹，另一边是幻想烧钱万亿的巨无霸帝国，鲜明对比令人不禁怀疑：AI行业过去坚持的大投入逻辑，难道真的站不住脚了？

技术路径的胜利

巧用架构胜过砸钱堆料

K2 Thinking并非魔法横空出世，而是技术路线差异带来的成本逆袭。

传统的GPT-5这类闭源模型采用的是「通用大脑」式架构，每个参数对每个输入都会发动运算，因而模型越大推理开销越惊人。

K2 Thinking则采用混合专家架构，将庞大模型划分为384个专长各异的专家模块。

每次仅有8个专家（外加1个通用专家）被激活参与计算，相当于只动用320亿参数来解决特定问题。

换言之，K2-Thinking拥有一个「万智百宝箱」，每个token只调用其中不到3.5%的智力，却能享受近似万亿参数的知识储备。

这一架构设计让K2 Thinking在推理时既聪明又节省：「大而不笨重」。

架构优化带来的成本效率提升达百倍之多，令人叹为观止。

更关键的是，月之暗面研发了名为「MuonClip」的自定义优化器，在训练过程中自动稳压梯度，成功杜绝了超大模型常见的梯度爆炸和损失发散问题。

Kimi-K2在长达15.5万亿token的训练中实现了「零训练崩溃」，无需人为中途干预重启，这意味着即使资金设备相对有限的团队也能可靠地训练超大模型。

DeepSeek也在工程上强调「强化学习后训练」等高效策略，使得小团队得以攀登AI高峰。

这些技术路径上的创新，等于是用聪明才智破解了过去只有砸钱才能解决的难题。

曾经只有巨头烧钱才能铺就的康庄大道，如今民间高手另辟蹊径，用技术巧思抄了近路。

开源风暴的经济学冲击

当技术壁垒被攻克，开源路线在经济层面的优势便愈发凸显。

K2 Thinking的模型权重可在相应许可证条款下自由下载部署。

这与OpenAI等闭源模式形成鲜明对比，它们的模型被封藏于云端，只能通过昂贵API租用它们的大脑。

以K2 Thinking为例，其官方提供的API价格是每百万输入token收费4元（命中缓存时更低至1元）、输出token16元。

相比之下，OpenAI的GPT-5 API价格约为每百万输入token收1.25美元（约9元），输出token高达10美元（约71元）。

换算下来，同样百万token的处理，K2 Thinking的费用仅为GPT-5的十分之一不到。

对开发者和企业而言，这无疑极具诱惑力，更何况K2完全可以本地部署，不愿付API费的话，大可以自建服务。

正因如此，我们已看到市场正在迅速响应：越来越多AI工具和平台开始集成K2 Thinking模型，许多开发者在社区分享如何用K2 Thinking微调自定义应用。

DeepSeek-R1发布后，其MIT开源权重更是被无数开源社区下载、魔改，用于各种插件和研究项目。

甚至政府机构和大型企业也开始重新考虑，与其斥资购买封闭模型的算力配额，不如采用开源模型作为基础，掌控自主可控的AI能力——尤其当这些开源模型已经足够好且成本低廉。

这种用脚投票的风向转变，不仅出现在技术圈，更在资本圈引发连锁反应：OpenAI此前天价的数据中心投资承诺，正面对质疑和压力。

OpenAI高管甚至在公共场合暗示需要政府贷款支持，事后又忙不迭出来「灭火」澄清不寻求政府背书，以平息外界对其烧钱计划的担忧。

当巨头为融资「续命」四处游说时，开源对手们正用实际成绩证明，也许根本不需要那么多钱，也能把事情办成。

行业叙事的改写与泡沫的冷却

DeepSeek和Kimi K2 Thinking带来的并非单纯的「追赶」，而更像是一场对旧路线的证伪。

过去，封闭巨头们的护城河建立在一种假设之上：只有不断投入数量级增长的资金和算力，才能保持模型性能的领先。

这一假设曾让OpenAI们在资本市场上如日中天，甚至形成了某种估值泡沫，AI公司和底层芯片厂商的价值被无限推高，因为所有人相信烧钱会带来奇迹。

然而当开源挑战者以区区百万量级美元达到同类水准，这个故事的结局便不再那么线性。

事实证明，「性能领先的最后20%」或许并非大多数用户真正需要的，尤其如果为此要付出十倍乃至百倍的价格。

从普通消费者到中小企业，更青睐的是「够用+便宜」的实惠。

OpenAI等公司无疑依然握有行业顶尖的研究人才和技术积累，但他们再难宣称自己的路线是「唯一正确且必不可少」的。

行业叙事正在转向：与其痴迷于砸钱堆出更大模型，不如在架构创新和工程稳定性上下功夫，以换取成本效率和开放生态。

投资者也日趋清醒，过去见谁谈AI就砸钱的狂热减退了许多，现在更关注实际效能和商业可行性。

最危险的对手，不是那个跟你拼烧钱的人，而是那个证明根本不需要烧那么多钱的人。

参考资料：

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

OpenAI产品线拉出来吓我一跳，奥特曼不愧是YC出身

量子位 2025-10-27 14:22:10
2 跟贴 2
英伟达、DeepSeek集体跟进！18个月前被忽视，如今统治AI推理

新智元 2025-11-09 13:33:03
48 跟贴 48

AI六巨头罕见同台！李飞飞激辩LeCun，黄仁勋：你们都错了

新智元 2025-11-08 19:10:18
96 跟贴 96

LLM首次达到人类语言专家水平！OpenAI o1拿下拆解句法、识别歧义、推理音律

新智元 2025-11-08 12:34:47
0 跟贴 0
改掉幻觉=杀死AI？Science曝光大模型「先天死穴」

新智元 2025-11-09 11:21:12
0 跟贴 0

终结Transformer统治！清华姚班校友出手，剑指AI「灾难性遗忘」

新智元 2025-11-08 17:13:46
61 跟贴 61

杰克逊抢劫，霍金打拳击？！大量已故名人网上被AI“复活”，被彻底“操控”了

英国那些事儿 2025-11-09 23:08:12
14 跟贴 14
英伟达AI世界模拟器？AI P图学会「脑补」过程了！

新智元 2025-11-04 19:33:28
0 跟贴 0

全新人工神经元面世，能耗比人脑低数千倍！或彻底改变AI部署方式

DeepTech深科技 2025-11-09 20:10:45
20 跟贴 20
专访惟德精准谢卫国：AI重塑医学影像，助力国产手术机器人弯道超车 | 直击进博会

财联社 2025-11-09 21:56:11
0 跟贴 0
物流业deepseek时刻，中国无人车火爆全球

华商韬略 2025-06-17 10:58:23
0 跟贴 0
只要心中有光世界便不会黑暗

魔芋影视君 2025-11-06 17:47:20
1 跟贴 1
小姐姐展示基本功，、一个动作惊呆路人，奥特曼我都不敢这么掰！

乐天搞笑派 2025-11-06 13:37:55
2 跟贴 2
【DeepSeek谈艺】孙立新 | 将大地的雄浑与人物的质朴溶于纸墨

文化视界网 2025-11-09 16:13:03
0 跟贴 0
妈妈让爸爸送孩子上学，两个好似网络延迟，网友：这俩搁这卡bug

社会奇闻知 2025-11-07 08:56:09
0 跟贴 0
不生儿子根本不知道奥特曼有这么多网友：还知道留个过道

蓬勃资讯 2025-11-09 07:39:00
0 跟贴 0
搭高通骁龙8255芯片，豆包＋Deepseek上车，福特全新“方盒子”配置有点炫！

车矩阵更懂车 2025-11-09 23:05:04
4 跟贴 4
【DeepSeek谈艺】黄少鹏 | 通过油画传递东方意境，直抵精神内核

文化视界网 2025-11-09 16:08:19
0 跟贴 0
2岁萌娃拿奥特曼打恐龙，电视瞬间被砸坏

荔枝新闻 2025-11-09 05:05:39
0 跟贴 0
【奥美迦MAD】好像有点燃不起来？！

漫说君动漫 2025-11-07 22:03:32
0 跟贴 0
萨梅洛星人再临！变身为黑暗奥美迦，嘲讽红脸奥美迦不好看

漫说君动漫 2025-11-08 01:02:53
0 跟贴 0
迪迦奥特曼演员的现况：丽娜和居间惠队长同框，大古平时跳舞唱歌

娱乐琐琐碎 2025-11-08 21:35:16
0 跟贴 0
基准榜单靠不住？奥特曼：AGI不是奇点，监管别一刀切

机器之心Pro 2025-10-09 18:32:29
0 跟贴 0
俄媒：俄军即将攻占乌克兰"第三首都"

每日经济新闻 2025-11-08 22:55:11
48591 跟贴 48591
黄仁勋：中国的AI市场无论有没有英伟达都会进步与华为是竞争对手不是敌人

财联社 2025-07-21 10:22:14
6 跟贴 6
郭正亮：台湾亲测试用，高德比谷歌好用！超精准功能丰富！

神话有理 2025-11-08 18:36:47
0 跟贴 0
DeepSeek预测：5年后，300万的房子值多少钱？真的是超出了预期

小牛爱说事儿 2025-11-08 09:28:25
1 跟贴 1
115岁的李陈氏，出生于清朝的“老宝贝”｜面孔

大象新闻 2025-11-09 09:38:06
4770 跟贴 4770
女下属被踢出项目组一声不吭，回家睡醒后，女上司八千万后台崩盘

晓艾故事汇 2025-11-09 17:15:59
0 跟贴 0
美财长：美25年来制造首块稀土磁铁结束中国"卡脖子"

澎湃新闻 2025-11-08 21:49:11
12657 跟贴 12657
郑丽文出席吴石追思会面对绿营妖言不得不出言澄清

新民周刊 2025-11-09 09:07:52
667 跟贴 667
武汉铁路局武汉客运段通报“高铁票买到19排但车厢只有17排”

环球网资讯 2025-11-09 13:42:07
5900 跟贴 5900
这难不成就是蒸汽机模型吗

带你看看 2025-11-08 10:25:02
1 跟贴 1
不止电池升级那么简单！Model Y新增长续航后驱车型

热点科技 2025-11-09 18:27:38
39 跟贴 39
花24万买的准新车竟是“融资租赁”车，消费者要求退一赔三，瓜子二手车回应

半岛官网 2025-11-09 20:29:03
65 跟贴 65
于北辰曾逆天发言:解放军登陆台湾没有谷歌地图会迷路

海峡新干线 2025-11-08 14:38:28
0 跟贴 0
演员于适任中国骑射运动中心执行主任

澎湃新闻 2025-11-09 16:58:35
1106 跟贴 1106
比亚迪再出“王炸”！全新混动架构即将登场

汽车网评 2025-11-09 20:52:38
21 跟贴 21
胖东来销售额破200亿，于东来曾表示：如果升得太快，员工就得加班

潇湘晨报 2025-11-09 20:00:52
1649 跟贴 1649
四中全会精神在基层丨澎湃算力迸发数字河北新活力

新浪财经 2025-11-09 11:58:25
0 跟贴 0

“眼科女王”曾琦，多张漂亮优雅照片曝光，未来3大困境等着她

“眼科女王”曾琦，多张漂亮优雅照片曝光，未来3大困境等着她

李昕言温度空间

2025-11-06 21:03:20

知名网红夫妻，已被正式逮捕！

财经三分钟pro

2025-11-09 17:14:40

钱再多有什么用？42岁暴瘦脱相崩溃大哭的蒋欣，给所有人提了个醒

钱再多有什么用？42岁暴瘦脱相崩溃大哭的蒋欣，给所有人提了个醒

冷紫葉

2025-11-07 23:37:13

集体溃败！中国人，为啥不买BBA了

集体溃败！中国人，为啥不买BBA了

说财猫

2025-11-09 11:59:50

卡拉格：斯洛特让新援太早首发了，应学克洛普循序渐进的方式

卡拉格：斯洛特让新援太早首发了，应学克洛普循序渐进的方式

懂球帝

2025-11-10 06:02:51

光刻机将成“废铁”？中企正式官宣，美日荷最担心的事情发生

光刻机将成“废铁”？中企正式官宣，美日荷最担心的事情发生

三农老历

2025-11-09 11:25:46

49岁经理被调岗看门，当晚退出微信群，次日领导找遍10个经销商

49岁经理被调岗看门，当晚退出微信群，次日领导找遍10个经销商

兰姐说故事

2025-10-17 20:05:03

古二再曝王家卫录音，拿疫情大开玩笑发国难财，恶意诋毁讽刺上面

古二再曝王家卫录音，拿疫情大开玩笑发国难财，恶意诋毁讽刺上面

花哥扒娱乐

2025-11-10 03:01:52

李嘉诚时代真的结束了！全运会四大家族去了三家，唯独缺了李家！

李嘉诚时代真的结束了！全运会四大家族去了三家，唯独缺了李家！

牛牛叨史

2025-11-08 17:45:13

7000亿新省级银行，获批筹建！

7000亿新省级银行，获批筹建！

证券时报

2025-11-09 08:10:11

能洗澡的SUV！智己LS9将于11月12日正式上市

能洗澡的SUV！智己LS9将于11月12日正式上市

鞭牛士

2025-11-08 10:36:05

中美谈妥了，赢家还不知道是谁,输家已经有四个,头一个是巴基斯坦

中美谈妥了，赢家还不知道是谁,输家已经有四个,头一个是巴基斯坦

科技处长

2025-11-08 22:44:21

倪妮和男友三里屯被拍，他帅得低调，她美得张扬，这才叫天作之合

倪妮和男友三里屯被拍，他帅得低调，她美得张扬，这才叫天作之合

草莓解说体育

2025-11-09 14:51:46

湖南人民医院事件新进展，祖某某原配亮相，涉事人物又有新证据

湖南人民医院事件新进展，祖某某原配亮相，涉事人物又有新证据

平老师666

2025-11-09 15:34:26

54岁突然发现，许多中产家庭渐渐穷回去了，以下两个征兆，要警惕

54岁突然发现，许多中产家庭渐渐穷回去了，以下两个征兆，要警惕

雪雪呀

2025-08-11 08:41:29

张家界荒野求生挑战赛新退出选手大赞泡面“太好吃”，目前仅剩16名选手

张家界荒野求生挑战赛新退出选手大赞泡面“太好吃”，目前仅剩16名选手

极目新闻

2025-11-09 11:38:20

医生做手术时手机突然因“涉诈”被停机，二十多天未能复机，“无法与病人取得联系”！其妻子也因“打电话频繁”被停机，最新进展来了

医生做手术时手机突然因“涉诈”被停机，二十多天未能复机，“无法与病人取得联系”！其妻子也因“打电话频繁”被停机，最新进展来了

每日经济新闻

2025-11-09 09:23:06

近两日最牵动人心的是神二十航天员，非因任务未圆满，乃因返程突发状况

近两日最牵动人心的是神二十航天员，非因任务未圆满，乃因返程突发状况

粤语音乐喷泉

2025-11-08 11:34:48

郭晶晶陈若琳挽手入场全运会开幕式现场，跳水皇后郭晶晶好美

郭晶晶陈若琳挽手入场全运会开幕式现场，跳水皇后郭晶晶好美

老吴教育课堂

2025-11-10 00:05:13

WTT德国冠军赛落幕！日本包揽2金，18岁松岛辉空4-1胜邱党夺冠

WTT德国冠军赛落幕！日本包揽2金，18岁松岛辉空4-1胜邱党夺冠

全言作品

2025-11-10 02:30:53

AI产业主平台领航智能+时代

13828文章数 66239关注度

往期回顾全部

科技要闻

黄仁勋亲赴台积电“讨要更多芯片”

头条要闻

美俄核对抗即将“零约束” 人类面临挑战

头条要闻

美俄核对抗即将“零约束” 人类面临挑战

体育要闻

他只想默默地拿走最后一亿美元

娱乐要闻

《繁花》事件影响：唐嫣工作被取消

财经要闻

10月CPI同比涨0.2% PPI同比下降2.1%

汽车要闻

钛7月销破2万霜雾灰与青峦翠配色正式开启交付

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

时尚

本地

游戏

手机

军事航空

伊姐周六热推：电视剧《四喜》；电视剧《唐朝诡事录之长安》......

本地新闻

这届干饭人，已经把博物馆吃成了食堂

《暗黑四》又在藏什么？官方暗示TGA有新内容！

手机要闻

愈演愈烈！iPhone半夜“偷拨号”持续发酵，疑似iOS26的锅？

军事要闻

俄媒：俄军即将攻占乌克兰"第三首都"

© 1997-2025 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版