网易首页 > 网易号 > 正文 申请入驻

1 亿美金砍到 50 万!这家中国公司让训练成本暴跌 200 倍,算力公司要破产了

0
分享至

还记得半年前 DeepSeek 横空出世时的震撼吗?那个用不到 OpenAI 1/20 的成本就训练出顶级模型的"神话",不仅让整个硅谷为之侧目,更是给国内的 AI 创业公司上了生动的一课——原来,大模型可以这样玩。

DeepSeek 冲击波下的转型之路

对于被称为"AI 六小龙"的 MINIMAX 来说,DeepSeek 的出现无异于一记当头棒喝。过去的剧本突然就讲不下去了:疯狂烧钱买算力,追着 OpenAI 的脚步跑,今天发个大模型,明天搞个视频生成...看起来很忙,但总感觉在原地打转。

投资人开始问:"既然 DeepSeek 能用这么少的钱做出这么好的效果,你们之前烧的那些钱都去哪了?"用户开始问:"既然有免费的 DeepSeek,我为什么还要付费用你们的 API?"

但 MINIMAX 的反应出人意料地迅速和果断。他们没有选择继续讲老故事,而是彻底换了剧本:从追逐热点转向硬核技术突破,从商业化优先转向开源优先,从模仿 OpenAI 转向对标 DeepSeek。

实际上,MiniMax 在今年 1 月份就推出了开源模型 Minimax-01,其中包括语言模型和视觉模型,但似乎反向平平。

半年的蛰伏与沉淀后,他们暂停了所有非核心项目,把最优秀的工程师都调到了一个神秘的项目上。

MiniMax-M1:半年磨一剑的技术突破

昨天,MINIMAX 终于交出了答卷——MiniMax-M1,他们宣称这是世界上第一个开源的大规模混合架构的推理模型。这不是一个匆忙的应景之作,而是一次深思熟虑的技术革新。

突破一:Lightning Attention - 超长文本处理

M1 原生支持100 万字符的超长文本处理,处理 10 万字文本时只需要其他模型 25% 的计算资源。这意味着可以一次性分析整本小说或研究报告,而不需要拆分处理。

⚡ 突破二:CISPO 算法 - 更聪明的学习方式

传统训练方法会忽略"不寻常"的学习过程,但 CISPO 算法不再丢弃任何"思考片段",充分利用每个思维火花。实验显示,这种方法比传统方法快 2 倍,效果还更好。

突破三:超低成本训练

仅用 53.74 万美元就完成了整个强化训练,相比 GPT-4 超过 1 亿美元的成本,M1 几乎是同等能力模型中最便宜的。这不是简单的"省钱",而是技术效率的革命性提升。

需要说明的是,53.74 万美元并非模型的全部训练成本,而仅仅是强化学习阶段的费用。MINIMAX 表示他们仅用 512 块 H800 GPU 训练了三周就完成了这一阶段,这一效率比行业预期至少提升了一个数量级。

不过,与 DeepSeek 不同的是,MINIMAX 并未公布模型从预训练到最终完成的完整训练成本(不包括实验费用)。因此,53.74 万美元这个数字虽然令人印象深刻,但可能只是冰山一角。

实战表现:数据说话的硬实力

经过半年的技术沉淀,MiniMax-M1 在各个关键领域的表现如何?我们用一张完整的对比表来看看它与顶级模型的真实差距:

虽然 M1 把训练成本又下调了一个数量级,但在常见的指标测试中,这个模型并无一项能到最优。比较亮眼的是长文本能力,在 MRCR(128K) 测试中得分 73.4,仅次于 Gemini 2.5 Pro 的 76.8,在 LongBench-v2 中更是达到 61.5 的第二名成绩,可见 Lightning Attention 确实非常有效。

值得一提的是,M1 有两项指标超越了 DeepSeek R1,即数学方面的 AIME 2025(76.9 vs 70.0)以及编程能力方面的 LiveCodeBench(65.0 vs 55.9)。这表明 MINIMAX 在核心技术突破上确实有所建树。

尽管综合来看,这些指标并不算最亮眼,但作为第一款开源模型,在成本控制以及长文本处理方面有这么突出的创新,已经非常难能可贵了。

从跟随者到引领者的华丽转身

MINIMAX 的转型反映了 AI 行业的变化趋势。从追逐商业化到选择开源路线,从高成本训练到技术效率优化,这种策略调整与当前行业对成本控制和技术创新的重视相符。

开源模式正在 AI 领域获得更多关注。DeepSeek 的成功为行业提供了新的发展思路,而 MiniMax-M1 的发布进一步验证了这一方向的可行性。随着更多公司选择开源策略,行业竞争重心可能会从资本投入转向技术创新。

从追逐者到开拓者,MINIMAX 用半年时间完成了一次完美的转身。这一转变表明"AI 六小龙"已经开始探索新的发展路径。

算力泡沫破灭:一场正在发生的行业洗牌

从 1 亿美金到 50 万美金,训练成本在短短的 1 年时间内的暴跌,正在引发整个算力市场的剧烈震荡。这不仅仅是数字的变化,更是一场颠覆性的行业重构。

那些曾经疯狂囤积算力的公司,如今面临着尴尬的现实:昂贵的 GPU 集群突然变成了"负资产"。据业内消息,已有大批公司开始大量退卡,试图减少损失。

而一些专门提供算力租赁服务的供应商,更是直接面临破产危机——当客户发现用更少的钱就能获得更好的效果时,谁还会为过时的"算力迷信"买单?

这场技术革命告诉我们:真正的护城河从来不是资源的堆砌,而是效率的突破。 在 AI 的下半场,拼的不再是谁烧钱更多,而是谁的技术更聪明。

本文由「AI 范儿」出品

我每天都在更新,如果你觉得这些内容对你有用,

那我们就加个关注、交个朋友。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
奚梦瑶婚礼结束自己背个包就走了,松弛感满满像去幼儿园接娃

奚梦瑶婚礼结束自己背个包就走了,松弛感满满像去幼儿园接娃

韩小娱
2026-06-03 18:21:57
历史首次!中国双星携手冲NO.1,赵心童优势大,吴宜泽后发制人?

历史首次!中国双星携手冲NO.1,赵心童优势大,吴宜泽后发制人?

刘姚尧的文字城堡
2026-06-03 09:47:30
黄景瑜王玉雯这事,最骚的不是辟谣,是进地库后,绕了整整10分钟

黄景瑜王玉雯这事,最骚的不是辟谣,是进地库后,绕了整整10分钟

西楼知趣杂谈
2026-04-14 06:23:47
人民日报发文锐评《主角》,未曾点名张艺谋,却给张艺谋提了个醒

人民日报发文锐评《主角》,未曾点名张艺谋,却给张艺谋提了个醒

白面书誏
2026-06-03 14:43:26
新加坡防长写打油诗总结"香会" 现场用中文朗读

新加坡防长写打油诗总结"香会" 现场用中文朗读

看看新闻Knews
2026-05-31 18:36:09
王楚钦上任仅24小时,丑闻频发引争议

王楚钦上任仅24小时,丑闻频发引争议

萧狡科普解说
2026-06-03 13:03:31
钱再多有什么用!千万网红董赤赤停更5个月后,再出现时面相大变

钱再多有什么用!千万网红董赤赤停更5个月后,再出现时面相大变

林轻吟
2026-06-03 12:12:44
一代女神沦落豪门玩物?结婚8年牙齿全掉,器官切除,面似骷髅

一代女神沦落豪门玩物?结婚8年牙齿全掉,器官切除,面似骷髅

荒野老五
2026-05-31 02:53:04
一张照片看哭无数人:你看到的,不一定是真相

一张照片看哭无数人:你看到的,不一定是真相

有态度网友ytd2993
2026-05-30 01:06:26
张勇时代的阿里被四面围剿,蔡崇信回归后,做对了3件事

张勇时代的阿里被四面围剿,蔡崇信回归后,做对了3件事

二大爷观世界
2026-05-30 10:41:08
山东临清卷烟厂历史变迁以及30款老品牌香烟,你抽过几款?

山东临清卷烟厂历史变迁以及30款老品牌香烟,你抽过几款?

白浅娱乐聊
2026-06-03 18:28:00
赵海燕儿子大婚发生恶心一幕,儿媳妇动作被嘲,大姑闫学晶缺席

赵海燕儿子大婚发生恶心一幕,儿媳妇动作被嘲,大姑闫学晶缺席

胡一舸南游y
2026-06-03 13:31:41
12年只打了4场季后赛,狂赚2.94亿!如今31岁场均19+2却无人问津

12年只打了4场季后赛,狂赚2.94亿!如今31岁场均19+2却无人问津

兵哥篮球故事
2026-06-03 18:51:24
211院校降为普通本科!

211院校降为普通本科!

老吕教你考MBA
2026-06-02 11:57:50
警惕!血常规报告中这2个指标异常,癌症可能“悄悄来临”

警惕!血常规报告中这2个指标异常,癌症可能“悄悄来临”

凤凰卫视
2026-05-20 15:16:04
美国华人的无奈:移民过来,哪怕是精英,不出两代,阶层就下滑

美国华人的无奈:移民过来,哪怕是精英,不出两代,阶层就下滑

贱议你读史
2026-05-29 01:46:36
总决赛G4出现4次严重争议哨,究竟对谁有利?裁判专家给出答案

总决赛G4出现4次严重争议哨,究竟对谁有利?裁判专家给出答案

南海浪花
2026-06-03 19:16:56
福克斯:面对进攻火力强大的尼克斯 我们要及时回防&减少失误

福克斯:面对进攻火力强大的尼克斯 我们要及时回防&减少失误

北青网-北京青年报
2026-06-03 19:58:06
印媒披露数据:印度极端高温,单日或致3400人死亡

印媒披露数据:印度极端高温,单日或致3400人死亡

环球网资讯
2026-06-03 06:46:06
妻子穿几十元T恤,丈夫满身名牌做医美车内常备上万现金,却不愿出2500生活费!遭多年家暴,女子起诉离婚,发现1400万元已被转走

妻子穿几十元T恤,丈夫满身名牌做医美车内常备上万现金,却不愿出2500生活费!遭多年家暴,女子起诉离婚,发现1400万元已被转走

华商网
2026-06-03 17:03:16
2026-06-04 03:47:00
AI范儿 incentive-icons
AI范儿
AI范儿是一个专注于人工智能领域的资讯和学习平台,提供最新的人工智能资讯
754文章数 674关注度
往期回顾 全部

科技要闻

传DeepSeek融资意向500亿:腾讯投100亿

头条要闻

男子不想上班辞职后上武当山当道士 8个月后选择下山

头条要闻

男子不想上班辞职后上武当山当道士 8个月后选择下山

体育要闻

选择中国品牌的库里,和他们的巨大野心

娱乐要闻

官方痛批乱象 刘涛郑恺等艺人遭点名

财经要闻

AI,开始偷懒了?

汽车要闻

专访蒋平:安全不做高低配 长安要让安全技术普惠

态度原创

游戏
手机
家居
教育
公开课

曝《塞尔达》传奇重制版将亮相!任天堂发布会下周见

手机要闻

华为Mate90系列重磅爆料:全新Deco设计登场,三大梯队排名曝光!

家居要闻

江畔轻奢 观云大宅

教育要闻

大龄在美国学护理 RN CNA NP不同类型如何选??

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版