网易首页 > 网易号 > 正文 申请入驻

MiniMax发布推理模型对标DeepSeek,算力成本仅约53万美元

0
分享至

6月17日,沉寂已久的六小龙之一MiniMax酝酿了一个大动作,宣布将连续五天发布重要更新。今天第一弹是开源首个推理模型MiniMax-M1。

根据官方的报告,MiniMax-M1多项基准测试比肩DeepSeek-R1、Qwen3等开源模型,接近海外的最领先模型。

官方博客还提到,基于两大技术创新,MiniMax-M1训练过程高效得“超出预期”,只用了3周时间、512块H800 GPU就完成强化学习训练阶段,算力租赁成本仅53.47万美元。这比一开始的预期少了一个数量级。

多位开发者已经第一时间展开测评。前illasoft技术总监@karminski在社交平台发布了自己对MiniMax-M1的测评,认可其是“开源MoE第一梯队”。

@karminski着重测试了MiniMax-M1-80K的写代码能力,用“拆烟囱”这一编程案例实测发现,MiniMax-M1-80K在提示词下一次过,他提到DeepSeek-R1-0528 甚至 Gemini-2.5-Pro 都没能一次通过,这可能得益于其“训练材料足够新”和“思考时多次反刍成功避坑”的能力。

缺点是,从生成的前端页面来看, 样式不是很美观,因此用来生成高度创意的内容可能会面临不够发散的问题, 但反过来编程的指令遵循和精确性会更好。另外光影效果不是很好,也是训练不足的地方。

也有网友提到,测试发现MiniMax-M1模型中文写作是严谨优先的,幻觉较低,以遵循文本和指令为第一。这在注重发散的国内模型中比较难得。

MiniMax-M1这一新模型最大的亮点还是100万的上下文窗口长度,和闭源模型里的谷歌 Gemini 2.5 Pro一样,是DeepSeek R1的 8倍。

依托这一基础,M1系列在长上下文理解任务中 (MRCR)表现较优,从测试指标看,超越了所有开源权重模型,甚至超越海外的顶尖模型OpenAI o3和Claude 4 Opus,全球排名第二,仅微弱差距落后于Gemini 2.5 Pro。

“无限长的长文本能力是MiniMax团队一直在打磨的重要维度,对于做社交应用、情感陪伴应用,Agent等来说是很关键的技术。”云启资本合伙人陈昱在6月的大会论坛上表示。云启是MiniMax的天使轮投资机构。

TAU-bench是一个评估AI智能体在真实世界环境中可靠性的基准测试,在这一指标中,MiniMax-M1表现较为出色,超越了DeepSeeK-R1-0528和谷歌的Gemini-2.5 Pro,在全球仅次于OpenAI o3和Claude 4 Opus。

在代码能力(SWE-bench)上,MiniMax-M1显著超越大部分开源模型,仅微弱差距次于DeepSeek最新发布的R1。

MiniMax表示,MiniMax-M1的长文本能力得益于闪电注意力机制为主的混合架构,这一架构使得M1在进行长文本的上下文输入和深度推理时均有算力效率优势。MiniMax举例称,在用8万Token深度推理的时候,只需要使用DeepSeek R1约30%的算力。

除此之外,MiniMax提出的另一创新是强化学习算法CISPO。官方博客表示,在数学AIME的实验中,这比字节近期提出的 DAPO 等强化学习算法收敛性能快了一倍,显著优于 DeepSeek早期使用的 GRPO。这也是最终算力成本不到54万美元的原因。

因为相对高效的训练和推理算力使用,MiniMax的定价性价比较高,官方直接对标性价比之王DeepSeek喊话,“两种模式都比 DeepSeek-R1 性价比更高,另一种模式DeepSeek模型不支持。”

MiniMax-M1的定价采用阶梯式,随输入长度增加而提高:

0-32k 输入:输入 0.8元/百万token,输出 8元/百万token

32k-128k输入:输入 1.2元/百万token,输出 16元/百万token

128k-1M 输入:输入 2.4元/百万token,输出 24元/百万token

几乎与MiniMax同时,六小龙之中的另外一家月之暗面也在今日开源了编程模型 Kimi-Dev-72B。根据官方发布的信息,这一模型是基于阿里云的Qwen2.5-72B 微调得到的。根据报告,这一模型在SWE-bench编程基准测试中取得了全球最高开源模型水平,成绩超过了新版DeepSeek-R1。

不过,@karminski测试发现,“同样是生成拆烟囱demo, Kimi-Dev-72B生成的代码,用 Claude-4-Sonnet修改了3个bug 才能运行。”此外,这一案例基本需要600-800行代码才能完成, Kimi-Dev-72B只生成了220行, 较多细节都没有实现。

这引发了对其高分是否源于“过拟合”的质疑,这是机器学习中的常见问题,指模型在训练集上表现优异,但在未见过的新数据上预测能力显著下降。目前月之暗面尚未发布详细技术报告。

DeepSeek在年初搅动风暴后,AI六小龙有的出现高管出走风波,有的沉寂已久,埋头训练半年,看起来这些厂商已经做好了新的准备,继续加入这场大模型之争中。

MiniMax预告,后续四天将有更多更新。此前“海螺02(0616)”视频模型已现身AI视频竞技场,并取得第二名的佳绩,业界普遍预期海螺新版本即将正式亮相。如果海螺能延续M1在成本或能力上的突破,或将进一步搅动多模态AI的格局。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
蒋介石孙子召开发布会,提出“两蒋”移灵大陆,2句话让世人唏嘘

蒋介石孙子召开发布会,提出“两蒋”移灵大陆,2句话让世人唏嘘

老谢谈史
2026-03-18 18:33:35
明明也走了,初创主播只剩yoyo,一夜爆火出圈的东方甄选只剩回忆

明明也走了,初创主播只剩yoyo,一夜爆火出圈的东方甄选只剩回忆

东方不败然多多
2026-04-25 14:39:14
男人的生理需求能有多难忍?网友:我对我老公只有动物本能

男人的生理需求能有多难忍?网友:我对我老公只有动物本能

带你感受人间冷暖
2026-02-07 03:58:56
百万粉博主喊话经纪人霍汶希:张敬轩演唱会开得成,我跟你姓

百万粉博主喊话经纪人霍汶希:张敬轩演唱会开得成,我跟你姓

一盅情怀
2026-04-23 19:01:44
孙宏斌现状:公司负债大幅减少,63岁愁白了头,儿子成了他的骄傲

孙宏斌现状:公司负债大幅减少,63岁愁白了头,儿子成了他的骄傲

洲洲影视娱评
2026-04-20 15:16:52
四川一妈妈带儿子买高铁票,结果相隔14个车厢,“距离远还不相通”,12306回应:余票不足时才会被分开,可在上车后协商换座

四川一妈妈带儿子买高铁票,结果相隔14个车厢,“距离远还不相通”,12306回应:余票不足时才会被分开,可在上车后协商换座

台州交通广播
2026-04-24 23:52:56
曝克洛普同意接掌皇马!提出九大转会要求,这三人必须买

曝克洛普同意接掌皇马!提出九大转会要求,这三人必须买

澜归序
2026-04-25 05:46:16
有色将重回上升通道。藏格将成为首支百元有色股。

有色将重回上升通道。藏格将成为首支百元有色股。

风风顺
2026-04-25 13:10:40
有意思了,老鹰队的库明加将战胜尼克斯的功劳归于勇士队的格林

有意思了,老鹰队的库明加将战胜尼克斯的功劳归于勇士队的格林

好火子
2026-04-25 04:32:17
紧急通告!25日7时起,成绵高速应急抢险,临时交通管制

紧急通告!25日7时起,成绵高速应急抢险,临时交通管制

封面新闻
2026-04-25 08:36:05
特朗普通告全球,现在的美国要带领全世界完成“去中国化”

特朗普通告全球,现在的美国要带领全世界完成“去中国化”

果妈聊娱乐
2026-04-25 09:22:11
发现一个奇怪的现象:凡是情绪稳定、睡眠好、不焦虑的人,都有一个共性,那就是再大的事也不搁在心里,再恶劣的环境也能想办法适应

发现一个奇怪的现象:凡是情绪稳定、睡眠好、不焦虑的人,都有一个共性,那就是再大的事也不搁在心里,再恶劣的环境也能想办法适应

LULU生活家
2026-04-24 19:12:24
Shams:布朗退出公牛篮球运营主管竞选 公牛已开始首轮面试

Shams:布朗退出公牛篮球运营主管竞选 公牛已开始首轮面试

北青网-北京青年报
2026-04-25 09:53:02
葡媒:阿莫林计划下赛季继续休整,他想利用这段时期精进能力

葡媒:阿莫林计划下赛季继续休整,他想利用这段时期精进能力

懂球帝
2026-04-25 22:13:16
苹果8号员工干了49年:裁员名单绕着他走,因为赔不起

苹果8号员工干了49年:裁员名单绕着他走,因为赔不起

世界圈
2026-04-04 13:13:03
重返国乒仅1周,国际乒联对马龙的称呼变了,再次印证刘国梁的话

重返国乒仅1周,国际乒联对马龙的称呼变了,再次印证刘国梁的话

什么都唠唠
2026-04-24 22:03:04
4月起,个人所得税不能再零申报了!这3类人不得申报工资薪金

4月起,个人所得税不能再零申报了!这3类人不得申报工资薪金

祥顺财税俱乐部
2026-04-25 09:09:12
以为我在“洗白”安禄山,你错了,这才是历史上真实的安禄山

以为我在“洗白”安禄山,你错了,这才是历史上真实的安禄山

抽象派大师
2026-04-25 18:46:59
新款大众ID. Buzz官图发布!网友:价格25万起,肯定排队

新款大众ID. Buzz官图发布!网友:价格25万起,肯定排队

汽车网评
2026-04-23 23:00:31
湖人最大功臣出炉,老詹两点该夸!斯玛特直言不讳,雷迪克也认错

湖人最大功臣出炉,老詹两点该夸!斯玛特直言不讳,雷迪克也认错

鱼崖大话篮球
2026-04-25 12:15:36
2026-04-26 00:52:49
第一财经资讯 incentive-icons
第一财经资讯
第一财经官方账号
251511文章数 622125关注度
往期回顾 全部

科技要闻

DeepSeek V4发布!黄仁勋预言的"灾难"降临

头条要闻

媒体:美军在中东罕见高密度集结 伊朗开始调整战术

头条要闻

媒体:美军在中东罕见高密度集结 伊朗开始调整战术

体育要闻

那一刻开始,两支球队的命运悄然改变了

娱乐要闻

《我们的爸爸2》第一季完美爸爸翻车了

财经要闻

90%订单消失,中东旺季没了

汽车要闻

2026款乐道L90亮相北京车展 乐道L80正式官宣

态度原创

亲子
游戏
家居
手机
公开课

亲子要闻

发生率仅十万分之一!这种稀有血型跨省紧急调配,只为守护母婴安全

金发美少女魔王和我是邻居!新游首曝美女角色太吸睛

家居要闻

自然肌理 温润美学

手机要闻

iPhone Ultra机模上手:11mm厚、无长焦,苹果第一折就这?

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版