网易首页 > 网易号 > 正文 申请入驻

MiniMax发布全球首个混合架构开源模型M1 称强化训练成本仅53万美金

0
分享至

《科创板日报》6月17日讯(记者 黄心怡) MiniMax行动了。

今日凌晨,总部位于上海的AI独角兽企业MiniMax发布其自主研发的MiniMax-M1系列模型。M1被定义为“全球首个开源的大规模混合架构推理模型”。技术报告显示, M1模型原生支持100万Token的上下文窗口,这一数字与谷歌最新的Gemini 2.5 Pro持平,并支持业内最长的8万Token推理输出;其RL(强化训练)成本下降一个量级,成本仅53万美金;在工具使用场景(TAU-bench)中MiniMax-M1-40k超过Gemini-2.5 Pro。


开源技术报告截图MiniMax对M1的定价采用阶梯式,随着输入文本长度增加而提高。其中,0-32k Token:输入0.8元/百万Token,输出8元/百万Token;32k-128k Token:输入1.2元/百万Token,输出16元/百万Token;128k-1M Token:输入2.4元/百万Token,输出24元/百万Token。

前两个档位的定价均低于DeepSeek-R1,而第三个超长文本档位则是DeepSeek模型目前尚未覆盖的领域。此外,MiniMax方面表示,在其自有的App和Web端,M1模型将保持不限量免费使用。

报告还提到,在进行8万Token的深度推理时,M1所需的算力仅为DeepSeek R1的约30%;生成10万token时,推理算力只需要DeepSeek R1的25%。

MiniMax此次提出的CISPO算法,其收敛性能比字节跳动近期提出的DAPO算法快一倍,也优于DeepSeek早期使用的GRPO算法,这使得M1模型的整个强化学习阶段仅使用了512块英伟达H800 GPU,耗时三周,成本为53.5万美元。MiniMax表示,这一成本“比最初的预期少了一个数量级”。

年初DeepSeek的爆火出圈后,其带来的技术革新与成本降低,拉动了行业“技术平权”,更将压力传到其它大模型厂商,尤其是一路靠风险投资支持,进军到决赛圈的大模型“六小虎”。在DeepSeek影响下,“六小虎”的商业化和融资变得极具挑战。今年以来多家企业出现了联合创始人、高管离职的情况。

为了能够继续留在牌桌上,“六小虎”正在积极破局求变。比如,零一万物在年初调整策略,将大部分训练和AI基础设施团队并入阿里,不再追求训练超级大模型。百川智能则精简B端业务,声称要聚焦AI医疗大模型。

剩下的Kimi、智谱、阶跃星辰选择留在通用人工智能的牌桌上,相继上线了自研推理模型。而MiniMax此次发布并开源推理模型,也预示其做好了准备,将继续加入这场大模型之争中。

《科创板日报》记者获悉,M1的发布是MiniMax“开源周”的序幕。在接下来的四个工作日里,MiniMax计划每天发布一项新的技术或产品更新。

当前,大模型的竞争格局还面临新的变数,那就是——DeepSeek R2的发布。

今年以来,DeepSeek对V3模型和R1模型进行了小版本试升级,但DeepSeek R2模型何时发布,迟迟未有消息。这不仅对DeepSeek自身意义重大,也是现有大模型玩家所面临的一场竞争考验。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
1975年蒋介石去世,张学良送来16字挽联,蒋经国看后脸色骤变

1975年蒋介石去世,张学良送来16字挽联,蒋经国看后脸色骤变

芊芊子吟
2026-06-29 00:10:07
没有证据?那就发明证据!从中国第一“女福尔摩斯”到冤案制造者

没有证据?那就发明证据!从中国第一“女福尔摩斯”到冤案制造者

许三岁
2026-06-24 11:06:59
中国最“穷”的6个铁饭碗行业:表面体面风光,实际工资低到想哭

中国最“穷”的6个铁饭碗行业:表面体面风光,实际工资低到想哭

一口娱乐
2026-06-28 15:10:19
“拿捏”青春期孩子,最有效的方法:不是给钱,也不是讲道理,坚持做好“情绪不反应”,就够了!

“拿捏”青春期孩子,最有效的方法:不是给钱,也不是讲道理,坚持做好“情绪不反应”,就够了!

青春期父母成长学堂
2026-06-29 06:10:02
油价大跌超0.82元/升,6月大跌的油价,7月3日或再大降超800元/吨

油价大跌超0.82元/升,6月大跌的油价,7月3日或再大降超800元/吨

油价早知道
2026-06-28 04:02:06
不到两周,乌克兰一天之内又损失两架战斗机,或许还损失了第三架

不到两周,乌克兰一天之内又损失两架战斗机,或许还损失了第三架

鹰眼Defence
2026-06-28 16:26:41
雷军后院失火,黄仁勋判了WPS死刑?

雷军后院失火,黄仁勋判了WPS死刑?

不正确
2026-06-26 19:14:53
最高院:提供 “口交” “肛交”等进入式性服务,是否属卖淫行为?

最高院:提供 “口交” “肛交”等进入式性服务,是否属卖淫行为?

周军律师聊案子
2026-04-21 09:50:16
1955年,何应钦和同事在台湾家中打牌的留影,美女相伴好不惬意!

1955年,何应钦和同事在台湾家中打牌的留影,美女相伴好不惬意!

云霄纪史观
2026-06-28 00:39:04
周末突发重磅利空!

周末突发重磅利空!

风风顺
2026-06-29 03:05:04
1998年数万华人遭屠杀,中国为何没出兵?26年后答案让人沉默

1998年数万华人遭屠杀,中国为何没出兵?26年后答案让人沉默

哄动一时啊
2026-02-17 22:21:25
郑钦文霸气怒怼黑粉:等着被我打脸!回应温网抽到苦主:命运安排

郑钦文霸气怒怼黑粉:等着被我打脸!回应温网抽到苦主:命运安排

我爱英超
2026-06-29 07:03:01
跌入斩杀线的老电车,正在靠充电宝强行续命

跌入斩杀线的老电车,正在靠充电宝强行续命

酷玩实验室
2026-06-26 18:25:07
够狠!王励勤终于动真格的了,直接砍掉前主席的后花园

够狠!王励勤终于动真格的了,直接砍掉前主席的后花园

以茶带书
2026-06-21 16:00:21
37次射门0进球:C罗与梅西世界杯对决梦碎

37次射门0进球:C罗与梅西世界杯对决梦碎

星河漫山野
2026-06-29 01:12:04
大罗:我全力支持内马尔,姆巴佩的踢法让我想起巅峰期的自己

大罗:我全力支持内马尔,姆巴佩的踢法让我想起巅峰期的自己

懂球帝
2026-06-29 05:02:35
“她就是个累赘”,怀胎十月约见网友,用力过猛临盆扼杀新生女儿

“她就是个累赘”,怀胎十月约见网友,用力过猛临盆扼杀新生女儿

易玄
2026-06-26 11:13:44
吴月娘:我这浪肉,被男人摸一下真好

吴月娘:我这浪肉,被男人摸一下真好

老达子
2026-06-26 06:50:03
抖音网红表妹李KK塌房,彻底玩完

抖音网红表妹李KK塌房,彻底玩完

新浪财经
2026-06-23 00:08:03
马斯克:Grok 4.5模型已在SpaceX、特斯拉内部测试

马斯克:Grok 4.5模型已在SpaceX、特斯拉内部测试

IT之家
2026-06-28 19:09:04
2026-06-29 08:12:49
财联社 incentive-icons
财联社
以“准确、快速、权威、专业”为新闻准则,为投资者提供专业的投资资讯。
736443文章数 1021748关注度
往期回顾 全部

科技要闻

DeepSeek最新论文:如何让大模型跑得更快

头条要闻

民办高校被指禁止小米汽车入校 校方回应

头条要闻

民办高校被指禁止小米汽车入校 校方回应

体育要闻

两周飞5万公里!因凡蒂诺遭环保人士猛批

娱乐要闻

曾沛慈拿下《乘风2026》年度总冠军

财经要闻

省钱,我只服梁文锋

汽车要闻

搭载华为乾崑六件套 东风奕派M8预售19.98万起

态度原创

数码
时尚
艺术
本地
房产

数码要闻

手机秒变掌机!Android 17拟推出折叠屏专用虚拟游戏手柄

夏天裙子不用买多,建议入手一条蓝裙子,清爽高级又耐看

艺术要闻

林徽因先生一生珍稀之影像。

本地新闻

世界杯球迷节:比球赛更好玩的派对

房产要闻

全国高考大放水,300分就能上本科!论上岸率,海南没输过!

无障碍浏览 进入关怀版