网易首页 > 网易号 > 正文 申请入驻

MiniMax M3发布:百万上下文推理成本削至1/20

0
分享至

处理一份百万token长度的技术文档,模型单次推理的算力消耗从“一辆卡车”变成了“一个背包”——这个听起来有点夸张的效率跃迁,在6月1日MiniMax发布的新模型M3上成了现实。该公司给出的数据是,在100万上下文规模下,M3单token计算量仅为上一代模型的约1/20,直接把长文本处理的成本曲线掰弯。

M3的核心秘密是一套名为MiniMax Sparse Attention(MSA)的自研稀疏注意力架构。与传统全注意力机制每个位置都要相互“打招呼”不同,MSA只在关键节点间建立连接,大幅砍掉了长上下文中的冗余计算,同时将上下文窗口拉到了100万token。这背后还有一层推理算子的底活——MiniMax重新设计了数据读取与计算路径,让相关性能相比主流开源方案提升了4倍以上。


靠着这套架构,M3成了国内首个同时集齐“前沿编程能力、1M超长上下文、原生多模态”三项技能的大模型,并且是目前全球唯一以开源姿态拿出这个完整组合的选手。用MiniMax自己的话说,就是三个条件必须同时满足,少一个都不算真·全能。

具体的评测成绩也摆上了台面:在编码能力测试SWE-Bench Pro上,M3压过了GPT-5.5和Gemini 3.1 Pro,紧追Opus 4.7;在综合评估SVG生成性能的SVG-Bench上,则直接把Opus 4.7甩在身后。多模态文档理解测试OmniDocBench里,M3得分超过Gemini 3.1 Pro;而在专门考验自主智能体的端到端评测框架Claw-Eval上,M3直接登顶。

这些成绩的推手之一,是MiniMax在编程与智能体训练中引入的交互式用户模拟器框架。简单来说,就是训练阶段让模型跟一个虚拟的“真实开发者”搭档干活,模拟实际协作中的需求变更、多轮对话、代码调试等场景,让模型从一开始就习惯应付混乱的现实世界,而不是只会在干净数据上拿高分。

多模态能力同样从训练起点就开始渗透。M3采用了文本、图片、视频混合训练,并进一步扩大了数据规模和训练管线。除了看懂图像和视频,它还学会了操作桌面——能在跨应用环境中执行Computer Use任务,比如从邮件里捡附件、转存到云盘、再同步到项目管理工具,整条链跑通。MiniMax合伙人说,AI进入实际执行层的速度比他们去年预期的要快得多。

与M3同天露面的还有MiniMax Code,一套专为M3设计训练的智能体产品。面对长程复杂任务,它的Agent Team能把大目标拆成多阶段、可并发、可动态调整的工作流,由一群Agent分头协作推进。这就好比一个项目经理把需求切成小块,分给前端、后端和测试同时跑,中间还能根据进展随时调兵遣将。

在闭源巨头们把持着最强推理和代理能力的当下,M3用“开源+全能”的姿态切入了对数据隐私极度敏感、又对智能体性能要求极高的企业客群。毕竟,金融、政务、制造这些领域的决策者,很难接受把核心数据喂进一个黑箱模型,哪怕那个黑箱再聪明。MiniMax的差异牌,打的正是这个心理缝隙。

商业化的脚步也跟得很紧。同步推出的Token Plan订阅方案把使用成本拉进了“百元时代”:Plus版月费49元,给6亿token;Max版119元换18亿token;Ultra版469元包55亿token。对开发者来说,这相当于花一顿火锅钱就能让模型帮自己读几十本长篇小说量的文档,性价比的算盘打得噼啪响。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
两个乌克兰姑娘,在广州找到了第二个家

两个乌克兰姑娘,在广州找到了第二个家

捣蛋窝
2026-06-02 13:25:06
吃完嫩的吃老的,山西儿媳出轨公公10年,亲自给丈夫生下一个妹妹

吃完嫩的吃老的,山西儿媳出轨公公10年,亲自给丈夫生下一个妹妹

莫地方
2026-06-02 00:10:26
伊朗最高领袖穆杰塔巴罕见照片曝光:就任86天从未公开露面,每逢关键节点必发声

伊朗最高领袖穆杰塔巴罕见照片曝光:就任86天从未公开露面,每逢关键节点必发声

财闻
2026-06-02 14:34:58
禁止所有中国外交官入境,不准两岸统一,这个国家比美国还嚣张?

禁止所有中国外交官入境,不准两岸统一,这个国家比美国还嚣张?

傲傲讲历史
2026-06-02 13:53:16
百亿基金经理“清仓式”离场,武晓春代任董事长的德邦基金能否突围?

百亿基金经理“清仓式”离场,武晓春代任董事长的德邦基金能否突围?

观察者网
2026-06-02 12:33:31
两个18岁女孩到KTV应聘工作,对方承诺日入1800元,现在无比后悔

两个18岁女孩到KTV应聘工作,对方承诺日入1800元,现在无比后悔

十九妹
2026-06-02 13:14:11
太讽刺了!女方提出28.8万元彩礼要求,男子送来一瓣蒜和百元现金

太讽刺了!女方提出28.8万元彩礼要求,男子送来一瓣蒜和百元现金

火山詩话
2026-06-02 07:25:54
割四赔五后续:麦客撤了,麦烂了,农户跪了,这锅谁背?

割四赔五后续:麦客撤了,麦烂了,农户跪了,这锅谁背?

番外行
2026-06-02 14:19:47
美媒称美伊谈判重回正轨

美媒称美伊谈判重回正轨

界面新闻
2026-06-02 11:24:25
中央定调!2026年养老金从1月补发,去年涨2%,今年会涨多少呢?

中央定调!2026年养老金从1月补发,去年涨2%,今年会涨多少呢?

社保小达人
2026-06-01 11:03:56
日媒称“日本人不去中国,中国旅游业遭重创”!日网友嗨翻:他们失去日本游客很难受!

日媒称“日本人不去中国,中国旅游业遭重创”!日网友嗨翻:他们失去日本游客很难受!

东京新青年
2026-05-31 18:08:07
努尔基奇:布登霍尔泽严重酗酒,他居然去教杜兰特该怎么得分

努尔基奇:布登霍尔泽严重酗酒,他居然去教杜兰特该怎么得分

懂球帝
2026-06-02 11:01:07
里克尔梅:我若当选,劳尔会任足球总监;皇马现在不需要穆帅

里克尔梅:我若当选,劳尔会任足球总监;皇马现在不需要穆帅

懂球帝
2026-06-02 06:25:05
代价拉满!记者曝四方大交易,火箭7换2,如愿得到杰伦·布朗

代价拉满!记者曝四方大交易,火箭7换2,如愿得到杰伦·布朗

体育见习官
2026-06-02 14:00:31
CCTV5直播!上午8点30分!NBA总决赛G1来袭,文班和大头再续恩怨

CCTV5直播!上午8点30分!NBA总决赛G1来袭,文班和大头再续恩怨

球盲百小易
2026-06-02 00:52:56
印度首富组团来华骗技术,吃闭门羹后11亿美元设备堆在仓库吃灰

印度首富组团来华骗技术,吃闭门羹后11亿美元设备堆在仓库吃灰

混沌录
2026-05-30 23:51:06
今年小区里出现很多“假穷人”,他们放着几十万的车不开,骑着电驴去上班;取快递的次数也少了;还拿出几年前的衣服来穿

今年小区里出现很多“假穷人”,他们放着几十万的车不开,骑着电驴去上班;取快递的次数也少了;还拿出几年前的衣服来穿

背包旅行
2026-06-02 11:48:18
外卖大战的“炮灰”,过剩的1600万骑手

外卖大战的“炮灰”,过剩的1600万骑手

深水财经社
2026-05-31 12:14:09
15个副省级市已明确,浙江2个,江苏仅有1个,湖南、河北1个都无

15个副省级市已明确,浙江2个,江苏仅有1个,湖南、河北1个都无

混沌录
2026-06-01 21:47:13
旗袍肉丝高跟里的芳华绝代

旗袍肉丝高跟里的芳华绝代

艾斯莱斯奈斯
2026-05-28 02:10:38
2026-06-02 17:24:49
全栈遛狗员
全栈遛狗员
白天跟需求对线,晚上在小区遛狗。
4491文章数 71关注度
往期回顾 全部

科技要闻

烧掉千亿后,美团、阿里、京东谁先止血?

头条要闻

男子离婚当晚杀害前妻逃亡17年被判死缓 检方抗诉成功

头条要闻

男子离婚当晚杀害前妻逃亡17年被判死缓 检方抗诉成功

体育要闻

1米74的业余联赛替补,在英超踢中卫

娱乐要闻

奚梦瑶何猷君补办婚礼超幸福

财经要闻

锂电“资源墙”高筑 全球性长期博弈开始

汽车要闻

星途神秘新车轮廓曝光 又一款性能SUV要来了?

态度原创

游戏
本地
时尚
健康
公开课

刺客信条:侠隐独占手游无PC版!中国刺客不配3A画质?

本地新闻

用剪纸的方式,打开江苏扬州

推广|| 入夏第一双鞋买得好成功!暴走1w步、搭遍小裙子

干细胞临床研究向患者收费?别踩坑

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版