网易首页 > 网易号 > 正文 申请入驻

MiniMax上新M3模型,编程能力超GPT-5.5

0
分享至

继启动A股上市辅导后,MiniMax再迎新动向。6月1日,MiniMax正式发布新一代通用模型MiniMax M3。M3采用全新的自研稀疏注意力架构MiniMax Sparse Attention(MSA),在编程及智能体能力、超长上下文及原生多模态等多个关键方向,均实现代际突破。 5月30日,MiniMax Group Inc.在上海证监局办理辅导备案登记,拟首次公开发行股票并上市,行业分类为I65软件和信息技术服务业,辅导券商为中信证券股份有限公司。MiniMax成为继智谱后,于港交所主板挂牌上市又启动“A+H”双平台布局的公司。

据悉,M3同时具备“前沿Coding能力、1M超长上下文、原生多模态”三项核心能力的大模型。MiniMax称,M3是目前的开源模型当中,唯一能同时做到这三点的。

M3采取的是自研的稀疏注意力架构MSA(MiniMax Sparse Attention)。相较传统全注意力机制,MSA能够显著降低长上下文下的计算成本,并将上下文窗口提升至100万token。这意味着模型在处理长文档、复杂代码仓库、多轮任务协作等场景时,能够在一次推理中保留更完整的信息链路。MiniMax披露,在100万上下文规模下,M3单token计算量仅为上一代模型的约1/20,推理效率显著提升。

在行业内,采用新的注意力机制、减少token消耗已经成为新模型发布时的标配。比如DeepSeek发布的全新系列模型V4就采取了另一种节省计算量和缓存空间的 混合压缩注意力机制,该机制使得模型在处理超长上下文时,能够更高效地组织和检索信息,相较上一代模型只需约27%的计算量和10%的缓存空间,这意味着同样的任务消耗的Token和算力都更少。

除模型架构升级外,MiniMax在底层推理算子层面也进行了进一步优化。通过重新设计数据读取与计算路径,相关性能较主流开源方案提升4倍以上。这也符合业内逐渐形成的新共识,即随着Agent任务复杂度不断提高,“更长上下文、更稳定记忆、更低成本推理”正在成为决定产品可用性的关键能力。

在大模型目前消耗Token最多的coding和Agentic大项上,M3也做了明显提升。在衡量Coding能力的SWE-Bench Pro上,MiniMax M3超过4月发布、主打编程的OpenAI新一代模型GPT-5.5,以及Gemini 3.1 Pro,接近Opus 4.7。在综合评估SVG生成性能的基准SVG-Bench上,MiniMax M3超过Opus 4.7。在面向自主Agent的端到端评测框架Claw-Eval上,MiniMax M3得到最高分。

为验证最新模型的超长上下文、编程和agent能力,MiniMax内部丢给M3一篇ICLR 2025 Outstanding Paper Award 获奖论文并让其独立复现,最终M3自主运行了接近12小时,全程自主产出18次commit与23张实验图表,并跑通了核心实验、验证了论文中提出的方法。

多模态一直是MiniMax的核心战略布局,这一方向在M3模型上也得到充分落地。

据介绍,M3是一个从Step 0开始进行多模态混合训练的模型。MiniMax在报告中强调,在为相关数据重构整套数据管线后,MiniMax已可以将训练数据Token规模提升至100万亿的量级。这意味着模型能力正在从语言理解进一步向真实数字环境延伸。无论是办公自动化、企业软件操作,还是更复杂的生产力场景,AI进入实际执行层的速度正在明显加快。

采写:南都N视频记者 林文琪

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
最能忍的帝王李豫:被宦官当众夺权,他隐忍17年,连屠三大权宦

最能忍的帝王李豫:被宦官当众夺权,他隐忍17年,连屠三大权宦

掠影后有感
2026-06-02 09:17:41
戏混子又来嚯嚯央视剧?面瘫式演技,一哭就瞪眼,张嘉益也带不动

戏混子又来嚯嚯央视剧?面瘫式演技,一哭就瞪眼,张嘉益也带不动

草莓解说体育
2026-06-02 00:42:25
刚刚获批!越南南北高铁敲定2035年完工,17个独立项目同时推进,中国力量参与人才培训

刚刚获批!越南南北高铁敲定2035年完工,17个独立项目同时推进,中国力量参与人才培训

缅甸中文网
2026-06-01 13:40:05
79岁佛爷再启免签大法 敲定27岁利物浦铁闸:6月8日官宣 穆帅狂喜

79岁佛爷再启免签大法 敲定27岁利物浦铁闸:6月8日官宣 穆帅狂喜

风过乡
2026-06-02 08:23:33
中国的刀产量,究竟有多恐怖?| 地球知识局

中国的刀产量,究竟有多恐怖?| 地球知识局

地球知识局
2026-06-01 12:31:00
鹰狮入列:乌克兰集齐北约四大主力战机,俄罗斯的噩梦才刚开始

鹰狮入列:乌克兰集齐北约四大主力战机,俄罗斯的噩梦才刚开始

民间胡扯老哥
2026-06-01 06:11:19
19年前,乔布斯干掉了手机键盘;昨天,黄仁勋干掉了电脑软件

19年前,乔布斯干掉了手机键盘;昨天,黄仁勋干掉了电脑软件

码头青年
2026-06-02 12:25:31
总决赛G4还未开打,上海传来6个利好消息,广厦或无心硬扛到底

总决赛G4还未开打,上海传来6个利好消息,广厦或无心硬扛到底

有范又有料
2026-06-02 10:39:25
20辆车烧成骨架!74岁大爷一句“挡我走路了”,把自己烧进了局子

20辆车烧成骨架!74岁大爷一句“挡我走路了”,把自己烧进了局子

辉哥说动漫
2026-06-02 00:59:53
58只跌停!追高的全被闷杀,这些翻倍股千万别碰了!

58只跌停!追高的全被闷杀,这些翻倍股千万别碰了!

慧眼看世界哈哈
2026-06-01 16:07:49
有暴雨大暴雨!广东天气即将有变→

有暴雨大暴雨!广东天气即将有变→

佛山发布
2026-06-02 12:17:35
老菜农透露:6月买菜,就选这4种!基本不打农药,鲜嫩营养又便宜

老菜农透露:6月买菜,就选这4种!基本不打农药,鲜嫩营养又便宜

秀厨娘
2026-06-02 11:59:01
倒计时5天,92汽油涨超8.7元/升后“猛烈”下跌,下次6月4日调整

倒计时5天,92汽油涨超8.7元/升后“猛烈”下跌,下次6月4日调整

猪友巴巴
2026-05-30 16:40:03
上海一同学聚会吃了43万6,请客的人先行离开,剩下的人当场翻脸

上海一同学聚会吃了43万6,请客的人先行离开,剩下的人当场翻脸

萧竹轻语
2025-06-11 17:21:59
白捡24TB硬盘!员工拆开公司淘汰设备后直接乐坏了

白捡24TB硬盘!员工拆开公司淘汰设备后直接乐坏了

游民星空
2026-05-31 12:27:20
浙江国企“塌方”  高管批量投案

浙江国企“塌方” 高管批量投案

经济那道理
2026-06-01 15:55:26
什么鬼!詹姆斯排第二,里夫斯第一!湖人开始挽留老詹了...

什么鬼!詹姆斯排第二,里夫斯第一!湖人开始挽留老詹了...

詹姆斯吧
2026-06-02 13:07:20
2950枚导弹无一命中,霹雳-2的惨痛代价谁人知

2950枚导弹无一命中,霹雳-2的惨痛代价谁人知

起喜电影
2026-05-23 11:24:35
明黄比基尼上身,自己直接成了艺术品

明黄比基尼上身,自己直接成了艺术品

梅梅聊点实尚嗑
2026-06-02 08:30:05
无需催生!中国最愿意生孩子的省,根本不用催,连续七年全国第一

无需催生!中国最愿意生孩子的省,根本不用催,连续七年全国第一

素衣读史
2026-05-26 21:52:56
2026-06-02 14:59:00
南方都市报 incentive-icons
南方都市报
换一种方式,南都在现场。
614560文章数 3588878关注度
往期回顾 全部

科技要闻

烧掉千亿后,美团、阿里、京东谁先止血?

头条要闻

上海女童几乎没上过学 外公找来前女婿把女儿告上法庭

头条要闻

上海女童几乎没上过学 外公找来前女婿把女儿告上法庭

体育要闻

1米74的业余联赛替补,在英超踢中卫

娱乐要闻

奚梦瑶何猷君婚礼曝光 深情热吻甜蜜

财经要闻

锂电“资源墙”高筑 全球性长期博弈开始

汽车要闻

星途神秘新车轮廓曝光 又一款性能SUV要来了?

态度原创

本地
房产
艺术
健康
公开课

本地新闻

用剪纸的方式,打开江苏扬州

房产要闻

100亿!1371亩!海口城市更新,再爆超级项目!

艺术要闻

周杰伦花 1.36 亿拍下这幅画

干细胞临床研究向患者收费?别踩坑

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版