网易首页 > 网易号 > 正文 申请入驻

MiniMax M2.7炸场!中国开源模型首次能改写自己代码,30%性能提升

0
分享至

2026年4月12日深夜,一个来自中国AI创业公司的开源模型发布,在全球开发者社区引发了一场不小的震动。

MiniMax正式发布了其最新一代旗舰模型——M2.7,基于2300亿参数的稀疏MoE(混合专家)架构构建。最引人注目的特性不是参数规模,而是它身上出现的一个前所未有的能力:可以改写自己的训练代码,从而参与自身的训练循环,并在这个过程中实现约30%的性能自我优化。



这在AI圈子里,是一个让不少人倒吸一口凉气的技术突破。

传统大模型的训练是一个"一次性"的过程:人类工程师编写训练代码,准备数据集, запустить训练,输出模型,结束。如果模型性能不达预期,解决办法是调参、改数据、换架构——但无论怎样,模型本身没有能力介入自己的"出生"过程。



M2.7打破了这一点。它的模型权重中包含了对自身训练流程的"元认知"能力:在收到特定指令后,M2.7能够分析自身的代码结构,识别可优化的训练子程序,并通过一个受控的自我修改机制,对训练循环中的特定模块进行重新编写和自我迭代。

这不是简单的"模型自我改进"——那种能力在业界已经出现,比如让大模型生成更好的提示词来引导自己的回答。M2.7的不同之处在于,它改的是底层的训练代码本身,是模型在参与自身被创造的过程。



MiniMax将这个机制称为"自进化训练"(Self-Evolution Training),并在论文中详细描述了其技术实现细节。这篇论文目前已在arXiv公开。



技术突破之外,M2.7在标准评测中的表现同样令业界侧目。

SWE-Pro评测(软件工程领域最具权威性的AI评测之一)中,M2.7取得了56.22%的得分。在Terminal Bench 2(终端操作类任务评测)中,得分为57.0%。这两个数字放在当前全球开源模型的坐标系里,都是相当有竞争力的成绩。



对比来看,这两个指标在三个月前还是各家闭源模型的天下,开源模型鲜少能突破50%的门槛。M2.7的出现,标志着开源社区在AI编程和自主操作这两个高价值能力维度上,正式向闭源头部玩家发起了挑战。

更值得注意的是,这30%的自我优化效果,是在没有额外人工干预的情况下,由模型自身驱动完成的。MiniMax的技术报告指出,经过三轮自进化迭代后,模型在编程相关任务上的表现平均提升了30%,在推理任务上的提升约为18%。



M2.7选择全面开源,代码和权重均在Hugging Face平台上公开。

这个决定背后,有MiniMax清晰的市场逻辑:AI编程工具和AI Agent是当前最具商业价值的应用方向,而这两个方向的竞争,本质上是开发者生态的竞争。谁能让更多开发者围绕自己的模型构建工具和应用,谁就能建立护城河。



开源是赢得开发者最有效的方式。没有了API调用的成本门槛,全球开发者可以自由地微调、部署和构建应用。这正是Meta当初开源Llama系列时的策略——通过降低使用门槛,快速扩大开发者基数,形成生态飞轮。



M2.7的开源还有一个额外优势:它得到了英伟达和华为昇腾两大硬件平台的支持。对于中国开发者来说,能够在华为昇腾芯片上本地部署M2.7,是一个非常有吸引力的选项——它意味着国内企业可以在不完全依赖英伟达GPU的情况下,用上当前最强的开源编程Agent模型之一。

M2.7采用了稀疏MoE架构,这是近年来大模型设计中的一个重要技术路线。



传统大模型在处理任何输入时,都会激活全部参数。这在工程上效率低下,因为许多参数在不同任务中被调用时,实际上并不同时需要。稀疏MoE的思路是:将模型拆分成多个"专家"子网络,每次推理时只激活最相关的少数专家网络,从而在保持高质量输出的同时,大幅降低实际计算成本。

2300亿参数听起来很大,但如果采用稀疏激活的方式,每次推理可能只激活其中约15%-20%的参数。这意味着M2.7的实际推理成本,接近一个300-400亿参数级别的密集模型,但能力边界却接近甚至超越了许多参数规模更大的密集模型。



MiniMax选择这个架构,有明确的商业考量:更低的推理成本,意味着在构建AI应用和Agent产品时,运营成本更低,商业可行性更高。



M2.7发布前,中国开源大模型的格局已经相当热闹:DeepSeek系列、Qwen系列、GLM系列、Yi系列……各家都有各自的强项和生态。但客观地说,在"AI编程"和"Agent自主行动"这两个当前最热门的应用场景上,开源中国模型的表现,一直落后于OpenAI、Anthropic等头部闭源玩家。

M2.7的出现,正在填补这个空白。它在SWE-Pro和Terminal Bench上的表现,让开源中国模型第一次站上了与闭源顶级模型正面竞争的擂台。

更值得关注的是,M2.7的可自我进化机制,会不会成为下一代大模型的标配?如果一个模型能够持续自我优化而不需要人类工程师重新训练,它的迭代速度将远超依赖外部反馈的传统训练模式。这种"模型自我迭代"的范式一旦成熟,AI能力的进化速度将会进入一个全新的阶段。

MiniMax M2.7,迈出了这一步。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
安徽阜阳一服刑人员在监狱突然死亡

安徽阜阳一服刑人员在监狱突然死亡

黄河新闻网吕梁
2026-04-20 10:35:48
雷霆大胜太阳总分1-0:亚历山大25分17罚 布克23分杰伦22+7+6

雷霆大胜太阳总分1-0:亚历山大25分17罚 布克23分杰伦22+7+6

醉卧浮生
2026-04-20 06:07:58
真香!神操作背后!老鹰为何愿意交易肯纳德?

真香!神操作背后!老鹰为何愿意交易肯纳德?

篮球实录
2026-04-19 23:11:48
马刺半场领先10分:文班21分对攻阿夫迪亚19分 杨瀚森未登场

马刺半场领先10分:文班21分对攻阿夫迪亚19分 杨瀚森未登场

醉卧浮生
2026-04-20 10:21:55
这张照片绝对是李宇春最想删掉的照片!

这张照片绝对是李宇春最想删掉的照片!

可乐谈情感
2026-04-20 03:34:03
世锦赛战报:16强决出5席!中国2胜2负1领先,世界亚军4-10一轮游

世锦赛战报:16强决出5席!中国2胜2负1领先,世界亚军4-10一轮游

球场没跑道
2026-04-20 05:38:54
换机风波:当期待的新电脑变成信创“危机”

换机风波:当期待的新电脑变成信创“危机”

电脑吧评测室
2026-04-19 22:12:03
黑粉攻击何润东风波升级!博主怒撕:蹭热度该适可而止,又老又丑

黑粉攻击何润东风波升级!博主怒撕:蹭热度该适可而止,又老又丑

小徐讲八卦
2026-04-19 15:19:03
一场1-2爆出大冷门,皇马弃将爆发:传射建功,大巴黎主场沦陷

一场1-2爆出大冷门,皇马弃将爆发:传射建功,大巴黎主场沦陷

足球狗说
2026-04-20 07:10:43
金像奖获奖名单出炉:梁家辉五封影帝,章子怡马丽坐了一晚冷板凳

金像奖获奖名单出炉:梁家辉五封影帝,章子怡马丽坐了一晚冷板凳

萌神木木
2026-04-19 22:54:32
1983年,陈云亲自批示:立即枪毙广东县委书记王仲,原因为何?

1983年,陈云亲自批示:立即枪毙广东县委书记王仲,原因为何?

莫地方
2026-04-20 09:30:18
塔图姆25+11+7布朗26分,费城双枪打铁,绿军大胜76人刷爆纪录

塔图姆25+11+7布朗26分,费城双枪打铁,绿军大胜76人刷爆纪录

钉钉陌上花开
2026-04-20 05:20:14
国际油价飙涨7%,黄金白银、美股期指全线下挫,加密货币16万人爆仓,美军向伊朗商船开火

国际油价飙涨7%,黄金白银、美股期指全线下挫,加密货币16万人爆仓,美军向伊朗商船开火

21世纪经济报道
2026-04-20 06:46:08
二十余年品质够抗打,一汽丰田通勤郊游一步到位

二十余年品质够抗打,一汽丰田通勤郊游一步到位

汽车网评
2026-04-20 09:33:33
大数据分析,在中国,找个身高1米7年入20万的老公,到底有多难?

大数据分析,在中国,找个身高1米7年入20万的老公,到底有多难?

深度报
2026-04-18 23:37:27
世锦赛战报:16强中国锁定3席!世界冠军连输5局了,恐爆冷一轮游

世锦赛战报:16强中国锁定3席!世界冠军连输5局了,恐爆冷一轮游

小火箭爱体育
2026-04-20 06:06:04
放弃幻想,若中日开战,世界各国的立场如何

放弃幻想,若中日开战,世界各国的立场如何

孝沛与世界
2026-04-20 01:24:36
美国妹子崩溃大哭:借9.6万美元上大学,已还16.5万,还欠22万

美国妹子崩溃大哭:借9.6万美元上大学,已还16.5万,还欠22万

贱议你读史
2026-04-19 04:30:07
央视揭露:美国1年投1300万美元在中国搞“渗透”,俄罗斯、伊朗、古巴也是重点目标;细节曝光

央视揭露:美国1年投1300万美元在中国搞“渗透”,俄罗斯、伊朗、古巴也是重点目标;细节曝光

极目新闻
2026-04-19 11:39:23
输不起,是很多国人刻在骨子里的巨婴病

输不起,是很多国人刻在骨子里的巨婴病

浪子说
2026-04-19 07:06:22
2026-04-20 11:23:00
侃故事的阿庆
侃故事的阿庆
几分钟看完一部影视剧,诙谐幽默的娓娓道来
565文章数 8224关注度
往期回顾 全部

科技要闻

蓝色起源一级火箭完美回收 客户卫星未入轨

头条要闻

失踪女老板被找到 嫌犯曾改名整容还催警察"还我清白"

头条要闻

失踪女老板被找到 嫌犯曾改名整容还催警察"还我清白"

体育要闻

七大奖项候选官宣!文班或全票DPOY

娱乐要闻

章子怡!增重20斤素颜拍新片

财经要闻

月之暗面IPO迷局

汽车要闻

外观非常惊艳 全新一代宝马6系有望回归

态度原创

健康
手机
房产
时尚
公开课

干细胞抗衰4大误区,90%的人都中招

手机要闻

上市还没半年!三星三折叠屏手机面临退市 友商跟华为差距太远

房产要闻

官宣签约最强城更!海口楼市,突然杀入神秘房企!

今年最流行的衣服竟然是它?高级又气质!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版