2月12日,MiniMax在北京举行了备受瞩目的新一代旗舰模型发布会,正式上线了MiniMax M2.5(MiniMax M2.5),这款被定位为“原生Agent生产级模型”的新作,凭借其在编程能力、搜索增强以及办公生产力方面的显著突破,迅速点燃了市场热情。发布当日,MiniMax股价单日涨幅超过20%,在随后的几天内累计涨幅高达34.69%,创下了近五天内34.69%的涨幅记录。
![]()
![]()
一、模型定位:专为Agent场景原生设计的生产级解决方案
MiniMax M2.5并非一款全新技术范式的模型,而是在M2.1基础上进行的大幅度工程优化和能力增强。它延续了M系列的混合专家模型(MoE)架构,总参数规模达到了2300亿,但在推理时仅激活100亿参数,真正实现了“小激活、大智慧”的高效计算。
![]()
![]()
最值得关注的是,M2.5是MiniMax首款明确定位为“原生Agent生产级模型”的产品。它通过引入名为Forge的智能体原生强化学习框架,将底层训练-推理引擎与智能体完全解耦,优化了模型在复杂智能体任务中的响应速度与任务分解能力。这种框架设计,使M2.5在运行SWE-Bench Verified等复杂任务时,端到端运行时间从平均31.3分钟缩短至22.8分钟,提升幅度达到了37%。
二、性能突破:编程能力与工具调用实现国产化第一
在编程能力方面,M2.5的表现尤为抢眼。它在SWE-Bench Verified权威榜单中得分达到了80.2%,在Multi-SWE-Bench中得分为51.3%,较上一代显著提升,并且在跨语言复杂环境中超越了国际顶尖模型Claude Opus 4.6,达到了行业最好的水平。
![]()
除了编程,M2.5在搜索增强(Search)和工具调用(Tool)场景也表现出了国产模型的领跑优势。它在BrowseComp和Wide Search等基准测试中实现了行业领先的性能,特别是在面对不熟悉的脚手架环境时,展现出了更高的泛化能力。官方数据显示,M2.5在真实世界专业任务中表现优异,能够通过更少的搜索轮次实现更好的结果,效率提升约20%。
三、核心优势:成本极低,效率极高
MiniMax M2.5最引人注目的不仅是性能,更是其“超级性价比”。它的运行成本是Claude Opus 4.6的十分之一到二十分之一。以每秒100 token的速率连续工作一小时,其成本仅为1美元;以每秒50 token的速率运行,成本降至0.3美元。
![]()
官方还推出了两个版本:M2.5和M2.5-Lightning,两者在能力上完全相同,仅在速度上存在差异。M2.5-Lightning的吞吐量达到100 tokens/秒,是其他前沿模型的两倍速度,价格为每百万输入tokens 0.3美元,每百万输出tokens 2.4美元。
四、市场反响:股价大涨35%,掀起国产化浪潮
在当前全球AI模型高价垄断的背景下,MiniMax M2.5的发布无疑是对市场的一次重大冲击。其发布当日,MiniMax股价在盘中一度超过20%,总市值突破1800亿港元;在随后的几天内,累计涨幅高达34.69%。业内人士指出,这不仅是MiniMax公司的重大胜利,更是国产大模型在成本与效率上首次实现“追赶并超越”的标志性事件。
结语
MiniMax M2.5的发布,标志着国产大模型在Agent场景下的性能瓶颈被成功突破。它不仅在技术上实现了对Claude Opus 4.6的正向超越,更在商业模式上通过极低的成本为普通开发者和企业提供了强大的生产力工具,彻底颠覆了“高性能=高成本”的传统认知,为国产化AI的普惠化奠定了坚实基础。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.