10月27日消息,MiniMax发布全新大模型M2,定价每百万token输入0.3美元、输出1.2美元——只有Claude的8%。
在全球测评榜Artificial Analysis上,M2排名前五,综合能力直逼GPT-5。
![]()
M2的设计重点放在三个方向:代码、Agent、深度搜索。这不是一次参数升级,而是一场从“语言模型”到“多模态智能体”的跃迁。
M2的代码能力几乎能覆盖整个开发周期。它不仅能生成多文件结构的复杂项目,还能自动调试、验证、修复。
![]()
Terminal-Bench与SWE-Bench的测试结果显示,它更像是一位能独立工作的开发者,而非一个“写代码的模型”。
Agent方面,M2能串联整个工具链:Shell、浏览器、Python执行器乃至MCP工具,具备搜索、规划、执行和自我恢复的完整流程。它能在BrowseComp评测中完成多源信息检索与溯源,展现出“思维链式执行”的特征。
但真正让M2特别的,是它的多模态协同能力。
![]()
在一次实测中,开发者让M2自动搭建一个故宫博物院网站。它不仅完成了图片展示,还调用语音模型生成导览解说,全程由模型自行规划流程与调用工具。
这意味着,它理解了声音、图像、文字之间的关系,并能以开发者的方式组织它们。
当音频、视频、文本模型都来自同一体系,多模态的协作就不再是“调用”,而是“共生”。这种全栈整合,成为MiniMax的关键差异点。
在搜索与推理领域,M2同样表现惊人。
![]()
在Xbench-DeepSearch上,M2排名全球第二,仅次于GPT-5;在FinSearchComp-global榜单上,它依旧位列第二,仅次于Grok4。
一项关于建筑经济的实验显示,M2能在短时间内阅读800篇论文、总结200篇要点,信息量是Claude 4.5的两倍。
MiniMax同时宣布全球限时14天免费开放——模型、Agent、App全线放开。
![]()
策略很清晰:用极致价格切入市场,用免费周期培养用户习惯,用多模态能力构建壁垒。
M2还将开源。这一决定让MiniMax的路线更“全栈+生态”:
它希望通过社区力量加速进化,同时把开发者变成合作者。
它可能采取“开源基础版+商业增强版”的双层路径,以开放换规模,用差异化定价换利润。
MiniMax在下注一个趋势——AI的全栈融合时代。
当顶级智能模型逐渐变成基础设施,真正的竞争将不再是谁的模型最强,而是谁能整合视觉、语音、推理、行动为一体,提供端到端的智能体验。
M2的出现,是一次定价战,也是一次方向战。(转自AI普瑞斯)
更多AI资讯请点击:http://www.aipress.com.cn/
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.