网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

开源大模型SOTA又刷新！中国MiniMax M2全球排名第五，开源榜

2025-10-30 18:11:38　来源: RPA中国

北京举报

0

分享至

中国AI独角兽之一，MiniMax发布了专为智能体和代码任务设计的模型M2，刷新开源SOTA。

价格仅有Claude Sonnet的8%，速度超越近两倍。

MiniMax最知名的就是它们家的海螺AI，时不时就刷新视频生成、语音生成新高度。存在感爆棚。

成立三年，MiniMax迅速发展，完成了多轮融资，在2023年6月就获得了超过2.5亿美元的投资。

在M2之前，MiniMax已经推出了MiniMax-M1系列模型。

MiniMax-M1上线表现优异，超越了DeepSeek-R1和Qwen3-235B等其他强大的开放权重模型。

这些前期工作为M2的开发奠定了坚实的技术基础。

MiniMax的发展战略始终围绕普惠智能这一核心理念。

这种理念引导着MiniMax在模型设计上的选择，也决定了M2的产品定位。

模型只为解决真实世界的问题

随着AI技术的发展，简单的问答式对话助手正在向能够独立完成复杂任务的Agent演进。

MiniMax在实践中发现，现有的AI模型难以完全满足Agent的需求，主要挑战在于性能、价格和推理速度之间的平衡——这几乎是一个不可能三角。

海外顶级模型虽然性能优秀，但价格昂贵且相对较慢。

国内模型价格较低，但在性能和速度上存在差距。

这种状况导致现有的Agent产品往往价格高昂或速度缓慢。例如，许多Agent订阅服务每月需要数十甚至数百美元，完成单个任务常常需要数小时。

Mini-Max团队在公司快速发展的过程中，构建了多种Agent来应对挑战。

这些Agent开始完成越来越复杂的任务，从分析在线数据、研究技术问题，到日常编程、处理用户反馈，甚至筛选人力资源简历。

它们与团队一起工作，推动公司发展，构建了一个从开发AGI到与AGI共同进化的AI原生组织。

MiniMax M2采用了混合专家（MoE）架构，总参数量达到2300亿，但每次推理只激活约100亿参数。

这种设计使得模型在保持强大性能的同时，大幅降低了计算成本和推理延迟。通过激活参数的高效设计，MiniMax实现了智能、速度和成本的最佳平衡。

M2的核心设计理念是为了满足人们的需求，团队要求首先能够自己使用它。

为此，MiniMax的开发者，包括业务和后端团队的成员，与算法工程师一起，投入了大量精力构建环境和评估体系，并越来越多地将其集成到日常工作中。

在掌握这些复杂场景后，MiniMax发现将积累的方法迁移到传统大模型任务（如知识和数学）上，可以自然地获得优异结果。

M2具备三个对Agent至关重要的关键能力：编程、工具使用和深度搜索。

在工具使用和深度搜索方面的能力非常接近海外顶级模型，在编程方面虽然略逊于顶级海外模型，但已经在中国市场处于领先地位。

在编程能力方面，M2专为端到端开发工作流而构建，在Claude Code、Cursor、Cline、Kilo Code和Droid等各种应用中表现出色。

在Agent性能方面，M2展示了出色的规划和稳定执行复杂长链工具调用任务的能力，能够协调调用Shell、浏览器、Python代码解释器和各种MCP工具。

M2在性能和成本上找到了平衡点

MiniMax M2在多个权威基准测试中表现优异。

根据Artificial Analysis的基准测试，该模型集成了10个测试任务，M2在全球排名前五。

在编程和Agent相关的基准测试中，M2刷新了开源模型SOTA。

MiniMax M2在定价策略上具有显著优势。

模型API价格设定为每百万输入令牌0.30美元，每百万输出令牌1.20美元。

这一价格是Claude 3.5 Sonnet的8%，同时提供近两倍的推理速度。

主流模型的推理速度通常在50-80 TPS之间。MiniMax M2提供的在线推理服务TPS（每秒token数）约为100，并且正在快速提升。

MiniMax从两个角度分析了这种价格和推理速度的组合。

一个是价格与性能的关系。合适的模型应该具有良好的性能且价格合理，在下图中应落在绿色区域。这里使用Artificial Analysis上10个测试集的平均分数来代表性能。

另一个是价格与推理速度的关系。部署模型时，通常存在权衡：较慢的推理速度可以带来较低的价格。理想的模型应该既便宜又快速。MiniMax比较了几种代表性模型。

任何人都可以部署和使用它

MiniMax M2提供了多种部署和使用方式，满足不同用户的需求。

模型权重已在Hugging Face上开源，开发者可以自行部署。

用户可以从Hugging Face仓库下载模型权重：

https://huggingface.co/MiniMaxAI/MiniMax-M2

MiniMax推荐使用vLLM或SGLang来部署M2。

vLLM是一个快速且易于使用的大语言模型推理和服务库，最初由加州大学伯克利分校Sky Computing Lab开发。它具有PagedAttention等高效内存管理功能，支持动态批处理和流式响应。

vLLM部署指南：

https://huggingface.co/MiniMaxAI/MiniMax-M2/blob/main/docs/vllm_deploy_guide.md

SGLang是一个为大型语言模型和视觉语言模型设计的高性能服务框架。它旨在提供低延迟和高吞吐量的服务，核心功能包括快速后端运行时，提供带有RadixAttention的前缀缓存、零开销CPU（中央处理器）调度器等。

SGLang部署指南：

https://huggingface.co/MiniMaxAI/MiniMax-M2/blob/main/docs/sglang_deploy_guide.md

为了获得最佳性能，MiniMax推荐使用以下推理参数：

temperature=1.0, top_p = 0.95, top_k = 20

工具调用是Agent功能的核心，MiniMax提供了详细的工具调用指南：

https://huggingface.co/MiniMaxAI/MiniMax-M2/blob/main/docs/tool_calling_guide.md

基于M2模型，MiniMax推出了Agent产品，在中国市场发布了新版，并升级了海外版本。

通用Agent产品MiniMax Agent现已全面开放使用，限时免费：

https://agent.minimax.io/

MiniMax Agent提供两种模式：闪电模式和专业模式。

闪电模式是一种高效、高速的Agent，适用于对话问答、轻量级搜索和简单编码任务等即时输出场景。它通过强大的Agent能力增强了对话产品的体验。

专业模式提供专业的Agent能力，在复杂、长时间运行的任务上实现最佳性能。它擅长深度研究、全栈开发、创建PPT/报告、Web开发等任务。

MiniMax-M2 API已在MiniMax开放平台上提供，也限时免费：

https://platform.minimax.io/docs/api-reference/text-anthropic-api

对于开发者而言，M2提供了一个高性能、低成本的AI模型选择。特别是在Agent和代码生成任务中，M2的表现接近顶级模型，但成本仅为后者的零头。这使得个人开发者和小型企业也能够构建复杂的AI应用。

对于企业用户，M2提供了一个平衡性能、成本和速度的解决方案。企业可以用更低的成本部署AI Agent，提高业务效率。MiniMax内部已经使用这些Agent来处理各种复杂任务，从数据分析到人力资源筛选，证明了其在实际业务中的价值。

AI技术正在朝着更加普惠、实用的方向发展。

参考资料：

https://www.minimax.io/news/minimax-m2

https://artificialanalysis.ai/models

https://artificialanalysis.ai/methodology/intelligence-benchmarking

https://huggingface.co/MiniMaxAI/MiniMax-M2

https://github.com/MiniMax-AI/MiniMax-M2

https://www.modelscope.cn/organization/MiniMax

报告下载

大佬观点分享

关于RPA、AI、企业数字化转型

(点击文字即可阅读)

| |

| | |

| | |

| | |

| |

行业知识交流分享，结识扩展人脉圈层

公众号后台回复【RPA】或者【流程挖掘】

可受邀加入相关的交流群

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

澳洲放羊大叔引爆AI编程革命！Claude Code急推goal模式，不干完不许停

新智元 2026-05-13 18:31:06
117 跟贴 117
AI相对论②丨智驾进入数据驱动时代，能落地的L3必须具备L4能力

每日经济新闻 2026-05-13 12:29:08
0 跟贴 0

8岁小学生idea直接变应用，秒哒3.0刚刚把AI应用门槛打没了

量子位 2026-05-13 22:05:37
6 跟贴 6

李彦宏：别盯着token了，AI时代要看日活智能体数

智东西 2026-05-13 13:57:12
0 跟贴 0
AI抠图GitHub爆火！实测3款开源工具：快是真快，糙也是真糙

雷科技 2026-05-13 20:07:54
0 跟贴 0

AI价值度量衡是时候重写了

虎嗅APP 2026-05-13 18:25:08
0 跟贴 0

从“人人都是开发者”到“人人都是超级个体”：百度AI认知的三年跃迁

每日经济新闻 2026-05-13 19:21:10
0 跟贴 0
当 AI Agent 走向无处不在，MediaTek 想做的不只是手机芯片

爱范儿 2026-05-13 14:38:12
0 跟贴 0

大神程序员蒸馏自己，用16个skill给AI注入软件工程之魂

量子位 2026-05-12 03:08:58
0 跟贴 0
支持远程操控和通用GUI操作3

机器之心Pro 2026-03-02 13:36:13
0 跟贴 0
挑战扩散自回归！字节提出视觉生成第三种路线，让模型边画边改

量子位 2026-05-13 21:52:31
2 跟贴 2
Agent输出到底该用谁？卡帕西转发：试试让AI输出HTML

量子位 2026-05-13 07:19:50
0 跟贴 0
英伟达押注AlphaGo研发主管新公司摸索大模型行业未来前沿

财联社 2026-05-14 00:32:11
0 跟贴 0
xAI正加紧推动华尔街公司使用Grok聊天机器人

财联社 2026-05-14 03:57:12
0 跟贴 0
8岁小孩哥「聊出」操作系统，一部手机、几句话，原生App直接生成

机器之心Pro 2026-05-13 22:01:47
0 跟贴 0
00后小哥复刻Claude最强神话模型OpenMythos

量子位 2026-04-23 11:44:18
0 跟贴 0
这个时代必须以Agent为中心：三个趋势回顾

量子位 2026-04-05 02:14:15
0 跟贴 0
AI Agent是科技革命中的一次真正的范式转移

量子位 2026-04-03 22:52:35
0 跟贴 0
拒绝盲目猜token，阿里x浙大将投机解码带入弹性预算时代

机器之心Pro 2026-05-13 13:39:40
0 跟贴 0
游戏AI如何下棋：从Minimax到Alpha-Beta剪枝

硬核玩家2哈 2026-05-11 11:52:47
0 跟贴 0
豆包收费了！大模型将告别免费时代？有何考量？

大象新闻 2026-05-13 10:26:14
6920 跟贴 6920
客户交付Agent设计：别把草稿层当真相库

野生运营 2026-05-14 07:28:55
0 跟贴 0
俄军："世界上最强大导弹"试射成功射程超35000公里

红星新闻 2026-05-13 13:21:19
39693 跟贴 39693
国外技术就是强悍，瑞士自动迫击炮系统，中国目前很难达到

松离搞笑家 2026-05-12 16:30:44
3 跟贴 3
一只太空螃蟹教孩子学Rust：20章故事书有了双语交互版

硅屿手记 2026-05-12 06:56:22
0 跟贴 0
一个Perl编程题里的职场暗讽

Ping值焦虑 2026-05-14 07:48:42
0 跟贴 0
黄仁勋100万亿预言兑现！易鑫Voice Agent落地，汽车金融迎效率革命

新智元 2026-05-13 12:11:37
0 跟贴 0
这东西零技术，一百年前别人不玩的东西！它们说是遥遥领先！

搞笑者大联盟 2026-05-13 09:46:55
3 跟贴 3
UE 5.8预览版来了：Mesh Terrain是亮点，但MegaLights才真香

雾野寻踪2 2026-05-12 23:22:44
0 跟贴 0
美国最大医保拒付工厂：1亿人看病要经过这家公司的算法

我是一个粉刷匠2 2026-05-14 06:55:00
0 跟贴 0
汉王发了款能录音的墨水屏：AI一键写周报、出纪要，接入三款主流大模型

智东西 2026-05-13 18:02:14
0 跟贴 0
首届 Agent 坦克大战，你要不要来玩？

有机大橘子 2026-05-14 07:26:24
0 跟贴 0
Kimi总裁张予彤北大实录：我们想要有抽象能力和偏执的人｜甲子光年

甲子光年 2026-05-13 19:23:59
0 跟贴 0
没人看你的时候，创作才真正开始

晚风也遗憾 2026-05-14 06:41:38
0 跟贴 0
我用Claude+Trello+Zapier自动写客户周报

硬核玩家2哈 2026-05-14 06:32:57
0 跟贴 0
Lizzo怒斥算法歧视：新专辑没人知道要发了

热搜摘要官 2026-05-14 06:44:47
0 跟贴 0
700万刀成本时代，这位老炮说AI"没有创作灵魂"

奶凶的小霸王 2026-05-14 03:48:43
0 跟贴 0
四川唯一！“经纶”中国经济学大模型亮相2026世界数字教育大会

封面新闻 2026-05-13 10:44:04
0 跟贴 0
单Agent时代正式结束：一个干不过，就上300个-3

机器之心Pro 2026-04-22 00:08:00
0 跟贴 0
聪明的战士驾驶智能鱼雷，炸毁鬼子的军舰

影中见影 2026-05-12 19:05:11
2 跟贴 2

小米一审胜诉，4个自媒体被判道歉+赔偿

小米一审胜诉，4个自媒体被判道歉+赔偿

敖博管理

2026-05-13 11:45:47

曾发涉港不当言论！NBA名记Shams：76人队解雇总经理莫雷

曾发涉港不当言论！NBA名记Shams：76人队解雇总经理莫雷

全景体育V

2026-05-13 08:14:35

广东回基地众人迎接！各将情绪不佳，杜锋拥抱奎因，陆续有人离开

广东回基地众人迎接！各将情绪不佳，杜锋拥抱奎因，陆续有人离开

篮球资讯达人

2026-05-13 23:22:28

流量喧嚣下，莫忘真正价值所在

烽火瞭望者

2026-05-13 08:55:09

“戏混子”没走，比资本家丑孩子更可怕的是“星二代”开始世袭了

“戏混子”没走，比资本家丑孩子更可怕的是“星二代”开始世袭了

流史岁月

2026-01-26 10:58:30

命丧黎明！德黑兰处决29岁卫星天才：被控美国间谍，临刑前喊冤

命丧黎明！德黑兰处决29岁卫星天才：被控美国间谍，临刑前喊冤

兵鉴史

2026-05-14 07:12:43

拿没教养当个性！白鹿更多黑历史被扒，欺负李晨已掉粉20万

拿没教养当个性！白鹿更多黑历史被扒，欺负李晨已掉粉20万

林轻吟

2026-05-14 07:30:39

明明有133套汤臣一品的房子，却过得想自杀，一个月才花一万块钱

明明有133套汤臣一品的房子，却过得想自杀，一个月才花一万块钱

人生录

2026-05-08 19:07:58

互联网是有记忆的，她的黑历史一大堆啊！

互联网是有记忆的，她的黑历史一大堆啊！

BenSir本色说

2026-04-15 22:38:07

震惊！网传番禺老板找做饭的小姐姐，15000元月薪，注明不需陪睡

震惊！网传番禺老板找做饭的小姐姐，15000元月薪，注明不需陪睡

火山詩话

2026-05-13 08:59:22

国产CPU里程碑！这款主力芯片出货量超百万！

国产CPU里程碑！这款主力芯片出货量超百万！

Thurman在昆明

2026-05-14 05:29:46

大陆向全球通告，禁止对岸一件事，话音刚落，郑丽文火速派人来京

大陆向全球通告，禁止对岸一件事，话音刚落，郑丽文火速派人来京

凡知

2026-05-13 12:49:01

4.7万亿！马斯克打破人类财富纪录：他一个人的钱抵得过160个国家

4.7万亿！马斯克打破人类财富纪录：他一个人的钱抵得过160个国家

通鉴史智

2026-03-15 11:45:00

封神之作！iPhone 20全面曝光：跳过19、干掉灵动岛、一整块玻璃

封神之作！iPhone 20全面曝光：跳过19、干掉灵动岛、一整块玻璃

明美无限

2026-05-13 18:04:31

中华人民共和国和塔吉克斯坦共和国永久睦邻友好合作条约

中华人民共和国和塔吉克斯坦共和国永久睦邻友好合作条约

新京报

2026-05-12 23:10:09

U17亚洲杯8强出炉越南力压韩国获头名 1/4决赛对阵：国足战沙特

U17亚洲杯8强出炉越南力压韩国获头名 1/4决赛对阵：国足战沙特

我爱英超

2026-05-14 07:01:39

哈里这次真把自己弄尴尬了：人还没回英国，先逼王室给梅根留面子

哈里这次真把自己弄尴尬了：人还没回英国，先逼王室给梅根留面子

白露文娱志

2026-05-12 16:32:41

瘦肚子最快的方式: 不是跑步和挨饿，而是干掉内脏脂肪！

瘦肚子最快的方式: 不是跑步和挨饿，而是干掉内脏脂肪！

运动健身号

2026-05-13 07:20:06

两岸突发一件事，大陆已下达禁令，话音刚落，郑丽文火速派人赴京

两岸突发一件事，大陆已下达禁令，话音刚落，郑丽文火速派人赴京

聊历史的阿稼

2026-05-14 06:06:56

宇树发布GD01载人变形机甲定价390万元起

宇树发布GD01载人变形机甲定价390万元起

财联社

2026-05-12 12:27:07

RPA行业生态平台

2801文章数 1268关注度

往期回顾全部

科技要闻

阿里年营收首破万亿，AI终于不再是画大饼

头条要闻

中东战火烧痛印度莫迪六天访五国要外交“救国”

头条要闻

中东战火烧痛印度莫迪六天访五国要外交“救国”

体育要闻

14年半，74万，何冰娇没选那条更安稳的路

娱乐要闻

白鹿掉20万粉，网友为李晨鸣不平

财经要闻

美国总统特朗普抵达北京

汽车要闻

C级纯电轿跑吉利银河"TT"申报图来了

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

时尚

本地

旅游

游戏

房产

专栏 | 进入心流后，不被洪流裹挟

本地新闻

用苏绣的方式，打开江西婺源

旅游要闻

泰国拟缩短93国游客免签停留期限，从60天减少至30天

三角洲行动那些玄学设定，很多玩家可能都经历过这些事情

房产要闻

卷疯了！最低杀到7字头！手握30万，海口楼市横着走！

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版