网易首页 > 网易号 > 正文 申请入驻

实测MiniMax M2:与Gemini和Claude正面刚 ,任务拆解与变通能力有所提升

0
分享至


蓝鲸新闻10月28日讯(记者 武静静)上海的人工智能初创公司 MiniMax 于 2025 年 10 月 27 日发布了其最新大型语言模型 MiniMax M2。该模型基于 MIT 开源许可证,采用 2300 亿参数的混合专家(Mixture-of-Experts)架构,单次推理时激活约 100 亿参数。

目前MiniMax M2 目前已通过 MiniMax API 向全球开发者免费开放,试用期至 2025 年 11 月 7 日,并兼容 Hugging Face 与 vLLM 等主流框架。

据MiniMax公布的技术报告,该模型在全球权威测评榜单Artificial Analysis中总分位列全球前五、开源第一,与OpenAI、Anthropic、Google等国际巨头同台竞技。其在推理与代码生成任务中的表现超过了谷歌的 Gemini 2.5 Pro,API 使用成本约为 Anthropic Claude Sonnet 4.5的 8%。

MiniMax M2究竟表现如何,蓝鲸科技记者进行了一手实测。

在实验中,当记者向 M2 提供一条关于"制作美术爱好者个人网站"的 Agent 指令后,系统迅速理解需求并自动定义目标任务,生成了多阶段的执行计划。整个任务被拆解为近10 个步骤,包括内容生成、前端结构设计、样式渲染、资源调用等环节。右侧窗口实时显示 Agent 的执行进程,从任务分解到页面生成,几乎全程自动化完成。



几分钟后,一个包含图片展示与作品介绍的网页初版便被生成。由于目前的 Agent 运行在云端沙盒环境中,模型无法直接输出可公开访问的链接。当记者于是进一步提出指令:"直接给我生成一个可以打开的网站链接。" M2 的响应逻辑相对完整——它不仅列出了几种主流的免费部署方案,例如 Vercel(自动部署)、Netlify(拖拽部署) 和 GitHub Pages(免费托管),还进一步提供了一种无需联网的替代方案:生成一个可离线打开的单文件版网站,供用户直接下载与预览。这种像人一样灵活应变能力有点惊艳。


不过在第一次打开该文件时,发现页面出现了乱码。向 Agent 反馈后,M2 立即识别出问题可能与编码或浏览器设置有关,自动进入问题排查流程。经过几轮自动修复与重新生成,Agent 最终输出了一个结构清晰、样式统一、视觉审美在线的网页版本。从用户体验角度看,这种问题响应与动态调整的能力,已接近一个轻量级网页开发助手的水平。

以下是网页的部分展示:




除了网页生成,MiniMax M2 的 Agent 系统已覆盖更广泛的任务类型。它可以进行跨领域的多步推理、代码生成、数据分析、文案策划与知识检索等复杂任务。从技术上看,MiniMax 在 M2 阶段已将语言理解、工具调用与执行链控制能力进行深度融合,具备了端到端完成任务的雏形。


这也呼应了 2025 年以来 AI Agent 的快速进化趋势。过去一年里,从 OpenAI 的新工具到 Anthropic 的大规模融资,再到国内外多家推出的多智能体框架,Agent 已成为行业最活跃的创新方向之一——模型从"回答问题"迈向"执行任务"。OpenAI 在其 Demo Day 中推出了名为 AgentKit的 Agent 构建工具,包括可视化 "Agent Builder" 拖拽节点、工具连接器库、服务数据源快速接入等组件,进一步强调其向企业级 Agent 平台转型的意图。

不过,目前 Agent 的端到端执行仍存在差距。以记者此前一次具体测试为例:曾尝试让 Kimi 与 Manus 等 Agent 做"备份一位名人的新浪博客文章"的任务。尽管任务逻辑清晰,但实际执行效果有限。Kimi 的 Agent 仅找到了约 7 篇文章 并成功导出至 Word 文档;Manus 的表现稍优,备份了 29 篇,但仍遗漏若干条目。相比之下,MiniMax M2 的 Agent 能否在执行完整度、上下文理解与任务控制上实现提升,正是其下一步验证的关键。

换句话说,Agent 虽能拆解任务、调用工具、做出执行计划,但在 "全流程闭环" 上仍有短板:可能是数据来源覆盖不全、上下文理解欠缺、执行链中断、后处理不够完善。与大型语言模型仅作问答相比,Agent 承载的是"执行任务"的期望,而这要求更高的模型整合能力、工具生态支撑、运行监控和反馈闭环。

在此背景下评测MiniMax M2模型,不仅要关注其技术参数,更要考察其智能体在复杂任务中的实际表现、工具生态的完善程度以及商业模式的可持续性——这些维度将共同决定其在激烈市场竞争中的真实价值。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
鹅肉立大功!中科院研究发现:鹅肉可促进免疫细胞再生,可多吃

鹅肉立大功!中科院研究发现:鹅肉可促进免疫细胞再生,可多吃

Thurman在昆明
2026-04-23 17:05:10
250万赔偿不算啥?官方介入,崔丽丽事件“创先河”,释放3大信号

250万赔偿不算啥?官方介入,崔丽丽事件“创先河”,释放3大信号

天天热点见闻
2026-04-25 06:27:01
火箭G3输球多离谱?胜率99.94%都能搞砸 耻辱比肩2024年尼克斯

火箭G3输球多离谱?胜率99.94%都能搞砸 耻辱比肩2024年尼克斯

罗说NBA
2026-04-25 17:35:25
震惊!网传云南某明星演唱会,因舞台像某标志被叫停,真相来了…

震惊!网传云南某明星演唱会,因舞台像某标志被叫停,真相来了…

火山詩话
2026-04-24 10:39:54
成都这把火5死2伤,人是怎么死的,又是电瓶车?

成都这把火5死2伤,人是怎么死的,又是电瓶车?

靠山屯闲话
2026-04-25 13:50:44
19岁女孩失控的人生:14个月在直播间豪掷1700万公款

19岁女孩失控的人生:14个月在直播间豪掷1700万公款

潇湘晨报
2026-04-24 22:36:30
英超-阿森纳3-0纽卡斯尔:争冠未失主动,枪手捞净胜球|前瞻

英超-阿森纳3-0纽卡斯尔:争冠未失主动,枪手捞净胜球|前瞻

体育世界
2026-04-25 15:51:42
老外震惊!中国馒头横扫欧美!不是文化输出,是中国供应链赢麻了

老外震惊!中国馒头横扫欧美!不是文化输出,是中国供应链赢麻了

魔都姐姐杂谈
2026-04-24 11:56:08
悲催!浙江一女子出轨,丈夫直言婚姻本就是一场赌注,放手去爱吧

悲催!浙江一女子出轨,丈夫直言婚姻本就是一场赌注,放手去爱吧

火山詩话
2026-04-25 16:19:12
成都二环高架货车侧翻 记者实地探访:杉板桥立交暂时封闭

成都二环高架货车侧翻 记者实地探访:杉板桥立交暂时封闭

封面新闻
2026-04-25 17:18:09
为什么你的电量焦虑出国就消失?

为什么你的电量焦虑出国就消失?

晚风也遗憾
2026-04-24 09:04:51
演都不演了!电诈园松口放人前,先提了一个要求,父亲察觉不对劲

演都不演了!电诈园松口放人前,先提了一个要求,父亲察觉不对劲

八斗小先生
2026-04-25 13:55:54
发现一个现象:根据历史规律,中国可能成地球上最后一个超级大国

发现一个现象:根据历史规律,中国可能成地球上最后一个超级大国

鹤羽说个事
2026-04-23 22:45:59
90%订单消失,中东旺季没了

90%订单消失,中东旺季没了

中国新闻周刊
2026-04-25 07:28:04
触碰红线,华晨宇抚仙湖演唱会被立刻叫停,原因被扒,令人唏嘘

触碰红线,华晨宇抚仙湖演唱会被立刻叫停,原因被扒,令人唏嘘

许三岁
2026-04-24 22:36:22
穆杰塔巴伤情曝光,比外界想象的更严重,他用了一招终结斩首战术

穆杰塔巴伤情曝光,比外界想象的更严重,他用了一招终结斩首战术

温读史
2026-04-25 01:18:21
中国第四艘航母官宣:是核动力!舷号19,命名大概率是“江苏号”

中国第四艘航母官宣:是核动力!舷号19,命名大概率是“江苏号”

谛听骨语本尊
2026-04-25 14:44:21
成龙和克里斯·塔克因不满片酬,已拒绝《尖峰时刻4》的初步邀约;特朗普曾催拍《尖峰时刻4》,渴望让传统男子气概在好莱坞文化中重现光彩

成龙和克里斯·塔克因不满片酬,已拒绝《尖峰时刻4》的初步邀约;特朗普曾催拍《尖峰时刻4》,渴望让传统男子气概在好莱坞文化中重现光彩

鲁中晨报
2026-04-25 15:48:13
外交部一锤定音!赖清德没资格,郑丽文就算赢了选举也不认!

外交部一锤定音!赖清德没资格,郑丽文就算赢了选举也不认!

果妈聊娱乐
2026-04-25 13:48:35
两男子应聘浦发银行销售代表,通过3轮面试,做了497元体检,工资卡都办好了,银行却以学历不符为由拒绝入职

两男子应聘浦发银行销售代表,通过3轮面试,做了497元体检,工资卡都办好了,银行却以学历不符为由拒绝入职

大象新闻
2026-04-24 16:49:09
2026-04-25 18:31:00
蓝鲸新闻 incentive-icons
蓝鲸新闻
财经信息服务平台
131458文章数 193844关注度
往期回顾 全部

科技要闻

DeepSeek V4发布!黄仁勋预言的"灾难"降临

头条要闻

伊朗最高领袖一条腿截肢面部严重烧伤 通信方式披露

头条要闻

伊朗最高领袖一条腿截肢面部严重烧伤 通信方式披露

体育要闻

火箭0-3触发百分百出局定律:本季加时赛9战8败

娱乐要闻

邓超最大的幸运,就是遇见孙俪

财经要闻

90%订单消失,中东旺季没了

汽车要闻

2026款乐道L90亮相北京车展 乐道L80正式官宣

态度原创

艺术
本地
教育
游戏
亲子

艺术要闻

美国发现一部《十七帖》!这字还原真实的王羲之笔法,放大10倍仍无瑕疵

本地新闻

云游中国|逛世界风筝都 留学生探秘中国传统文化

教育要闻

秀我中国|当大学生之前,先来村小当“小先生”

《杀戮尖塔2》开发者坚称门扉缔造者强度没有问题

亲子要闻

孩子上幼儿园第一天又哭又闹?几个原因,家长提前了解

无障碍浏览 进入关怀版