网易首页 > 网易号 > 正文 申请入驻

MiniMax上市后编程模型首次更新,智能体“打工”1小时成本1美元

0
分享至



2026年春节前夕,MiniMax正式上线新一代文本模型MiniMax M2.5。当各家大模型厂商围绕“春节档”展开密集发布与营销攻势,这款定位为“原生Agent生产级模型”的产品,正式加入这场被业界称为“AI诸神之战”的竞争。

尽管有着编程、工具调用、办公等生产力场景全球SOTA成绩,这家在资本市场备受瞩目的公司却想抛开参数规模与模型榜单的简单比拼,而是在科技圈打开另一种叙事:重新定义Agent2.0时代。

10B激活参数跑出旗舰成绩

在编程能力方面,M2.5在权威榜单SWE-Bench Verified得分80.2%、Multi-SWE-Bench得分51.3%,较上一代显著提升;在Multi-SWE-Bench等多语言复杂环境中超越Opus 4.6,达到了行业最好的水平。更重要的是,模型展现出“原生Spec能力”——在编码前主动拆解架构与功能规划,更接近真实架构师的工作模式。

工具调用和搜索能力方面,模型能够自动处理复杂任务,在BrowseComp、Wide Search等多项 Agent 任务中以更低的轮次消耗取得了更优的效果,相较于上一代模型表现提升20% ,达到了行业顶尖水平。


办公场景中,在 Word、PPT、Excel 金融建模等 Workspace 高阶场景中取得了显著的能力提升,在测评框架GDPval-MM与主流模型的对比取得了 59.0%的平均胜率。

极致推理重构Agent经济

性能之外,M2.5的另一核心亮点在于极致的推理速度与成本控制。M2.5-lightning版本支持100 TPS以上输出速度,是主流模型的2倍左右;输入价格约0.3美元/百万Token,输出约2.4美元/百万Token。按每秒输出100 Token计算,连续运行一小时成本约1美元;若按50 Token计算,成本约0.3美元。

这意味着1万美元理论上可支持4个Agent连续工作一年。MiniMax方面认为,当性能与成本不再构成约束,Agent规模化部署的经济模型将发生根本变化。

在Vibecoding(氛围编程)越来越火的当下,M2.5的极致性价比可谓直接定义了真实世界工作王者。

独创Agent RL支撑高速进化

过去108天,MiniMax从M2、M2.1迭代至M2.5,在SWE-Bench Verified成绩从69.4提升至80.2,进步曲线在同业中尤为陡峭。团队将这一跃迁归因于大规模Agent强化学习(RL Scaling)。

其自研Forge框架通过解耦训练引擎与Agent,实现对任意Agent脚手架和工具的泛化优化,并通过异步调度与树状合并策略实现约40倍训练加速。同时,在算法层面采用CISPO优化与过程奖励机制,缓解长上下文场景中的信用分配问题,并将“任务真实耗时”纳入奖励函数,在效果与响应速度之间取得平衡。


M2.5已于2月12日在 MiniMax Agent上线,并于13日全球开源支持本地化部署。不到一天,来自全世界的用户已经在MiniMax Agent上构建了1万多个专家,且仍在快速增长。

MiniMax表示,希望在持续提升模型能力的同时,构建一个可持续扩展的Agent生态-Agent Universe。当模型能力、泛化性和成本都不再是瓶颈,Agent渗透到工作和生活的各个角落——从编程、办公到创作、娱乐,大幅促进Agentic应用的进一步发展。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
白发长哪里,病就藏哪里!别不信,你的身体早已通过白发向你“报警”!

白发长哪里,病就藏哪里!别不信,你的身体早已通过白发向你“报警”!

环球网资讯
2026-02-01 08:57:23
谁能想到她已经62了,说18都有人信,怎么做到这么好的状态的

谁能想到她已经62了,说18都有人信,怎么做到这么好的状态的

白宸侃片
2026-02-11 11:56:19
詹姆斯连续20年已中断!杜兰特连续17年场均25+,还能保持多久?

詹姆斯连续20年已中断!杜兰特连续17年场均25+,还能保持多久?

无术不学
2026-02-14 11:34:15
败光百亿消失?花大价钱娶车晓的前山西首富李兆会,到底去了哪里

败光百亿消失?花大价钱娶车晓的前山西首富李兆会,到底去了哪里

无心小姐姐
2026-02-04 08:07:58
东海对峙名场面!美航母北上挑衅,4艘055 大驱携辽宁号亮剑

东海对峙名场面!美航母北上挑衅,4艘055 大驱携辽宁号亮剑

趣生活
2026-02-14 11:54:31
对手脱靶,中国女子冰壶8-7逆境绝杀东道主,拿到循环赛第二

对手脱靶,中国女子冰壶8-7逆境绝杀东道主,拿到循环赛第二

真理是我亲戚
2026-02-14 20:49:01
距离过年仅剩2天,81岁李谷一传来坏消息,不参加春晚,原因曝光

距离过年仅剩2天,81岁李谷一传来坏消息,不参加春晚,原因曝光

小娱乐悠悠
2026-02-15 00:44:36
微软人工智能CEO:最快1年,大部分白领工作会被AI完全自动化

微软人工智能CEO:最快1年,大部分白领工作会被AI完全自动化

红星新闻
2026-02-14 13:52:23
泪目!蹲在高速服务区的蓝猫苦等主人,300公里奔赴的拥抱看哭了

泪目!蹲在高速服务区的蓝猫苦等主人,300公里奔赴的拥抱看哭了

夜深爱杂谈
2026-02-05 22:37:04
不训练时搬砖、挖土豆!37岁韩国选手参加4届冬奥会终摘银,颁奖台上跪谢家人

不训练时搬砖、挖土豆!37岁韩国选手参加4届冬奥会终摘银,颁奖台上跪谢家人

红星新闻
2026-02-14 11:45:42
欧盟一夜变天!德法牵头六国另立山头,双速欧洲把东欧踢出群聊?

欧盟一夜变天!德法牵头六国另立山头,双速欧洲把东欧踢出群聊?

阿讯说天下
2026-02-14 14:46:04
长存、长鑫移出黑名单!

长存、长鑫移出黑名单!

EETOP半导体社区
2026-02-14 08:53:26
杜锋拒换萨林杰,山东报价戴维斯,浙江外援2选1,深圳裁马里奇

杜锋拒换萨林杰,山东报价戴维斯,浙江外援2选1,深圳裁马里奇

懂球社
2026-02-14 00:09:47
电动车或将淘汰,替代品已出现,不充电不怕冷,续航超过100公里

电动车或将淘汰,替代品已出现,不充电不怕冷,续航超过100公里

小怪吃美食
2026-02-13 16:02:11
谢贤前女友接连爆料谢家隐私,坦言很想结婚生子,但没合适人选

谢贤前女友接连爆料谢家隐私,坦言很想结婚生子,但没合适人选

杜鱂手工制作
2026-02-14 23:45:00
年收1.75亿!曾是中国“最难喝的饮料”,如今被“老广人”买疯了

年收1.75亿!曾是中国“最难喝的饮料”,如今被“老广人”买疯了

墨印斋
2026-02-13 11:30:04
斯大林死在地上10小时,满身屎尿没人管:那个让世界害怕的人。

斯大林死在地上10小时,满身屎尿没人管:那个让世界害怕的人。

房产衫哥
2026-02-13 17:22:30
蓝营国民党总算是有了两个好消息,台北、新北稳了!

蓝营国民党总算是有了两个好消息,台北、新北稳了!

总在茶余后
2026-02-15 00:06:14
江苏小伙开直升飞机回家过年,开车3小时的路程,只花了50分钟:“从未经历春运是人生一大遗憾”

江苏小伙开直升飞机回家过年,开车3小时的路程,只花了50分钟:“从未经历春运是人生一大遗憾”

观威海
2026-02-14 17:22:23
铁了心对付中国?暴跌58%,俄罗斯大幅加税,中国汽车栽得太冤了

铁了心对付中国?暴跌58%,俄罗斯大幅加税,中国汽车栽得太冤了

爱吃醋的猫咪
2026-02-01 19:36:46
2026-02-15 01:24:49
文汇报 incentive-icons
文汇报
华语世界高品质人文阅读平台
270828文章数 309905关注度
往期回顾 全部

科技要闻

字节跳动官宣豆包大模型今日进入2.0阶段

头条要闻

福州街头发现一流浪老人身份成谜 程序员精准破解方言

头条要闻

福州街头发现一流浪老人身份成谜 程序员精准破解方言

体育要闻

最戏剧性的花滑男单,冠军为什么是他?

娱乐要闻

春晚第五次联排路透 明星积极饭撒互动

财经要闻

谁在掌控你的胃?起底百亿"飘香剂"江湖

汽车要闻

星光730新春促销开启 80天销量破2.6万台

态度原创

教育
亲子
旅游
房产
军事航空

教育要闻

学校又被投诉了!

亲子要闻

就不睡,你崩了我得了呗!

旅游要闻

文旅业者勿因一时之利砸了长期饭碗

房产要闻

三亚新机场,又传出新消息!

军事要闻

钓鱼岛、黄岩岛、仁爱礁已充满中国年味

无障碍浏览 进入关怀版