网易首页 > 网易号 > 正文 申请入驻

MiniMax上市后编程模型首次更新,智能体“打工”1小时成本1美元

0
分享至




2026年春节前夕,MiniMax正式上线新一代文本模型MiniMax M2.5。当各家大模型厂商围绕“春节档”展开密集发布与营销攻势,这款定位为“原生Agent生产级模型”的产品,正式加入这场被业界称为“AI诸神之战”的竞争。

尽管有着编程、工具调用、办公等生产力场景全球SOTA成绩,这家在资本市场备受瞩目的公司却想抛开参数规模与模型榜单的简单比拼,而是在科技圈打开另一种叙事:重新定义Agent2.0时代。

10B激活参数跑出旗舰成绩

在编程能力方面,M2.5在权威榜单SWE-Bench Verified得分80.2%、Multi-SWE-Bench得分51.3%,较上一代显著提升;在Multi-SWE-Bench等多语言复杂环境中超越Opus 4.6,达到了行业最好的水平。更重要的是,模型展现出“原生Spec能力”——在编码前主动拆解架构与功能规划,更接近真实架构师的工作模式。

工具调用和搜索能力方面,模型能够自动处理复杂任务,在BrowseComp、Wide Search等多项 Agent 任务中以更低的轮次消耗取得了更优的效果,相较于上一代模型表现提升20% ,达到了行业顶尖水平。


办公场景中,在 Word、PPT、Excel 金融建模等 Workspace 高阶场景中取得了显著的能力提升,在测评框架GDPval-MM与主流模型的对比取得了 59.0%的平均胜率。

极致推理重构Agent经济

性能之外,M2.5的另一核心亮点在于极致的推理速度与成本控制。M2.5-lightning版本支持100 TPS以上输出速度,是主流模型的2倍左右;输入价格约0.3美元/百万Token,输出约2.4美元/百万Token。按每秒输出100 Token计算,连续运行一小时成本约1美元;若按50 Token计算,成本约0.3美元。

这意味着1万美元理论上可支持4个Agent连续工作一年。MiniMax方面认为,当性能与成本不再构成约束,Agent规模化部署的经济模型将发生根本变化。

在Vibecoding(氛围编程)越来越火的当下,M2.5的极致性价比可谓直接定义了真实世界工作王者。

独创Agent RL支撑高速进化

过去108天,MiniMax从M2、M2.1迭代至M2.5,在SWE-Bench Verified成绩从69.4提升至80.2,进步曲线在同业中尤为陡峭。团队将这一跃迁归因于大规模Agent强化学习(RL Scaling)。

其自研Forge框架通过解耦训练引擎与Agent,实现对任意Agent脚手架和工具的泛化优化,并通过异步调度与树状合并策略实现约40倍训练加速。同时,在算法层面采用CISPO优化与过程奖励机制,缓解长上下文场景中的信用分配问题,并将“任务真实耗时”纳入奖励函数,在效果与响应速度之间取得平衡。


M2.5已于2月12日在 MiniMax Agent上线,并于13日全球开源支持本地化部署。不到一天,来自全世界的用户已经在MiniMax Agent上构建了1万多个专家,且仍在快速增长。

MiniMax表示,希望在持续提升模型能力的同时,构建一个可持续扩展的Agent生态-Agent Universe。当模型能力、泛化性和成本都不再是瓶颈,Agent渗透到工作和生活的各个角落——从编程、办公到创作、娱乐,大幅促进Agentic应用的进一步发展。

原标题:《MiniMax上市后编程模型首次更新,智能体“打工”1小时成本1美元》

栏目主编:戎兵

本文作者:文汇报 沈湫莎

题图来源:均为受访者提供

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
1小时会晤结束,中美谈妥?华春莹离开谈判桌,王毅留下一份清单

1小时会晤结束,中美谈妥?华春莹离开谈判桌,王毅留下一份清单

东极妙严
2026-02-14 21:05:41
王毅会见美国国务卿鲁比奥

王毅会见美国国务卿鲁比奥

新华社
2026-02-14 07:49:27
NBA西部排名变动:雷霆跌出榜首,开拓者超快船,湖人胜独行侠

NBA西部排名变动:雷霆跌出榜首,开拓者超快船,湖人胜独行侠

民哥台球解说
2026-02-14 13:11:41
四渡赤水最惊人的真相:他瞒过了所有人,甚至连他自己都骗过了

四渡赤水最惊人的真相:他瞒过了所有人,甚至连他自己都骗过了

文史明鉴
2026-02-13 13:22:10
21年老店因“帅儿子”逆袭,05后男孩身高1米86,“撞脸”半个娱乐圈,评论区:婆婆我来了!

21年老店因“帅儿子”逆袭,05后男孩身高1米86,“撞脸”半个娱乐圈,评论区:婆婆我来了!

南国今报
2026-02-14 18:03:40
外媒爆料:美军正做准备,一旦特朗普下令攻击伊朗,行动可能持续数周

外媒爆料:美军正做准备,一旦特朗普下令攻击伊朗,行动可能持续数周

环球网资讯
2026-02-14 09:30:11
明朝“最懒”的对联:上联和下联一字不差,却成千古绝对流传至今

明朝“最懒”的对联:上联和下联一字不差,却成千古绝对流传至今

铭记历史呀
2026-02-03 16:11:20
钱再多有什么用?52岁刘强东上千亿身家,儿子却是他一生的遗憾

钱再多有什么用?52岁刘强东上千亿身家,儿子却是他一生的遗憾

墨印斋
2026-01-31 16:37:48
彻底卖不动了!特斯拉1月中国销量降至三年来最低点:仅售出1.8万辆

彻底卖不动了!特斯拉1月中国销量降至三年来最低点:仅售出1.8万辆

快科技
2026-02-13 11:41:18
美媒更新夺冠概率:湖人火箭均4%,骑士7%第四,联盟第一也是7%!

美媒更新夺冠概率:湖人火箭均4%,骑士7%第四,联盟第一也是7%!

你的篮球频道
2026-02-14 10:35:54
突发!阿里、百度、比亚迪等被美列入1260H名单,禁令倒计时开启

突发!阿里、百度、比亚迪等被美列入1260H名单,禁令倒计时开启

老马拉车莫少装
2026-02-14 00:00:25
24胜1负!18胜13负!NBA最危险球队诞生,不夺冠就该提前解体了

24胜1负!18胜13负!NBA最危险球队诞生,不夺冠就该提前解体了

世界体育圈
2026-02-15 00:25:09
中央定调,退休新规实施后,62岁退休比60岁退,多领10%养老金?

中央定调,退休新规实施后,62岁退休比60岁退,多领10%养老金?

夜深爱杂谈
2026-02-14 18:10:41
中国三大长寿食物,鱼只能排到第三,第一名很多人想不到!

中国三大长寿食物,鱼只能排到第三,第一名很多人想不到!

江江食研社
2026-02-12 12:30:10
儿子丢了、父亲走了、妻子跑了,央视主持张泽群如今落到这般田地

儿子丢了、父亲走了、妻子跑了,央视主持张泽群如今落到这般田地

蜉蝣说
2026-01-31 15:10:43
成都天府大道车辆碰撞事故完成责任认定!涉嫌酒驾当事人全责

成都天府大道车辆碰撞事故完成责任认定!涉嫌酒驾当事人全责

南方都市报
2026-02-14 11:31:25
上海嘉闵线项目塌陷:中国中铁子公司40天身负23起执行案

上海嘉闵线项目塌陷:中国中铁子公司40天身负23起执行案

财中社
2026-02-14 14:34:13
票房会破30亿?看完《镖人》预告,我断言:武侠片的荣光又回来了

票房会破30亿?看完《镖人》预告,我断言:武侠片的荣光又回来了

皮皮电影
2026-02-14 14:01:09
乌美俄第3轮谈判准备就绪,乌克兰军队化身浴火凤凰

乌美俄第3轮谈判准备就绪,乌克兰军队化身浴火凤凰

史政先锋
2026-02-14 18:42:24
被绑架一月,马杜罗第一通电话打给儿子:委政府在做“正确”的事

被绑架一月,马杜罗第一通电话打给儿子:委政府在做“正确”的事

观星赏月
2026-02-14 22:18:47
2026-02-15 01:11:00
上观新闻 incentive-icons
上观新闻
站上海,观天下
436254文章数 759412关注度
往期回顾 全部

科技要闻

字节跳动官宣豆包大模型今日进入2.0阶段

头条要闻

福州街头发现一流浪老人身份成谜 程序员精准破解方言

头条要闻

福州街头发现一流浪老人身份成谜 程序员精准破解方言

体育要闻

最戏剧性的花滑男单,冠军为什么是他?

娱乐要闻

春晚第五次联排路透 明星积极饭撒互动

财经要闻

谁在掌控你的胃?起底百亿"飘香剂"江湖

汽车要闻

星光730新春促销开启 80天销量破2.6万台

态度原创

游戏
数码
家居
亲子
军事航空

粉丝怒了!育碧传奇老游戏重制删原版配乐遭吐槽

数码要闻

LG新推耳机,Lite和Plus功能差异竟这么大!

家居要闻

中古雅韵 乐韵伴日常

亲子要闻

就不睡,你崩了我得了呗!

军事要闻

钓鱼岛、黄岩岛、仁爱礁已充满中国年味

无障碍浏览 进入关怀版