网易首页 > 网易号 > 正文 申请入驻

MiniMax训练推理模型仅花384万,售价对标豆包

0
分享至

DeepSeek掀起推理模型热潮近半年之后,MiniMax于6月17日发布并开源其首款推理模型M1。按照官方说法,M1一项显著优势是支持目前业内最高的100万Token的上下文输入长度——为DeepSeek R1的8倍,以及业内最长的8万Token的推理输出。

据MiniMax解释,这主要得益于模型架构的创新。技术报告显示,M1模型采用了混合专家(Mixture-of-Experts, MoE)架构,并结合了一种新型的“闪电注意力”(Lightning Attention)机制。

MoE架构类似于“专家咨询小组”,当用户有问题输入,模型会“邀请”(激活)最适合的几个专家参与“讨论”(推理输出),从而节省资源。而“闪电注意力”机制意在突破transformer传统架构记忆瓶颈,优化长文本推理时对计算资源的利用效率,提升长文本处理能力。技术报告显示,“闪电注意力”机制驱动下,生成10万token时,M1所需推理算力仅为DeepSeek R1 的25%。

长文本处理能力对AI智能体的发展至关重要,可增强智能体的长期记忆力,实现多步骤操作。MiniMax此前提到,不管是单Agent的系统需要持续的记忆,还是多Agent的系统中Agent之间大量的相互通信,都需要越来越长的上下文。

基于架构等技术上的创新,MiniMax透露,M1模型的整个强化学习训练阶段,仅在512张英伟达H800 GPU上用时三周完成,租赁成本仅为53.47万美元(约为384万元人民币)。

MiniMax表示,因为相对高效的训练和推理算力使用,公司以业内最低的价格在官网提供M1模型的API服务。具体而言,在0-32k的输入长度的时候,输入0.8元/百万token,输出8元/百万token;在32k-128k的输入长度的时候,输入1.2元/百万token,输出16元/百万token;在最长的128k-1M 的输入长度的时候,输入2.4元/百万token,输出24元/百万token。

记者注意到,MiniMax采取的“区间定价”的策略,和近期豆包大模型1.6的做法类似。豆包将价格区间为0-32k、32K-128K与128K-256K。256K即为豆包大模型1.6支持的最大上下文长度。此外,MiniMax三个区间的价格和豆包大模型1.6的价格完全一致。

火山引擎总裁谭待6月11日公开解释说,一些模型厂商会根据是否启用深度思考或多模态功能来差异化定价。然而,对于同结构、同参数的模型而言,真正影响成本的关键因素并不是这些功能,而是上下文窗口的长度——成本随长度增加而递增。实践中,企业的大部分模型调用,其输入长度范围都在32K以内。

谭待认为,区间定价的新模式,能够让多模态深度思考模型得到更广泛的调用,从而加速AI智能体的大规模应用。这是因为,Agent执行任务的Token消耗量大,降低Token成本尤为关键。

值得一提的是,MiniMax在B端上走纯API的商业模式,不会像另一家大模型头部公司智谱那样提供定制化服务。

MiniMax内部模型团队大致分为文本模型、视觉模型(视频图像模型)和语音模型三大板块,每一模型类别下目前均有对应的C端产品。

除了此次发布的推理模型M1,MiniMax预告接下来连续四个工作日会有其他更新。据记者了解,其他更新与MiniMax的语音、视频等模型相关。

采写:南都记者 杨柳

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
一定要多存钱,大量存钱,特别是2026-2028年。

一定要多存钱,大量存钱,特别是2026-2028年。

老陆不老
2026-05-10 15:37:02
雍正王朝穿帮镜头:康熙戴劳力士忍了,乔引娣穿球鞋真忍不了

雍正王朝穿帮镜头:康熙戴劳力士忍了,乔引娣穿球鞋真忍不了

杰丝聊古今
2026-03-29 07:16:55
三星掌门人李在镕股票市值首次超过50万亿韩元 是一年前3倍多

三星掌门人李在镕股票市值首次超过50万亿韩元 是一年前3倍多

TechWeb
2026-05-12 17:51:03
《GTA6》首发无PC引众怒!玩家怒批R星与时代脱节!硬盘瑟瑟发抖!游戏容量近200GB!

《GTA6》首发无PC引众怒!玩家怒批R星与时代脱节!硬盘瑟瑟发抖!游戏容量近200GB!

Steam社区
2026-05-10 11:51:37
黄一鸣闺蜜撕破脸!曝其抢男友吸毒,闪闪生父疑似还不是王思聪

黄一鸣闺蜜撕破脸!曝其抢男友吸毒,闪闪生父疑似还不是王思聪

趣味八卦
2026-05-11 23:25:11
女人想你了,往往会给你发出两个信号

女人想你了,往往会给你发出两个信号

心理观察局
2026-05-11 10:00:10
乌军指挥官:前线士兵月薪不到1400美元,谁还守1500公里战线

乌军指挥官:前线士兵月薪不到1400美元,谁还守1500公里战线

桂系007
2026-05-12 05:26:17
女子因桃花眼走红,订婚两年热度依旧,网友喊话:88号快回来上班

女子因桃花眼走红,订婚两年热度依旧,网友喊话:88号快回来上班

梅子的小情绪
2025-12-19 14:04:18
5月12日,人社部、财政部关于2026年调整养老金通知下发了吗?

5月12日,人社部、财政部关于2026年调整养老金通知下发了吗?

虎哥闲聊
2026-05-12 14:55:31
女乘客情绪激动,暴雨中两次强行开门!“她说要去深圳湾”,司机立即报警

女乘客情绪激动,暴雨中两次强行开门!“她说要去深圳湾”,司机立即报警

南方都市报
2026-05-11 21:36:42
奥莱:阿根廷6位冠军成员无缘世界杯,迪巴拉最让人遗憾

奥莱:阿根廷6位冠军成员无缘世界杯,迪巴拉最让人遗憾

梦忆之浅
2026-05-13 01:19:09
陕西省西安市发布雷雨大风黄色预警信号

陕西省西安市发布雷雨大风黄色预警信号

北青网-北京青年报
2026-05-12 20:46:07
这封贺电不简单,莫扯什么中俄朝铁三角,中国不替别人的战争买单

这封贺电不简单,莫扯什么中俄朝铁三角,中国不替别人的战争买单

指忘崖
2026-05-09 15:23:22
孩子是来报恩还是讨债,出生时四个行为就能看出,万不可忽视

孩子是来报恩还是讨债,出生时四个行为就能看出,万不可忽视

阿郑的读书日常
2025-05-07 14:51:32
赵祥松|14岁“神童”手搓涡喷发动机,一场漏洞百出的包装表演

赵祥松|14岁“神童”手搓涡喷发动机,一场漏洞百出的包装表演

祥松谈
2026-05-02 15:01:46
国际乒联主席提条件:樊振东可以参加2028奥运会,但有个前提

国际乒联主席提条件:樊振东可以参加2028奥运会,但有个前提

三十年莱斯特城球迷
2025-12-16 23:09:38
iPhone 17系列最新销量出炉,可以用恐怖来形容

iPhone 17系列最新销量出炉,可以用恐怖来形容

科技锋说
2026-05-12 13:47:18
深夜街头的温柔杀!熟女的蜜桃粉穿搭,把纯欲风玩明白了

深夜街头的温柔杀!熟女的蜜桃粉穿搭,把纯欲风玩明白了

只要高兴就好
2026-05-11 21:08:05
曾是上海富豪,手握4家公司3家工厂,还上过央视,晚年却如此落魄

曾是上海富豪,手握4家公司3家工厂,还上过央视,晚年却如此落魄

混沌录
2026-04-14 20:27:07
教育部部长怀进鹏:要促进教师通科技、善引导、有温度

教育部部长怀进鹏:要促进教师通科技、善引导、有温度

澎湃新闻
2026-05-12 16:06:34
2026-05-13 03:12:49
南方都市报 incentive-icons
南方都市报
换一种方式,南都在现场。
610872文章数 3588529关注度
往期回顾 全部

科技要闻

宇树发布载人变形机甲,定价390万元起

头条要闻

特朗普称将同中方讨论对台军售和黎智英案 外交部回应

头条要闻

特朗普称将同中方讨论对台军售和黎智英案 外交部回应

体育要闻

骑士终于玩明白了?

娱乐要闻

白鹿风波升级!掉粉20万评论区沦陷

财经要闻

利润再腰斩 京东干外卖后就没过过好日子

汽车要闻

吉利银河“TT”申报图曝光 电动尾翼+激光雷达

态度原创

数码
健康
时尚
教育
军事航空

数码要闻

看电视的人越来越多了 3亿台电视在线 小米第一

干细胞能让人“返老还童”吗

普通人真该学学如何穿搭!多穿裙子比裤子更时髦,大方提气质

教育要闻

求求你试试「5+1+1」学习法!!!

军事要闻

知情人士披露:美国或考虑恢复对伊朗军事行动

无障碍浏览 进入关怀版