网易首页 > 网易号 > 正文 申请入驻

MiniMax开源4M超长上下文新模型!性能比肩DeepSeek-v3、GPT-4o

0
分享至

西风 发自 凹非寺
量子位 | 公众号 QbitAI

开源模型上下文窗口卷到超长,达400万token

刚刚,“大模型六小强”之一MiniMax开源最新模型

MiniMax-01系列,包含两个模型:基础语言模型MiniMax-Text-01、视觉多模态模型MiniMax-VL-01。

MiniMax-01首次大规模扩展了新型Lightning Attention架构,替代了传统Transformer架构,使模型能够高效处理4M token上下文。

在基准测试中,MiniMax-01性能与顶级闭源模型表现相当。

MiniMax-Text-01性能与前段时间大火的DeepSeek-V3、GPT-4o等打的有来有回:

如下图(c)所示,当上下文超过20万token,MiniMax-Text-01的优势逐渐明显。

在预填充延迟方面也有显著优势,在处理超长上下文时更高效,延迟更低:

网友直呼“难以置信”:

开放权重,拥有400万token的上下文窗口!我原本以为这可能要五年后才会实现。

官方表示,MiniMax-01是为支持之后Agent相关应用而预备的:

因为Agent越来越需要扩展的上下文处理能力和持续的内存。

目前官方还公开了MiniMax-01的68页技术论文,并且已将MiniMax-01在Hailuo AI上部署了,可免费试用。

另外,新模型API价格也被打下来了:

输入每百万token0.2美元,输出每百万token1.1美元。

下面是模型更多细节。

4M超长上下文
MiniMax-Text-01

MiniMax-Text-01,参数456B,每次推理激活45.9B。

它创新性地采用了混合架构,结合了Lightning Attention、Softmax Attention以及Mixture-of-Experts(MoE)。

并且通过LASP+、varlen ring attention、ETP等优化的并行策略和高效的计算通信重叠方法,MiniMax-Text-01训练上下文长度达100万token,推理时可以扩展到400万token上下文。

模型架构细节如下:

在Core Academic Benchmark上,MiniMax-Text-01在GPQA Diamond上获得54.4分,超越GPT-4o。

在长基准测试之4M大海捞针测试,MiniMax-Text-01一水儿全绿。

也就是说,这400万上下文里,有细节MiniMax-Text-01是真能100%捕捉到。

除此之外,还有LongBench v2、Ruler基准测试,考验的是模型长上下文理解能力,包含基于长上下文输入的逻辑推理能力。

MiniMax-Text-01模型在处理Ruler的长上下文推理任务时表现出显著的优势。

在64K输入级别的表现与顶尖模型GPT-4o、Claude-3.5-Sonnet等竞争力相当,变化微小,但从128K开始显现出明显的优势,并超越了所有基准模型。

LongBench-V2包括不同难度级别的问答任务,涵盖多种上下文类型,包括单文档和多文档、多轮对话、代码仓库和长结构化数据等。团队考虑了两种测试模式:不使用思维链推理(w/o CoT)和使用思维链推理(w/ CoT)。

MiniMax-Text-01在w/ CoT设置中实现了所有评估系统中的最佳结果,在w/o CoT中表现也很显著。

团队还用MTOB( Machine Translation from One Book)数据集评估了模型从上下文中学习的能力。

该任务要求模型在英语和Kalamang(一种在公开数据中非常有限的语言)之间进行翻译,因此在训练语料库中,LLM仅从一部语法书的部分内容和375个翻译示例中学习该语言。

测试结果显示,MiniMax-Text-01在无上下文场景下eng→kalam (ChrF)得分最低,团队认为其它模型可能是在预训练或后训练数据中集加入了kalam相关数据。在delta half book和full book上,MiniMax-Text-01超过了所有模型。

在kalam→eng(BLEURT)得分上MiniMax-Text-01也与其它模型表现相当。

MiniMax-VL-01

MiniMax-VL-01采用多模态大语言模型常用的“ViT-MLP-LLM”框架:

  • 一个具有3.03亿参数的ViT用于视觉编码
  • 一个随机初始化的双层MLP projector用于图像适配
  • 以及作为基础LLM的MiniMax-Text-01

MiniMax-VL-01特别具有动态分辨率功能,可以根据预设网格调整输入图像的大小,分辨率从336×336到2016×2016不等,并保留一个336×336的缩略图。

调整后的图像被分割成大小相同的不重叠块,这些块和缩略图分别编码后组合,形成完整的图像表示。

MiniMax-VL-01的训练数据涵盖标题、描述和指令。ViT从头开始在6.94亿图像-标题对上进行训练。在训练过程的四个阶段,处理了总计5120亿token。

最终,MiniMax-VL-01 在多模态排行榜上表现突出,证明了其在处理复杂多模态任务中的优势和可靠性。

网友们已开始第一波实测

得知新模型已在Hailuo AI上部署,网友们已紧忙赶往测试。

有网友使用相同的prompt将它和Gemini、o1对比,感叹MiniMax-01表现令人印象深刻。

下面这个测试也没能难倒它:

给我5个奇数,这些数的英文拼写中不包含字母“e”。

感兴趣的童鞋可以玩起来了。

技术论文:https://filecdn.minimax.chat/_Arxiv_MiniMax_01_Report.pdf


[1]https://x.com/MiniMax__AI/status/1879226391352549451
[2]https://huggingface.co/MiniMaxAI/MiniMax-Text-01
[3]https://huggingface.co/MiniMaxAI/MiniMax-VL-01

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
张雪峰用死驳斥了张雪峰

张雪峰用死驳斥了张雪峰

数字力场
2026-03-25 10:01:20
以色列通报全球,欲吞黎南部!伊朗划红线,欧盟紧急救场

以色列通报全球,欲吞黎南部!伊朗划红线,欧盟紧急救场

军军记录生活
2026-03-26 11:43:56
历史正在重演!犹太财团灭顶之灾进入倒计时!!

历史正在重演!犹太财团灭顶之灾进入倒计时!!

头条爆料007
2026-03-25 19:54:29
4.7万亿!马斯克打破人类财富纪录:他一个人的钱抵得过160个国家

4.7万亿!马斯克打破人类财富纪录:他一个人的钱抵得过160个国家

通鉴史智
2026-03-15 11:45:00
不吹不黑!iOS 26.4正式版体验,老iPhone直接封神

不吹不黑!iOS 26.4正式版体验,老iPhone直接封神

叮当当科技
2026-03-26 01:51:54
王菲兜兜转转半生,原来爱的始终是同一个人!谢霆锋不过是翻版

王菲兜兜转转半生,原来爱的始终是同一个人!谢霆锋不过是翻版

可乐谈情感
2026-03-26 08:37:34
欧尔班拒绝同意欧盟向乌提供900亿欧元贷款,美方回应

欧尔班拒绝同意欧盟向乌提供900亿欧元贷款,美方回应

环球网资讯
2026-03-25 11:26:19
省政府领导班子密集调整,省委常委任常务副省长

省政府领导班子密集调整,省委常委任常务副省长

上观新闻
2026-03-25 15:46:23
油头粉面别演将军!50岁何润东意外爆火,涨粉百万,项羽演技封神

油头粉面别演将军!50岁何润东意外爆火,涨粉百万,项羽演技封神

草莓解说体育
2026-03-26 11:18:27
四天619次进攻、6090人伤亡:俄春季攻势为何高伤亡低战果?

四天619次进攻、6090人伤亡:俄春季攻势为何高伤亡低战果?

高博新视野
2026-03-25 08:00:28
A股:紧急提醒股民,主力已摊牌!明天,3月26日周四尾声将至?

A股:紧急提醒股民,主力已摊牌!明天,3月26日周四尾声将至?

云鹏叙事
2026-03-26 00:00:06
李双江庆87岁大寿!怒吼要奋斗到90岁,切不动蛋糕戴玉强扶手帮忙

李双江庆87岁大寿!怒吼要奋斗到90岁,切不动蛋糕戴玉强扶手帮忙

嫹笔牂牂
2026-03-26 07:37:49
疯狂!狂轰59+10+5,场均31.8分+历史得分王,竟然打不了NBA

疯狂!狂轰59+10+5,场均31.8分+历史得分王,竟然打不了NBA

球童无忌
2026-03-26 11:10:26
等我们老了,最扎心的从不是病与死,而是这无声的“溃败”

等我们老了,最扎心的从不是病与死,而是这无声的“溃败”

青苹果sht
2026-03-18 05:35:16
800万粉网红挖机小何彻底凉凉?挖机遭厂家回收,流量密码没了

800万粉网红挖机小何彻底凉凉?挖机遭厂家回收,流量密码没了

雷科技
2026-03-24 14:32:17
忍无可忍,委内瑞拉爆发全国大罢工,第三波抗议直逼总统府!

忍无可忍,委内瑞拉爆发全国大罢工,第三波抗议直逼总统府!

匹夫来搞笑
2026-03-26 12:01:58
中国最有名的9条家训,读懂一条旺家三代,建议收藏反复背诵

中国最有名的9条家训,读懂一条旺家三代,建议收藏反复背诵

长风文史
2026-03-25 17:58:23
59岁巩俐身材引热议,外套都快撑不住丰腴身材了,却被夸少女体态

59岁巩俐身材引热议,外套都快撑不住丰腴身材了,却被夸少女体态

一盅情怀
2026-03-16 16:52:57
粉碎金小刀诡计:郑丽文绝地反击,萧旭岑棉里藏针,马英九隐身了

粉碎金小刀诡计:郑丽文绝地反击,萧旭岑棉里藏针,马英九隐身了

蓝色海边
2026-03-26 12:01:06
随着雷霆12连胜被终结,湖人137-130,西部最新排名出炉!马刺第2

随着雷霆12连胜被终结,湖人137-130,西部最新排名出炉!马刺第2

薇说体育
2026-03-26 10:48:02
2026-03-26 13:19:00
量子位 incentive-icons
量子位
追踪人工智能动态
12346文章数 176424关注度
往期回顾 全部

科技要闻

Meta高管狂分百亿期权,700名员工却下岗

头条要闻

伊朗议长和外长暂被移出美以清除名单 时限4到5天

头条要闻

伊朗议长和外长暂被移出美以清除名单 时限4到5天

体育要闻

35岁替补门将,凭什么入选英格兰队?

娱乐要闻

张雪峰家人首发声 不设追思会丧事从简

财经要闻

黄仁勋:芯片公司的时代已经结束了

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

游戏
本地
房产
艺术
公开课

任天堂澄清Switch2游戏定价策略:实体版不会涨价

本地新闻

春日吃花第三站——广东

房产要闻

质价比标杆!三亚首创浮岛全景舱亮相,还得是万科!

艺术要闻

哪一座桥不是风景?

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版