网易首页 > 网易号 > 正文 申请入驻

Mac跑MiniMax-M2.7,2条路径对比

0
分享至

今天聊一个很多 Mac 用户关心的问题:MiniMax-M2.7 怎么在 Mac 上跑起来?

MiniMax-M2.7 是什么来头?

先简单回顾一下

M2.7 是 MiniMax 最新的开源大模型,MoE 架构,总参数 228.7B,每 token 激活约 10B 参数,192K 上下文

这货最亮眼的几个数据:

  • **SWE-Pro 56.22%**,和 GPT-5.3-Codex 打平

  • MLE Bench Lite 66.6%奖牌率,仅次于 Opus-4.6 和 GPT-5.4

  • 原生支持 Agent Teams,多智能体协作

  • Always-reasoning 模式,始终开启思考链

问题是——228B 参数,普通人怎么跑?答案是量化。但 MiniMax 的量化比一般模型坑多得多

为什么标准量化在 MiniMax 上翻车?

这是写这篇文章最想说的一件事:标准 MLX 均匀量化在 MiniMax-M2.7 上完全失效——MMLU 直接降到 ~25%,基本等于随机猜

原因在于 MoE 架构的路由器(Router Gate)

均匀量化连路由器一起压了,导致 token 被分配到错误的专家上,整个模型就废了

所以 Mac 用户想跑 M2.7,目前只有两条靠谱的路

路径一:JANGTQ + MLX Studio(推荐!)

JANGTQ(JANG TurboQuant)是目前最小体积、最高质量的 M2.7 Apple Silicon 量化方案,来自 JANGQ-AI 团队

核心思路:混合精度量化。路由专家 MLP(占 98% 参数)用 2-bit codebook + Hadamard 旋转压缩,而 Attention、共享专家、Router Gate 保持 8-bit 或 fp16。


硬核数据:

指标

数值

磁盘占用

56.5 GB

GPU 显存

56.5 GB

MMLU(200题)

91.5%

速度(M3 Ultra)

~44 tok/s

你没看错——2-bit 量化,只要 56.5GB,MMLU 居然能打到 91.5%。对比标准 MLX 量化的 ~25%,这差距简直是天壤之别

怎么跑:

最简单的方式是用 MLX Studio(内置了 JANGTQ 运行时和 Metal 内核):

命令行方式也行:

pip install jang-tools

from huggingface_hub import snapshot_download
from jang_tools.load_jangtq import load_jangtq_model
from mlx_lm import generate

model_path = snapshot_download("JANGQ-AI/MiniMax-M2.7-JANGTQ")
model, tokenizer = load_jangtq_model(model_path)

messages = [{"role": "user", "content": "用5句话解释光合作用"}]
prompt = tokenizer.apply_chat_template(messages, add_generation_prompt=True, tokenize=False)
out = generate(model, tokenizer, prompt, max_tokens=600, verbose=True)

# 剥离推理链获取最终答案
if""in out:
out = out.split("")[-1].strip()
print(out)

硬件要求:

机器

最低内存

预期速度

M3 Ultra / M2 Ultra

96 GB

~44 tok/s

M4 Max

96 GB

~35-40 tok/s

M4 Pro

64 GB

~25-30 tok/s(非常紧张)

64GB 的 M4 Pro 理论上能跑,但会很紧张

96GB 是比较舒服的起点

路径二:LM Studio + GGUF(最省心)

如果你就想点几下鼠标就开跑,LM Studio 是最简单的选择。

LM Studio 已经上线了 MiniMax-M2.7 的 GGUF 版本,基于 llama.cpp b8778 量化。

使用步骤:

  1. 下载安装 LM Studio:https://lmstudio.ai/download

  2. 搜索minimax/minimax-m2.7

  3. 选择量化版本下载

  4. 设置参数:Temperature=1.0(必须!)、Top K=40、Top P=0.95

  5. 开始对话

GGUF 来源是lmstudio-community/MiniMax-M2.7-GGUF。如果追求更好的量化质量,Unsloth 提供了 22 个 Dynamic 2.0 量化版本,逐层差异化量化,质量全面优于标准 imatrix。

但有个大问题:LM Studio 官方标注最低系统内存 138GB

两条路径,怎么选?
两条路径对比

维度

JANGTQ + MLX Studio

LM Studio / GGUF

最小磁盘

56.5 GB

~108 GB

最低内存

64 GB

138 GB

MMLU 质量

91.5%

~64-65%(4-bit)

速度(M3 Ultra)

~44 tok/s

待测

易用性

需安装 jang-tools

开箱即用

生态兼容

MLX 生态

OpenAI 兼容 API

我的建议:

  • 96GB 以下的 Mac→ 只能走 JANGTQ,别无选择

  • 128GB+ 且需要 OpenAI 兼容 API→ LM Studio / GGUF 更方便

  • 追求最佳质量→ JANGTQ 碾压,2-bit 打 4-bit,这个结果说实话我也很意外

⚠️ 关键设置提醒

不管走哪条路,这几个参数必须注意:

  1. Temperature 必须设 1.0—— temp=0 会导致思考链死循环,模型会一直 下去停不了

  2. max_tokens ≥ 8192—— Always-reasoning 模型的思考过程需要足够空间

  3. 内存必须大于模型文件大小—— 否则回退到硬盘卸载,速度断崖式下降

总结

MiniMax-M2.7 在 Mac 上的本地部署,JANGTQ 是目前当之无愧的最优解——体积最小、质量最高。2-bit 量化能拿到 91.5% MMLU,这在我写过的所有量化方案里都算炸裂级别的。

LM Studio 胜在省心和生态兼容,但内存门槛太高。

如果你手上有一台 96GB+ 的 Mac,强烈建议先试试 JANGTQ

56.5GB 下载完就能跑,44 tok/s 的速度日常使用完全够了。

.7

制作不易,如果这篇文章觉得对你有用,可否点个关注。给我个三连击:点赞、转发和在看。若可以再给我加个,谢谢你看我的文章,我们下篇再见!

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
蒜苔开始上市!再三强调:高血压患者吃蒜苔时,多注意这5点

蒜苔开始上市!再三强调:高血压患者吃蒜苔时,多注意这5点

芹姐说生活
2026-04-18 14:47:34
美媒:中国“歼-50”可能只是F-47隐身战斗机的“低配仿制型号”

美媒:中国“歼-50”可能只是F-47隐身战斗机的“低配仿制型号”

零度Military
2026-04-18 14:36:44
叛逃至我国级别最高的外国领导人:越南副主席黄文欢,结局如何?

叛逃至我国级别最高的外国领导人:越南副主席黄文欢,结局如何?

兴趣知识
2026-04-20 01:15:11
恒大足校组建广东晨星聚力俱乐部征战中冠,目标冲击中乙资格

恒大足校组建广东晨星聚力俱乐部征战中冠,目标冲击中乙资格

懂球帝
2026-04-20 20:22:11
人走茶凉具象化!武亮直播破防了,他红着眼说:团队又走了两个人

人走茶凉具象化!武亮直播破防了,他红着眼说:团队又走了两个人

乐悠悠娱乐
2026-04-20 11:18:01
再修正,7.7级!海啸已抵达!不排除发生更强地震!日媒:请回想2011年大地震,立即逃生!

再修正,7.7级!海啸已抵达!不排除发生更强地震!日媒:请回想2011年大地震,立即逃生!

大风新闻
2026-04-20 22:01:07
去男友家他妈让我做饭:你高攀了,我:行,别回公司了另谋高就吧

去男友家他妈让我做饭:你高攀了,我:行,别回公司了另谋高就吧

今夜故事集
2024-07-10 15:54:26
请来“项羽”的苏超,又吓了所有人一跳

请来“项羽”的苏超,又吓了所有人一跳

金错刀
2026-04-19 17:54:26
特朗普第一任期的白宫律师突然爆猛料:特朗普已经撑不下去了

特朗普第一任期的白宫律师突然爆猛料:特朗普已经撑不下去了

西楼知趣杂谈
2026-04-19 21:25:23
伊朗议会要员:如收到美国积极信号,伊朗代表团将前往伊斯兰堡

伊朗议会要员:如收到美国积极信号,伊朗代表团将前往伊斯兰堡

新京报
2026-04-20 15:16:10
左小青这状态,鲨疯了!明媚动人,若隐若现

左小青这状态,鲨疯了!明媚动人,若隐若现

只要高兴就好
2025-12-10 19:09:26
军事 | 与自卫队有关的一系列事情,他们不是普通地刷存在感!

军事 | 与自卫队有关的一系列事情,他们不是普通地刷存在感!

新民周刊
2026-04-20 09:08:09
这才是宋美龄和继子蒋经国的一张真实合影,都是真人的容貌

这才是宋美龄和继子蒋经国的一张真实合影,都是真人的容貌

喜欢历史的阿繁
2026-04-16 11:17:28
“出轨”的女人,大部分不想和老公亲昵了,原因很现实

“出轨”的女人,大部分不想和老公亲昵了,原因很现实

叶飞飞情感屋
2026-04-20 19:36:08
活久见!赵樱子回应与杨子恋情,直言不怕黄圣依反击,想红想疯了

活久见!赵樱子回应与杨子恋情,直言不怕黄圣依反击,想红想疯了

八卦王者
2026-04-20 14:10:53
暴发户舅舅93年买下京城5套四合院后坐牢,出狱去那一看,当场跪下

暴发户舅舅93年买下京城5套四合院后坐牢,出狱去那一看,当场跪下

红豆讲堂
2025-07-21 16:30:58
现役巨星30分赛季数:约基奇伦纳德0,库里2,哈登3,第一很意外

现役巨星30分赛季数:约基奇伦纳德0,库里2,哈登3,第一很意外

大西体育
2026-04-20 23:27:42
29分钟大定破万 极氪8X为什么这么多人买?

29分钟大定破万 极氪8X为什么这么多人买?

正在说车
2026-04-19 07:29:06
史玉柱现状:离婚30多年未再婚,63岁仍不退休,女儿成为他的骄傲

史玉柱现状:离婚30多年未再婚,63岁仍不退休,女儿成为他的骄傲

素衣读史
2026-04-20 21:57:34
秦始皇死亡之谜被揭开?郭沫若:被人用条3寸长的铁钉活活钉死的

秦始皇死亡之谜被揭开?郭沫若:被人用条3寸长的铁钉活活钉死的

健康快乐丁
2025-04-13 18:09:33
2026-04-21 03:23:00
Ai学习的老章 incentive-icons
Ai学习的老章
Ai学习的老章
3339文章数 11138关注度
往期回顾 全部

数码要闻

16GB能当20GB用!华为超空间内存技术适配计划公布:Mate X7系列6月推送

头条要闻

19岁女孩挪用自家1700万当"榜一大姐" 亲爹带女儿自首

头条要闻

19岁女孩挪用自家1700万当"榜一大姐" 亲爹带女儿自首

体育要闻

阿森纳已拼尽全力,但你早干嘛去了...

娱乐要闻

《八千里路云和月》田家泰暗杀

财经要闻

利润暴跌7成,字节到底在做什么

科技要闻

HUAWEI Pura X Max发布 售价10999元起

汽车要闻

把天门山搬进厂?开仰望U8冲上45度坡的那刻 我腿软了

态度原创

手机
家居
旅游
健康
教育

手机要闻

OPPO影像旗舰高端发力 Find X9 Ultra走出国门

家居要闻

自然慢调 慢享时光

旅游要闻

以“Fun”为名,深圳布吉将发布全域旅游品牌IP

干细胞抗衰4大误区,90%的人都中招

教育要闻

大降温:来澳洲留学的中国学生,创近12年新低!

无障碍浏览 进入关怀版