网易首页 > 网易号 > 正文 申请入驻

在24GB M4 MacBook上跑本地大模型:Qwen 3.5-9B实测40 tokens/s,支持工具调用

0
分享至

开发者 jola 分享了自己在M4 MacBook Pro(24GB 内存)上运行本地大语言模型的完整实践经验。在经历了多次模型选型、量化配置和前端适配的试错后,他最终搭建出了一套「不需要联网、能在笔记本上流畅运行」的本地 AI 工作流——核心模型是Qwen 3.5-9B(Q4_K_S 量化版),在 LM Studio 中跑出了约40 tokens/秒的生成速度,同时支持思维链(thinking)和工具调用(tool use)。


M4 MacBook Pro本地运行大模型

选型之路:不是「能装下」就能用

本地部署大模型的第一道坎是选型。jola 尝试过多种方案:Ollama、llama.cpp、LM Studio,各自有不同的模型兼容性和配置 quirks。模型方面,他先后测试了 Qwen 3.6 Q3、GPT-OSS 20B、Devstral Small 24B 以及 Gemma 4B——前几个虽然理论上能在 24GB 内存中加载,但实际运行中「基本不可用」;Gemma 4B 能跑,但在工具调用场景下表现糟糕。

真正让他满意的是Qwen 3.5-9B @ Q4_K_S。这个量化版本在压缩后仍能保留足够的推理能力,同时留出足够内存给日常运行的 Electron 应用和其他开发工具。更关键的是,它支持128K 的上下文窗口,对于代码分析和文档阅读场景非常实用。

配置细节:Thinking 模式与代码优化参数

在 LM Studio 中,jola 为代码和精确任务场景推荐了一组参数配置:

  • temperature=0.6
  • top_p=0.95
  • top_k=20
  • min_p=0.0
  • presence_penalty=0.0
  • repetition_penalty=1.0

启用 thinking 模式还需要在 Prompt Template 底部手动添加{%- set enable_thinking = true %}。这些细节说明,本地模型的「可用性」不仅取决于硬件和模型本身,前端推理引擎的配置同样关键。

前端接入:Pi 与 OpenCode

模型跑起来后,jola 将其接入了两个开发向 AI 前端:

Pi的配置相对简洁,通过~/.pi/agent/models.json指向 LM Studio 的本地 OpenAI-compatible API(http://localhost:1234/v1),并在 settings 中开启hideThinkingBlock来隐藏思维链的干扰输出。

OpenCode的配置则更加明确,指定了 131072 的上下文长度和 32768 的最大输出 token 数,同时开启 tools 支持。

jola 的个人感受是 Pi 更轻快,但配置过程容易让人陷入「调参陷阱」——花太多时间打磨工具设置,反而挤占了实际开发的时间。

与 SOTA 模型的差距:不是替代品,是另一种工作方式

jola 非常坦诚地指出了本地模型与云端 SOTA 模型的差距:Qwen 3.5-9B(Q4)无法独立完成复杂的多步骤任务,容易分心、陷入循环、误解需求。如果你期望像使用 Claude 或 GPT-4 那样「一句话生成整个应用」,本地模型会让你失望。

但 jola 发现了一个意想不到的好处:本地模型迫使你保持更高的参与度。与 SOTA 模型合作时,开发者很容易不自觉地将所有认知负担外包给 AI;而本地模型需要更明确的指令、更细致的引导,反而让开发者始终处于思考和规划的核心位置。它更像一个「研究助理、橡皮鸭、以及拥有即时回忆能力的编程语言专家」,而不是一个能替你思考的「全栈外包」。

对于拥有 24GB 内存的 M 系列 MacBook 用户来说,这套方案提供了一个切实可行的「离线 AI 助手」选项。它不需要订阅费、不依赖网络、不将数据发送到第三方服务器——代价是你必须接受它的能力上限,并愿意付出更多的交互精力。在大模型越来越「黑箱化」和「云端化」的今天,这种「可控但有限」的本地方案,或许代表了一种值得保留的替代路径。

参考来源:jola.dev - Running local models on an M4:https://jola.dev/posts/running-local-models-on-m4

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
0:3詹姆斯再上热搜,里夫斯5000万身价打没了!列湖人G3三大罪人

0:3詹姆斯再上热搜,里夫斯5000万身价打没了!列湖人G3三大罪人

蛋疼体育
2026-05-11 17:14:25
公交集团正式员工已经躺平不了了,想要混到退休不太可能

公交集团正式员工已经躺平不了了,想要混到退休不太可能

娱乐圈见解说
2026-05-09 00:23:44
国家反诈平台竟成“内鬼”捞钱工具,最坚固的盾,成了最利的刀?

国家反诈平台竟成“内鬼”捞钱工具,最坚固的盾,成了最利的刀?

迷世书童H9527
2026-05-10 10:10:43
汪小菲飞抵台北过母亲节,玥儿姐弟罕露面,一家人游公园好惬意!

汪小菲飞抵台北过母亲节,玥儿姐弟罕露面,一家人游公园好惬意!

娱乐团长
2026-05-11 16:47:41
凤凰卫视著名主持人沈星,在母亲节当天晒出了自己孕期产检的照片

凤凰卫视著名主持人沈星,在母亲节当天晒出了自己孕期产检的照片

岁月有情1314
2026-05-11 15:07:23
状元签到手却要卖?奇才交易状元签理由曝光,神思路性价比拉满

状元签到手却要卖?奇才交易状元签理由曝光,神思路性价比拉满

夜白侃球
2026-05-11 11:10:16
CBA消息!徐昕完成新签约,辽宁四外援全部不留,潘江用人遭质疑

CBA消息!徐昕完成新签约,辽宁四外援全部不留,潘江用人遭质疑

中国篮坛快讯
2026-05-11 08:55:19
实战出真知!乌克兰靠真实战场数据,在中东赚麻了

实战出真知!乌克兰靠真实战场数据,在中东赚麻了

寰球经纬所
2026-05-10 10:10:20
女学霸发明“咯噔字体”,老师低分警告:别用个性挑战考试底线

女学霸发明“咯噔字体”,老师低分警告:别用个性挑战考试底线

蝴蝶花雨话教育
2026-05-07 00:05:04
想不到的广东:全国最富的省份,7成城市却在平均线以下

想不到的广东:全国最富的省份,7成城市却在平均线以下

风向观察
2026-05-10 19:34:45
武大用力过猛!

武大用力过猛!

梳子姐
2026-05-10 21:46:30
公安局交管大队队长被举报在KTV违规饮酒与女性举止亲密?当事人:喝茶水,涉事女士突然过来,我下意识推开

公安局交管大队队长被举报在KTV违规饮酒与女性举止亲密?当事人:喝茶水,涉事女士突然过来,我下意识推开

观威海
2026-05-11 09:30:04
揪心!文班肘击里德喉部遭驱逐,联盟深夜官宣,马刺终于松了口气

揪心!文班肘击里德喉部遭驱逐,联盟深夜官宣,马刺终于松了口气

宝哥精彩赛事
2026-05-11 16:09:48
18.98万起!长城新车官宣:超强续航1000公里,5月15日上市

18.98万起!长城新车官宣:超强续航1000公里,5月15日上市

科技堡垒
2026-05-10 11:23:22
公然拒挂国旗,订单全给日韩,长荣如今的结局早已注定

公然拒挂国旗,订单全给日韩,长荣如今的结局早已注定

潋滟晴方DAY
2026-05-11 06:31:37
汪峰母亲节晒15张照缅怀母亲,称赞章子怡是难得好儿媳

汪峰母亲节晒15张照缅怀母亲,称赞章子怡是难得好儿媳

流云随风去远方
2026-05-11 12:42:11
马扎尔正式就任匈牙利总理!欧尔班何时出逃莫斯科?

马扎尔正式就任匈牙利总理!欧尔班何时出逃莫斯科?

项鹏飞
2026-05-10 21:05:09
男子要求鱼香肉丝不放盐,店员一句“做不了”,掀翻餐饮业的底裤

男子要求鱼香肉丝不放盐,店员一句“做不了”,掀翻餐饮业的底裤

天天热点见闻
2026-05-11 15:04:16
功夫巨星新片惨败,三天没有票房统计,观众差评如潮

功夫巨星新片惨败,三天没有票房统计,观众差评如潮

影视高原说
2026-05-10 13:09:18
比利时将向乌克兰提供全部F-16战机

比利时将向乌克兰提供全部F-16战机

参考消息
2026-05-11 14:37:08
2026-05-11 18:52:49
开源中国 incentive-icons
开源中国
每天为开发者推送最新技术资讯
7729文章数 34540关注度
往期回顾 全部

科技要闻

黄仁勋:你们赶上了一代人一次的大机会

头条要闻

外交部介绍特朗普访华具体安排和中方期待

头条要闻

外交部介绍特朗普访华具体安排和中方期待

体育要闻

梁靖崑:可能是最后一届了,想让大家记住这个我

娱乐要闻

“孕妇坠崖案”王暖暖称被霸凌协商解约

财经要闻

多重催化剂共振,人民币汇率升破6.8

汽车要闻

吉利银河“TT”申报图曝光 电动尾翼+激光雷达

态度原创

教育
游戏
家居
旅游
军事航空

教育要闻

高考后别荒废!抓紧时间学雅思,未来多一种可能

《魔法门之英雄无敌:上古纪元》EA评测8.9分:最后的英雄

家居要闻

多元生活 此处无声

旅游要闻

从看热闹到掏腰包,文商旅体融合进入“深水区”

军事要闻

特朗普:伊朗的回应“完全不可接受”

无障碍浏览 进入关怀版