网易首页 > 网易号 > 正文 申请入驻

Ollama换上苹果MLX引擎:本地AI提速3倍

0
分享至


本地跑大模型的用户有个共同噩梦:风扇狂转、内存爆满、生成一句话能泡完一杯咖啡。Ollama 0.19预览版的发布,把这个等待时间砍到了原来的三分之一——前提是,你得有台32G内存的Mac。

从"能跑"到"跑得动",中间隔着一个MLX

Ollama这个工具在开发者圈子里不算陌生。它让Mac、Linux和Windows用户能把AI模型下载到本地运行,不用联网、不用把数据交给云端。模型来源也开放,Hugging Face社区或者直接找模型提供方都能搞到。

但本地跑大语言模型(LLM)一直是场资源消耗战。哪怕是小模型,吃起内存和显存来也毫不客气。Ollama之前的版本其实已经做了不少优化,这次0.19预览版的动作更大:整个底层换成了苹果的机器学习框架MLX。

MLX的核心卖点是统一内存架构(Unified Memory)。传统方案里,CPU内存和GPU显存各管各的,数据搬来搬去就是性能黑洞。MLX让M系列芯片把内存池共享,模型权重不用复制就能被GPU直接调用。Ollama团队的原话是,这带来了"a large speedup on all Apple Silicon devices"。


M5芯片的隐藏技能被激活了

更具体的数字来自苹果新发布的M5系列。Ollama 0.19在M5、M5 Pro和M5 Max上调用了GPU Neural Accelerators,专门优化两个指标:首Token延迟(TTFT)和生成速度(tokens per second)。

翻译成人话:以前点完生成要等几秒才能看到第一个字跳出来,现在几乎是即时响应;以前每秒蹦几个字,现在流畅得像在本地跑记事本。

官方给出的应用场景很具体:个人助手类工具比如OpenClaw,还有编程助手Claude Code、OpenCode、Codex这些"代码代理"。这类工具的特点是交互频繁、上下文长,对延迟极度敏感。MLX架构下的内存效率提升,正好打在痛点上。

但这里有个"但是"。


Ollama在发布说明里加了一行加粗提醒:"please make sure you have a Mac with more than 32GB of unified memory"。32G统一内存,在当前Mac产品线里意味着至少M3 Pro起步,或者上M3 Max。基础款M3、M4的8G/16G配置被明确排除在外。

门槛之外,还有谁被挡在门外

这个内存要求暴露了一个尴尬现实:本地AI的"民主化"口号喊了两年,硬件门槛不降反升。16G内存曾经是Mac的甜点配置,现在连入门资格都没有。

MLX本身是苹果2023年底开源的框架,设计目标就是让开发者更容易在苹果芯片上跑机器学习。Ollama adoption MLX,某种程度上是苹果生态的"近水楼台"——同样的模型,在MLX优化下能比通用方案快出一截,但代价是你得买更贵的机器。

对比云端方案如ChatGPT,本地部署的优势始终是数据隐私和离线可用。Ollama这次提速,缩小了本地与云端的体验差距,但32G内存的硬性筛选,又把一大批潜在用户推回了云端。

一个细节值得玩味:Ollama的发布说明里,M5系列的性能提升被详细列举,但旧款M1/M2的优化幅度只字未提。"all Apple Silicon devices"的表述,是否包括初代M1的8G机型?官方没有给数据,用户只能自己试。

目前0.19还是预览版,正式版的发布时间未定。对于已经手握32G内存Mac的用户,这是个免费升级;对于还在观望的,问题变成了:为了本地跑AI,值不值得换机?

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
山西大同“订婚强奸案”男子将于5月4日出狱,母亲:为儿子买了新衣,计划亲自去接,带他回归正常生活

山西大同“订婚强奸案”男子将于5月4日出狱,母亲:为儿子买了新衣,计划亲自去接,带他回归正常生活

大风新闻
2026-04-28 17:18:06
张柱任农业农村部党组书记

张柱任农业农村部党组书记

界面新闻
2026-04-28 20:57:23
境外势力掏钱让你“躺平”?这波操作,真把年轻人当韭菜割了

境外势力掏钱让你“躺平”?这波操作,真把年轻人当韭菜割了

迷世书童H9527
2026-04-28 10:30:43
西安7名残疾人轮椅进地铁遭查近一小时,内急哀求仍要“查完证”

西安7名残疾人轮椅进地铁遭查近一小时,内急哀求仍要“查完证”

听心堂
2026-04-28 21:45:16
进球盛宴,激情四射!PSG主场5-4战胜拜仁慕尼黑!

进球盛宴,激情四射!PSG主场5-4战胜拜仁慕尼黑!

巴黎圣日耳曼足球俱乐部
2026-04-29 07:05:12
俄罗斯人大量涌入中国,却发现中俄差距越来越大

俄罗斯人大量涌入中国,却发现中俄差距越来越大

杰丝聊古今
2026-04-28 03:43:50
网信部门依法查处“剪映”App等生成合成内容标识违法问题网站平台

网信部门依法查处“剪映”App等生成合成内容标识违法问题网站平台

每日经济新闻
2026-04-28 17:02:59
87岁香港绿叶患癌拒绝治疗,瘦骨嶙峋行动不便,已搬进深圳养老院

87岁香港绿叶患癌拒绝治疗,瘦骨嶙峋行动不便,已搬进深圳养老院

八斗小先生
2026-04-28 10:54:08
大爆冷!东部第一轰然倒下!黑八奇迹上演,7换1交易赚大了

大爆冷!东部第一轰然倒下!黑八奇迹上演,7换1交易赚大了

篮球扫地僧
2026-04-28 11:10:53
一人千面唤醒场景革命,情绪价值激活净水器增长密码

一人千面唤醒场景革命,情绪价值激活净水器增长密码

中国家电网
2026-04-27 17:02:50
中国遭警告:拒收将面临供应中断!

中国遭警告:拒收将面临供应中断!

共工之锚
2026-04-28 23:20:50
辞任杭州市市长后,姚高员已任浙江省政府党组成员

辞任杭州市市长后,姚高员已任浙江省政府党组成员

上海法治声音
2026-04-28 14:52:08
世锦赛战报:竞逐四强,6-7/3-5,世界第4第5都落后了!吴宜泽4-4

世锦赛战报:竞逐四强,6-7/3-5,世界第4第5都落后了!吴宜泽4-4

求球不落谛
2026-04-29 04:33:20
智能眼镜终于不是概念尝鲜了?千问这次来真的了

智能眼镜终于不是概念尝鲜了?千问这次来真的了

差评XPIN
2026-04-17 00:08:30
被孙继海索赔266万!13岁足球天才改打羽毛球 博主:恶霸有保护伞

被孙继海索赔266万!13岁足球天才改打羽毛球 博主:恶霸有保护伞

念洲
2026-04-28 17:21:15
炸裂!“最强降压药” 真的来了!30 年一遇,专门收拾顽固高血压

炸裂!“最强降压药” 真的来了!30 年一遇,专门收拾顽固高血压

孟大夫之家1
2026-04-28 19:07:08
巴黎5-4拜仁!金球先生2射1传 9000万飞翼双响 单场9球创欧冠纪录

巴黎5-4拜仁!金球先生2射1传 9000万飞翼双响 单场9球创欧冠纪录

我爱英超
2026-04-29 04:59:25
最烦是自发免费做“躺平”内容的人

最烦是自发免费做“躺平”内容的人

不主流讲话
2026-04-28 23:10:32
为什么我们中国人活得这么累、这么卷?

为什么我们中国人活得这么累、这么卷?

流苏晚晴
2026-04-28 18:32:41
Claude自己上“闲鱼”:砍价成交186单,实验结果反直觉

Claude自己上“闲鱼”:砍价成交186单,实验结果反直觉

智东西
2026-04-27 18:08:21
2026-04-29 07:15:00
固件更新中
固件更新中
有态度网友ytd
3025文章数 28关注度
往期回顾 全部

科技要闻

10亿周活目标落空!传OpenAI爆发内部分歧

头条要闻

美国禁止本国个人或实体向伊朗缴纳霍尔木兹通行费

头条要闻

美国禁止本国个人或实体向伊朗缴纳霍尔木兹通行费

体育要闻

魔术黑八活塞,一步之遥?!

娱乐要闻

蔡卓妍官宣结婚,老公比她小10岁

财经要闻

中央政治局会议定调,八大看点速览!

汽车要闻

拒绝疯狂套娃!现代艾尼氪金星长在未来审美点上

态度原创

家居
亲子
数码
房产
公开课

家居要闻

江景风格 流动的秩序

亲子要闻

拍这期视频时眼泪止不住地流

数码要闻

机械革命苍龙16 / 18 Pro游戏本RTX 5070 12GB款开启预约

房产要闻

红利爆发!海南,冲到全国人口增量第4省!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版