网易首页 > 网易号 > 正文 申请入驻

一行代码加速60%:明略科技(2718.HK)Cider如何补齐Apple端侧AI生态的关键短板

0
分享至

来源:市场资讯

(来源:界面新闻)

如果给2026年上半年的开发者社区选一个关键词,"本地AI"可能会高票当选。

这股风潮的标志性事件发生在3月底:Ollama宣布其Mac版本从llama.cpp切换到苹果原生的MLX框架。紧随其后,大量开发者开始将自己的AI工作流迁移到本地Mac上运行。驱动力很简单——数字太有说服力了。在M5芯片上,MLX框架带来了prefill速度提升57%、生成速度近乎翻倍的实测表现。

Apple Silicon统一内存架构的优势终于被充分释放:CPU和GPU共享同一块物理内存,数据无需在不同存储池之间搬运;M5芯片更在每个GPU核心中嵌入了Neural Accelerator,通过Metal 4的TensorOps API提供原生AI推理加速。硬件层面,苹果已经为端侧AI铺好了路。

但开发者们很快发现了一个问题。

MLX的"半成品"现状

MLX目前支持的量化模式是W4A16和W8A16——即只对模型"权重"进行量化压缩(分别压缩到4bit和8bit),而计算过程中的"激活值"仍然保持FP16(16位浮点数)格式。

这意味着什么?意味着苹果专门为INT8运算设计的Neural Accelerator硬件,在MLX框架下并没有被完整利用。权重被压缩了,但实际计算的数据精度还是FP16,GPU的INT8加速单元基本处于闲置状态。

打个比方:苹果给了一辆配备涡轮增压的跑车,但MLX只把它当自然吸气在开。硬件潜力释放了一半,还有一半锁在驾驶模式的限制里。

这不是MLX的设计缺陷——激活量化的工程难度确实高于权重量化,需要解决校准精度、算子适配、硬件调度等一系列问题。但对于希望在Mac上运行生产级AI的开发者而言,这是一个明确的性能天花板。

Cider:精准补位的一行代码

明略科技近日开源的Cider推理加速SDK,精准地切入了这个缺口。它在MLX生态的基础上,补齐了W8A8和W4A8两条激活量化路径——既支持权重8bit+激活8bit(保持模型能力的前提下最大化加速),也支持权重4bit+激活8bit(在极致内存压缩的同时获得INT8加速)。

工程层面最值得关注的是接入成本:一行代码完成模型转换。开发者不需要重新训练模型、不需要修改推理脚本、不需要学习新的框架——在现有MLX工作流中加入一行convert_model()调用即可。

性能数据很实在。在M5 Pro芯片上,W8A8模式下单算子速度比原生MLX提升1.82-1.86倍。对于视觉语言模型(VLM),Qwen3-VL-2B的端到端预填充速度提升57%-61%,Qwen3-VL-4B提升17%-22%。在实验性的ANE+GPU异构协同模式下,M4芯片上还能获得额外3%-17%的加速。

精度方面,W8A8量化后的模型PPL(困惑度)与FP16原始精度相比差距仅0.03。几乎可以认为是无损加速。

生态兼容:不是另起炉灶

Cider的另一个关键设计选择是:完全基于MLX生态构建,而不是试图替代它。

这意味着所有已经适配MLX的开源模型——Qwen、Llama、Mistral、Phi等——都可以无缝受益于Cider的加速能力,无需等待模型方单独适配。对于开发者而言,这不增加技术栈复杂度,只减少推理延迟。

从苹果生态的角度看,Cider填补的是MLX框架演进路线中尚未到达的位置。苹果在WWDC 2025上展示的MLX路线图中,激活量化是明确的发展方向,但官方实现的时间表尚不确定。Cider提前为开发者提供了这一能力,且保持了与MLX API的完全兼容——即便未来MLX原生支持激活量化,现有的Cider代码也不需要大幅重构。

对端侧AI生态的意义

Cider解决的不只是一个性能优化问题。它改变的是Mac作为AI开发和部署平台的能力边界。

当Neural Accelerator被真正用起来,一台Mac能承载的模型规模和推理速度都会上一个台阶。4B参数的视觉语言模型可以流畅运行GUI操作任务,7B-14B的语言模型可以支撑更复杂的Agent推理链路——这些过去需要专用GPU服务器才能实现的能力,现在在一台桌面设备上就能跑通。

明略科技同步开源的Mano-P端侧智能体模型,就是Cider能力的一个直接受益者。4.3GB峰值内存、476 tokens/s预填充速度、76 tokens/s解码速度——这组数据的背后,是Cider将Apple Silicon的硬件潜力充分释放后的结果。

对于整个Apple端侧AI生态而言,Cider的开源意味着一个关键瓶颈被清除。MLX为Mac上的AI推理建立了基础框架,Cider在这个框架上补齐了硬件利用率的最后一块拼图。两者叠加,让"Mac即AI工作站"不再是一句营销口号,而是一个可以用benchmark数据支撑的工程事实。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
俄乌无人机大战背后,中国没参战,却掌控了战场的核心命脉

俄乌无人机大战背后,中国没参战,却掌控了战场的核心命脉

小涛叨叨
2026-05-06 22:10:08
老人财产转给独生子女:3个最佳时间,早知道少走弯路

老人财产转给独生子女:3个最佳时间,早知道少走弯路

小鹿姐姐情感说
2026-05-05 10:43:52
酒局持续4小时,从下厨招待到拿刀拼命,妻子到底经历了什么

酒局持续4小时,从下厨招待到拿刀拼命,妻子到底经历了什么

笑谈历史阿晡
2026-05-04 12:02:08
上海户籍的含金量为什么会跌跌不休?网友:完全对有钱人开放的

上海户籍的含金量为什么会跌跌不休?网友:完全对有钱人开放的

夜深爱杂谈
2026-05-01 21:51:08
男团八强出炉:国乒VS韩国!中国香港止步,雨果2胜率队过关

男团八强出炉:国乒VS韩国!中国香港止步,雨果2胜率队过关

烧体坛
2026-05-07 05:55:14
“神豪G与陈果的聊天记录曝出!说不通!家里还是不让!凌晨突然告知去798!”

“神豪G与陈果的聊天记录曝出!说不通!家里还是不让!凌晨突然告知去798!”

新浪财经
2026-05-05 16:11:17
确定远离俄罗斯,投入欧盟怀抱,亚美尼亚主办历史性的欧盟峰会

确定远离俄罗斯,投入欧盟怀抱,亚美尼亚主办历史性的欧盟峰会

祈福所有
2026-05-06 15:54:22
越秀+华发,两家粤系国企真的“刚”起来了

越秀+华发,两家粤系国企真的“刚”起来了

新浪财经
2026-05-07 13:11:17
98年我在东莞当保安,一个舞女为躲追杀藏我宿舍,竟是卧底女警

98年我在东莞当保安,一个舞女为躲追杀藏我宿舍,竟是卧底女警

千秋文化
2026-04-22 20:17:38
福彩3d专家综合分析精选预测重点推荐号码汇总

福彩3d专家综合分析精选预测重点推荐号码汇总

希赛
2026-05-08 00:11:20
这大体格,珠圆玉润,最标准东方美人,妥妥旺三代,不接受反驳

这大体格,珠圆玉润,最标准东方美人,妥妥旺三代,不接受反驳

刺头体育
2026-05-07 21:07:06
香港演员“鼎爷”交代身后事:所有东西给小儿子,怒斥大儿子说谎

香港演员“鼎爷”交代身后事:所有东西给小儿子,怒斥大儿子说谎

半岛晨报
2026-05-07 17:45:07
随着澳大利亚4-0,韩国1-1,U17亚洲杯首轮最新排名:国足列第三

随着澳大利亚4-0,韩国1-1,U17亚洲杯首轮最新排名:国足列第三

侃球熊弟
2026-05-07 06:06:27
体脂率从30%减到22%:你只需每天重复这几件事

体脂率从30%减到22%:你只需每天重复这几件事

增肌减脂
2026-05-07 15:56:48
查出结直肠癌肝转移,就是“晚期”吗?先别急着下结论

查出结直肠癌肝转移,就是“晚期”吗?先别急着下结论

王二哥老搞笑
2026-05-07 20:45:41
韦伯望远镜首次直接"看"清系外行星表面

韦伯望远镜首次直接"看"清系外行星表面

我是一个养虾人
2026-05-07 10:30:51
难以置信!一福建男子称,感谢失业后妻子和他离婚,帮他减轻压力

难以置信!一福建男子称,感谢失业后妻子和他离婚,帮他减轻压力

火山詩话
2026-03-20 09:50:39
Telegram下载安装指南:开启你的全球通信新纪元

Telegram下载安装指南:开启你的全球通信新纪元

五八八八拜
2025-08-20 14:05:51
普京不想再打了,俄军打下来的领土,足够给1亿俄罗斯人一个交待

普京不想再打了,俄军打下来的领土,足够给1亿俄罗斯人一个交待

混沌录
2026-05-05 13:50:21
特朗普访华前瞻——台湾怎么办?

特朗普访华前瞻——台湾怎么办?

凤凰卫视
2026-05-07 23:25:07
2026-05-08 02:16:49
新浪财经 incentive-icons
新浪财经
新浪财经是一家创建于1999年8月的财经平台
3136249文章数 7220关注度
往期回顾 全部

科技要闻

月之暗面完成20亿美元融资,估值突破200亿

头条要闻

日媒询问中国是否希望恢复中日之间人员往来 中方回应

头条要闻

日媒询问中国是否希望恢复中日之间人员往来 中方回应

体育要闻

巴黎再进欧冠决赛,最尴尬的情况还是发生了

娱乐要闻

Lisa主持!宁艺卓观看脱衣秀风波升级

财经要闻

人均年薪406万,这家ST公司惊呆市场!

汽车要闻

雷克萨斯全新纯电三排SUV 全新TZ全球首发

态度原创

游戏
健康
旅游
教育
公开课

《远星物语》团队新作《皓白初晓》登Steam EA

干细胞治烧烫伤面临这些“瓶颈”

旅游要闻

在上图文字奇旅中寻找她的笔迹(边玩边赢奖,互动体验开启预约!)

教育要闻

二模很重要!2026临沂二模、青岛二模语文、数学试题及答案!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版