网易首页 > 网易号 > 正文 申请入驻

苹果 M3 Ultra + 双英伟达 DGX Spark 并联,AI 性能提升 2.8 倍

0
分享至

IT之家 10 月 17 日消息,EXO Labs 昨日展示了其“分布式推理”新成果,解决了被部分网友戏称为“世纪难题”的选择问题 —— 买 AI 小主机究竟是买苹果 Mac Studio 还是买英伟达 DGX Spark?

如图所示,EXO Labs 同时使用了两台 NVIDIA DGX Spark 与一台搭载 M3 Ultra 芯片的 Mac Studio,在 AI 大语言模型推理测试中取得 2.8 倍性能提升。


该成果基于 EXO Labs 的开源项目 EXO,该框架旨在让大语言模型(LLM)能够高效运行于不同硬件的混合环境中。

与传统仅依赖单一 GPU 或加速器的推理方式不同,EXO 可将工作负载自动分配到多种设备上,使台式机、笔记本、服务器甚至平板电脑与智能手机组成类似 WiFi Mesh 网络的“AI Mesh”。

DGX Spark 与 M3 Ultra 的互补组合

正如 EXO 所述,3999 美元(IT之家注:现汇率约合 28505 元人民币)的 DGX Spark 侧重计算性能,而 5599 美元(现汇率约合 39910 元人民币) Mac Studio 则在数据带宽上更具优势。在这里,EXO 直接将两台 DGX Spark 与一台 Mac Studio 组合成统一的 AI 系统。


大型语言模型的推理过程通常分为两个阶段:

  • 预填充(prefill)阶段:模型读取和处理输入提示,这一阶段主要受计算性能限制;
  • 解码(decode)阶段:模型逐个生成新词元(token),此过程更依赖内存带宽。


EXO 的方案是将两阶段分配给不同设备执行:

DGX Spark 负责计算密集的预填充任务,而 M3 Ultra 负责带宽敏感的解码任务。系统通过逐层传输模型的内部数据(称为 KV 缓存),实现两台设备的同时工作,而非依次等待。

在使用 Meta Llama-3.1 8B 模型进行的基准测试中,该混合架构相较单独使用 Mac Studio,推理性能提升 2.8 倍。测试中 DGX Spark 的预填充速度比 Mac Studio 快 3.8 倍,而 Mac Studio 的生成速度又比 DGX Spark 快 3.4 倍,实现了性能互补。


“分布式推理”助力低成本扩展 AI 算力

EXO 的实验展示了一种不同于传统单机加速的 AI 扩展思路。未来 AI 性能的提升,或不再依赖单一大型加速器,而是通过更智能的硬件协同实现整体算力的提升。

类似的理念也出现在 NVIDIA 自家的新一代 Rubin CPX 平台设计中:计算密集型的上下文构建由 Rubin CPX 处理器完成,而具有高带宽 HBM3e 内存的标准 Rubin 芯片负责解码阶段,与 EXO 在现成硬件上实现的原理一致。

EXO 1.0 仍处早期阶段

EXO 当前的早期访问版本 1.0 仍属实验性质,尚未全面公开。现有的开源版本 0.0.15-alpha 发布于 2025 年 3 月,后续版本计划引入自动调度、KV 流式传输和异构硬件优化功能。

目前 EXO 仍是研究级工具,尚不适合普通消费者直接使用,但其演示结果表明:通过智能调度不同硬件资源,分布式推理架构能在无需大型数据中心的前提下显著提升 AI 性能。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
等孩子考完才敢说的实话:初中这张牌桌,拼的从来不是孩子的智商

等孩子考完才敢说的实话:初中这张牌桌,拼的从来不是孩子的智商

青苹果sht
2026-01-15 06:17:00
一个悠悠球卖1万8千元!部分地区已断货,网友:我的童年不配……

一个悠悠球卖1万8千元!部分地区已断货,网友:我的童年不配……

环球网资讯
2026-01-14 19:34:11
特朗普底特律喊话:欢迎中国车企来美建厂

特朗普底特律喊话:欢迎中国车企来美建厂

财联社
2026-01-16 16:30:10
力挺华与华!西贝创始人贾国龙喊话有关部门:应监管网络乱象

力挺华与华!西贝创始人贾国龙喊话有关部门:应监管网络乱象

南方都市报
2026-01-16 09:42:11
特朗普加税威胁伊朗伙伴,俄罗斯硬气回应:制裁无效,合作照旧!

特朗普加税威胁伊朗伙伴,俄罗斯硬气回应:制裁无效,合作照旧!

三农老历
2026-01-16 18:16:16
张雨绮穿吊带看着骨架有点大哦!这大体格谁看了不喜欢?

张雨绮穿吊带看着骨架有点大哦!这大体格谁看了不喜欢?

草莓解说体育
2025-12-21 00:52:27
每天一个水煮蛋是“死亡催化剂”?提醒:想健康吃蛋,5个错别犯

每天一个水煮蛋是“死亡催化剂”?提醒:想健康吃蛋,5个错别犯

健康科普365
2026-01-11 20:30:03
碳酸锂期货价格跌停

碳酸锂期货价格跌停

证券时报
2026-01-16 11:11:08
联发科再发双芯,3nm天玑9500s来了,小米、vivo、OPPO首批发布

联发科再发双芯,3nm天玑9500s来了,小米、vivo、OPPO首批发布

智东西
2026-01-15 17:23:31
7号线,为什么成了长沙最憋屈的地铁?

7号线,为什么成了长沙最憋屈的地铁?

小李子体育
2026-01-16 16:24:45
柬埔寨副首相放话:特朗普让我们惊醒,不能只依靠中国

柬埔寨副首相放话:特朗普让我们惊醒,不能只依靠中国

扬子晚报
2026-01-15 12:30:47
西蒙斯轰39+4+4仍无缘今日最佳!对不起,你碰到暴走的巴特勒了

西蒙斯轰39+4+4仍无缘今日最佳!对不起,你碰到暴走的巴特勒了

世界体育圈
2026-01-16 14:16:29
存款利率反转!5家银行开年加息,你的存款利息或要涨了!

存款利率反转!5家银行开年加息,你的存款利息或要涨了!

老特有话说
2026-01-15 19:59:03
窦骁霸道批评何超莲站错位后牵手哄笑

窦骁霸道批评何超莲站错位后牵手哄笑

青杉依旧啊啊
2026-01-16 15:52:33
1955年,毛主席一笔划掉二野刘邓之下的3号人物:此人不予授衔!

1955年,毛主席一笔划掉二野刘邓之下的3号人物:此人不予授衔!

卿昀
2025-11-24 21:26:43
从替补打成超巨有多难?但以下四位球员,还真做到了

从替补打成超巨有多难?但以下四位球员,还真做到了

主宰稳场
2026-01-16 18:48:17
100元与20元香烟差别多大?烟厂老员工曝实情,答案出人意料

100元与20元香烟差别多大?烟厂老员工曝实情,答案出人意料

复转这些年
2026-01-08 23:29:55
普通人这辈子想靠炒股赚大钱,方法就两个,没有第三个。

普通人这辈子想靠炒股赚大钱,方法就两个,没有第三个。

流苏晚晴
2026-01-14 18:16:15
博主戳破闫学晶最大心结!事业受阻无所谓,儿媳才是最让她担忧的

博主戳破闫学晶最大心结!事业受阻无所谓,儿媳才是最让她担忧的

小徐讲八卦
2026-01-16 09:02:48
林俊杰们用行动证明:男人的终极审美,真的很一致

林俊杰们用行动证明:男人的终极审美,真的很一致

橙星文娱
2026-01-03 21:41:06
2026-01-16 19:28:49
IT之家
IT之家
爱科技,爱这里 - 前沿科技人气平台
324941文章数 606885关注度
往期回顾 全部

数码要闻

苹果首款AI眼镜计划于二季度亮相:轻量化设计,无显示屏

头条要闻

洪秀柱:既然早晚要统一 不如赶快统一吧

头条要闻

洪秀柱:既然早晚要统一 不如赶快统一吧

体育要闻

全队身价=登贝莱,他们凭什么领跑法甲?

娱乐要闻

黄慧颐手撕保剑锋 曾黎意外卷入风波

财经要闻

关店102家贾国龙喊被污蔑 罗永浩回应

科技要闻

传小米传音Ovi四家手机厂下调全年出货预期

汽车要闻

方程豹品牌销量突破30万辆 2026年还将推出轿跑系列

态度原创

艺术
本地
时尚
健康
游戏

艺术要闻

300亿!341米!迪拜将建全球首个奔驰品牌城市

本地新闻

云游内蒙|黄沙与碧波撞色,乌海天生会“混搭”

年度最扎心电影,看得中年男女坐立难安

血常规3项异常,是身体警报!

惊!巫师1/2迟到18年的销量揭晓 500万份撑起IP传奇

无障碍浏览 进入关怀版