网易首页 > 网易号 > 正文 申请入驻

Strix Halo、DGX Spark决战迷你AI工作站!AMD手握三大优势、性能完胜

0
分享至

这几年,生成式AI浪潮方兴未艾,各种应用如雨后春笋,更高级的智能体AI、具身AI也已经崭露头角,显现了无尽的潜力。

但是一个市场领域蓬勃发展时,往往是机遇与挑战并存。如何更好地抓住AI这一波机会,怎么玩才能实现收益最大化,从科技巨头到个人开发者都在思考。


其中,对于小型企业、工作室乃至个人开发者来说,端侧AI蕴藏着更多可能,而工欲善其事、必先利其器,如何选择高效、经济的端侧开发平台,就成了一道令人纠结的选择题。

所谓端侧AI,就是在本地设备上完成相关AI模型部署和推理计算,因为云侧AI虽然算力强大、模型接入方便,但也存在数据隐私泄露、成本高昂、数据延迟等方面的不友好因素,并不是所有AI负载都适合上云。

而端侧AI最大的阻碍就是算力/显存、存储空间等方面的掣肘太多,消费级笔记本、台式机往往太弱,像英特尔推出的桌面AI超算中心产品,专业工作站又太贵,苹果则是生态过于封闭。

这种情况下,AMD、NVIDIA先后站了出来,AMD率先拿出了代号Strix Halo锐龙AI MAX+ 395的迷你AI工作站,大约半年后NVIDIA则上市了代号DGX Spark GB10的桌面AI超级计算机,可谓针锋相对。

事实上,两家的解决方案本质上是类似的:强大的CPU/GPU算力引擎、大容量的统一内存和共享显存、迷你的整机造型、友好的开发环境、相对低廉的成本。

但是在硬件设计、性价比、兼容性等多个方面,二者又截然不同。

对于普通的AI开发者来说,该如何选择呢?


AMD方面基于代号Strix Halo的新一代锐龙AI Max 300系列处理器,尤其是旗舰型号锐龙AI Max+ 395,拥有全新的Zen 5 CPU架构、RDNA 3.5 GPU架构,还加入了独立的算力高达50 TOPS 的NPU AI引擎。

支持最多128GB LPDDR5X-8000统一内存,四通道,带宽达256GB/s,可分配最多96GB作为专用显存,以及额外的16GB共享显存,可高效运行千亿参数的大模型,尤其适合MoE专家模型。

如果一台还不能满足,Strix Halo甚至支持双机、四机甚至六机并联,从而提供最多768GB总内存、576GB的总专用显存。

六联智能最近就在中国国际信息通信展览会上做了一个六机并联的演示。


软件生态方面,StrixHalo本身基于X86架构和Windows操作系统生态,对于其原生应用的适配有先天优势,同时,AMD ROCm开源软件框架、Ryzen AI software等开发工具逐步完善,可充分调动CPU/GPU/NPU三大引擎,还有各种第三方资源,正在逐渐成为AI时代的树莓派。

AMD Strix Halo迷你AI工作站目前已经有丰富的产品陆续上市,普遍都是迷你机形态,不占用更多空间,甚至可以随身携带,包括但不限于Abee、AOKZOE、惠普、联想、希未、零刻、六联智能、极摩客、天钡、铭凡、积核等等。

终端价格也非常友好,普遍低至1.5万元甚至更低,对于个人开发者和中小企业来说非常友好,相比于动辄数万甚至数十万的工作站来说非常亲民。

它们可以广泛应用于个人和企业AI开发者、AI教育与科研、小型企业/单个业务部门/小型工作室、医疗/金融/法律等特定领域专家助手、会议室等边缘场景、金融/财务/交易研究与决策、数据分析、家庭AI中枢,等等不同场景。


NVIDIA DGX Spark(代号Project Digits)虽然年初就官宣了,但一直拖到第四季度才上市,可谓相当坎坷。

但DGX系列由来已久,最早可以追溯到2016年的DGX-1,黄仁勋亲自给了马斯克一台,进而催生了OpenAI。

DGX Spark的核心引擎是GB10 SuperChip超级芯片,配备了自研的Grace CPU、Blackwell GPU算力引擎,性能达到千万亿次级别,但是没有NPU。

同样支持128GB LPDDR5X-9400统一内存,带宽更高301GB/s,而且能分享100GB左右作为显存使用,可运行最高2000亿参数的AI大模型,或者最高700亿参数的微调模型。

它也支持双机并联,从而支持4050亿参数大模型。

软件生态方面最大的依仗自然是NVIDIA CUDA,预装NVIDIA AI软件堆栈,支持开箱即用,还能访问模型、库、NVIDIA NIM微服务等生态工具。

全球不少大型科技企业、研究机构都已经收到了DGX Spark进行测试、验证、优化和开发工作,宏碁、华硕、戴尔、技嘉、惠普、联想、微星等厂商则正在推出各自的OEM产品。

价格相对更贵一些,普遍需要3-4万元起步,甚至更高。


总体而言,AMD Strix Halo、NVIDIA DGX Spark都为AI开发者提供了优秀的解决方案,堪称本地端侧AI开发的神器,各自都有各自的显著优势。

AMD Strix Halo的最大优势就是更好的兼容性,基于非常成熟的x86硬件、Windows系统。

无需特殊优化,开箱即有大量的开发软件、应用软件,不但针对AI负载有越来越好的优化,在日常应用中也无需任何妥协,因此在开发工作之外还是一个优秀的平台,可以"一机多用"。

相比之下,NVIDIA DGX Spark基于Arm硬件、Linux系统,生态兼容方面存在天然劣势,在日常应用中可谓举步维艰,只能是个单纯的开发机,当然好的一面就是CUDA生态极为优秀、强大,开发工作非常容易上手,但注定只是个单纯的开发机。

同时,AMD Strix Halo迷你AI工作站起步更早,产品发展非常顺利,目前已经有大量款式,而且价格普遍非常实惠,最低杀到了1.3万元左右,对于开发者来说简直是白菜价。

NVIDIA DGX Spark折腾了将近一年才终于上市,第三方产品还在陆续发布,而且价格普遍贵得多,至少也得3.4万元以上,失去了端侧AI的成本优势。

最后在AI推理性能方面,虽然二者都支持128GB统一内存和100GB左右的显存,但是目前来看,AMD Strix Halo明显占据优势,尤其是凭借更低的价格,性价比更是遥遥领先。



因为NVIDIA DGX Spark刚刚推出,而且双方架构截然不同,所以目前的直接对比还很少。

幸好油管博主Bijan Bowen做了一次深入对比,我们就借用他的数据来看看,从网友评论看该博主的测试被称赞称为真正独立客观,最为诚实,而其他类似测试都像是DGX Spark的广告。

AMD方面使用的是极摩客EVO-X2,体积只有大约2.76升,最小巧的Strix Halo迷你工作站之一,配备了2.5G网卡、双USB4等等,价格14999元,非常典型。


这里测试了Llama 3.3 70B、GTP-OSS 20B、Qwen3 0.6B等几个典型模型库。

结果显示,在推理输出表现上,也就是每秒生成多少个token,双方其实互有胜负,而且差距都在个位数,可谓旗鼓相当。

但是TTFT,也就是输出第一个token的时间,AMD Strix Halo取得了三胜一负的好成绩,而且领先幅度都非常大, NVIDIA DGX Spark只是在Llama上赢了一次。


在AI发展日新月异的当下,无论是AMD Strix Halo,还是NVIDIA DGX Spark,乃至苹果的Mac Studio,都可谓生逢其时,完美顺应了本地端侧、边缘侧AI推理开发与应用的趋势,提供了堪称当下最好的解决方案。

但苹果的生态过于封闭,而英特尔推出的桌面AI超算中心产品基本算是消费级的配置和性能,无法与这三款产品同台竞争。多数小企业和个人开发者能选择的,也就剩下AMD Strix Halo和NVIDIA DGX Spark两个了。

不管叫迷你AI工作站,还是桌面AI超级计算机,它们都解决了数据安全、成本控制的难题,开辟了一个全新品类,填补了AI开发的最后一公里空白。

AMD Strix Halo的丰富产品、优秀兼容性、超高性价比,使之可以赋能更多的普通开发者、小型企业和工作室,让大家都跟上生成式AI的新浪潮,挖掘出独特的商机,同时作为日常使用也极其强大,AMD要做的就是不断提供更加强大、便利的开发环境。

NVIDIA DGX Spark有着领导AI的市场地位、更好的CUDA开发生态和基础,如果能再便宜一些,无疑会有更多的专业用户。

不过还是前面提到的那句话,NVIDIA DGX Spark基于Arm硬件、Linux系统,在日常应用中可谓几无用武之地,注定只是个单纯的开发机。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
太突然!董事长汤建,因心梗意外去世

太突然!董事长汤建,因心梗意外去世

每日经济新闻
2026-03-25 18:21:26
日军官闯中国使馆后,天皇玄孙迅速澄清,高市失声,特朗普没说错

日军官闯中国使馆后,天皇玄孙迅速澄清,高市失声,特朗普没说错

谛听骨语本尊
2026-03-25 16:26:02
梁兴初被隔离审查8年,自由后叶帅给出两个选择,梁:一个也不要

梁兴初被隔离审查8年,自由后叶帅给出两个选择,梁:一个也不要

兴趣知识
2026-03-25 12:32:27
王励勤动真格了!伦敦世乒赛阵容有变,陈梦调整,2人被冷落

王励勤动真格了!伦敦世乒赛阵容有变,陈梦调整,2人被冷落

不似少年游
2026-03-25 17:03:59
张雪峰传奇人生揭秘:父母下岗,大学考上郑大,第一份工作开饭店

张雪峰传奇人生揭秘:父母下岗,大学考上郑大,第一份工作开饭店

谈史论天地
2026-03-25 07:26:54
这是清朝格格们的真实容貌,都看看吧,这不是演员扮演的

这是清朝格格们的真实容貌,都看看吧,这不是演员扮演的

圆梦的小老头
2026-03-24 13:38:33
黄天鹅就鸡蛋角黄素抽检结果发布声明,三地监管部门抽检结果反馈,鸡蛋未检出角黄素

黄天鹅就鸡蛋角黄素抽检结果发布声明,三地监管部门抽检结果反馈,鸡蛋未检出角黄素

每日经济新闻
2026-03-25 18:11:54
离谱!皇马队医坑完姆巴佩坑卡马文加,前员工曝其用ChatGPT开药

离谱!皇马队医坑完姆巴佩坑卡马文加,前员工曝其用ChatGPT开药

仰卧撑FTUer
2026-03-26 08:02:05
面对伊朗同归于尽打法,美军亮出王炸底牌:如果战败,就爆核武器

面对伊朗同归于尽打法,美军亮出王炸底牌:如果战败,就爆核武器

半壁胭脂色
2026-03-24 16:09:17
女儿高考当天,我撞见婆婆往她汤里下药,我偷偷换给了高考的侄子

女儿高考当天,我撞见婆婆往她汤里下药,我偷偷换给了高考的侄子

鱼语昱雨轩
2026-03-25 14:03:47
央视发文,60岁释永信再迎噩耗,被他害惨的4个明星也出了口恶气

央视发文,60岁释永信再迎噩耗,被他害惨的4个明星也出了口恶气

阿伧说事
2026-03-25 07:11:23
87年薄一波去杭州探望陈云,期间二人神秘交谈,薄提醒:你悠着点

87年薄一波去杭州探望陈云,期间二人神秘交谈,薄提醒:你悠着点

谈古论今历史有道
2026-03-25 15:15:03
好莱坞的AI招魂术:死亡不再是劳动的终点

好莱坞的AI招魂术:死亡不再是劳动的终点

动察Beating
2026-03-26 11:06:56
中方坚决扣留船只,美方及时干预 取消中企投标资格,巴拿马难挽

中方坚决扣留船只,美方及时干预 取消中企投标资格,巴拿马难挽

南宗历史
2026-03-25 16:04:15
姆巴佩:无法想象没有内马尔的世界杯,但我也不能去反对安帅

姆巴佩:无法想象没有内马尔的世界杯,但我也不能去反对安帅

懂球帝
2026-03-26 07:00:47
固态电池神话破灭?比亚迪三款千公里续航实车已杀到!

固态电池神话破灭?比亚迪三款千公里续航实车已杀到!

芭比衣橱
2026-03-26 09:52:41
李双江庆87岁大寿!怒吼要奋斗到90岁,切不动蛋糕戴玉强扶手帮忙

李双江庆87岁大寿!怒吼要奋斗到90岁,切不动蛋糕戴玉强扶手帮忙

嫹笔牂牂
2026-03-26 07:37:49
5种“夺命花”不要养,家里要有赶快扔,谁不听劝谁吃亏

5种“夺命花”不要养,家里要有赶快扔,谁不听劝谁吃亏

三农老历
2026-03-26 09:42:30
打疯!东契奇生涯32次单节20+追平哈登 历史第三仅输库里科比

打疯!东契奇生涯32次单节20+追平哈登 历史第三仅输库里科比

醉卧浮生
2026-03-26 07:54:15
新型啃老正流行,67岁大妈哭诉:女儿的陪伴式养老是我晚年的噩梦

新型啃老正流行,67岁大妈哭诉:女儿的陪伴式养老是我晚年的噩梦

惟来
2026-03-25 09:45:12
2026-03-26 13:51:00
快科技 incentive-icons
快科技
一起关注每日科技热点
108904文章数 260210关注度
往期回顾 全部

数码要闻

配件制造商清单泄露:2026款iPad将搭载A18芯片

头条要闻

伊朗议长和外长暂被移出美以清除名单 时限4到5天

头条要闻

伊朗议长和外长暂被移出美以清除名单 时限4到5天

体育要闻

35岁替补门将,凭什么入选英格兰队?

娱乐要闻

张雪峰家人首发声 不设追思会丧事从简

财经要闻

黄仁勋:芯片公司的时代已经结束了

科技要闻

Meta高管狂分百亿期权,700名员工却下岗

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

游戏
旅游
时尚
本地
军事航空

IGN认为Xbox机会来了!新主机要转守为攻 重塑自我

旅游要闻

明起全面实行线上实名预约购票!云台山景区发布公告

2026年了,最好看的还是“这件针织”!

本地新闻

春日吃花第三站——广东

军事要闻

担心特朗普突然停战 以总理下令48小时尽力摧毁伊设施

无障碍浏览 进入关怀版