网易首页 > 网易号 > 正文 申请入驻

ROCm加持下的AMD 显卡AI性能究竟有多强?RX 7900 XT Ubuntu环境下Stable Diffusion实测

0
分享至

如果说游戏的世界离不开高性能显卡的陪伴,那么在AI大肆发展的今天,个人如何利用显卡的高性能并行处理能力,实现游戏设备到生产力装备的华丽变身,或许就是普通人赶上AI热潮的重要节点。

算力决胜,ROCm为AMD GPU性能加成

但疑问总是有的,目前AI热潮中,云端和本地都是各大软硬件厂商们争夺的焦点,由于云端计算更容易发挥集群效能,更容易运行需要海量算力的巨无霸模型,尤其是在硬件厂商们提供的统一计算平台加持下,通用性、灵活性、弹性乃至算力都不是个人所能比拟的。但云端计算不可避免的需要网络以及涉及隐私的缺点,就让个人终端AI算力也有可用之地,最近爆火的NPU AI计算硬件就是如此,虽然算力远不及云端,但极度个性化的优点就注定了终端算力能够成为每个人的随身生产力工具。

问题就是,如何在兼顾隐私、高灵活性、高度个性化的同时,获得强大且随叫随到的性能呢?其实答案在上一段就有提到,就是通用计算平台,而AMD作为全球范围内为数不多的AI硬件提供商,也为自家的CPU、APU以及GPU开发了一套通用、开源的软件平台——ROCm。

作为一个玩家们不太了解的“新”名词,做一个大致的了解是必须的,ROCm,全称为Radeon Open Compute platform,是由AMD开发的用于图形处理器(GPU)编程的软件栈,以广泛通用而著称,但我们并不需要了解太深,只需要记住它的几个特点。

覆盖领域广:覆盖图形处理器通用计算(GPGPU)、高性能计算(HPC)和异构计算。

编程模型多:HIP(基于GPU内核的编程)、OpenMP/讯息传递介面(基于指令的编程)和OpenCL。

开放生态:ROCm是一个开放式软件堆栈,包含了多种编程模型、工具、编译器、库和运行时,用于开发面向AMD GPU的AI和HPC解决方案。它支持广泛的AI软件生态系统,包括大型语言模型、图像/视频检测与识别、生命科学与药物研发、自动驾驶、机器人等领域的优化方案。

一图以蔽之,作为介于算力硬件与AI生态的必要底层平台,ROCm可以为使用者发挥出AMD硬件应有的性能水准。

看20GB显存的Radeon RX 7900XT究竟有多大潜力

看到这儿你可能会有疑问,这与个人消费者关系有多大?或者说我们普通消费者能用到ROCm平台的便利吗?

别忘了,上文提到ROCm是为AMD自家算力硬件开发的,那么不仅是用于云端AI计算的MI300以及用于专业工作站的Pro系列显卡,个人消费用来玩游戏的Radeon显卡也能用上ROCm,而运行在ROCm的Radeon显卡究竟能发挥出多少性能,我们不妨探究一下。

为此我们特意请来了一块Radeon RX 7900XT显卡,作为专业的游戏玩家,这次我们不拿它讲游戏,而是来一场离经叛道的AI计算,在此之前我们已经探究过Radeon RX 7900XT在游戏方面有过出色的性价比表现,但这次我们可以单纯的看看Radeon RX 7900XT在各个精度的算力表现。

显然,Radeon RX 7900XT作为目前高端显卡,配备的20GB GDDR6显存对于AI计算推理来说有着不小的作用,当然,最为受用的是基于RDNA3架构打造的Radeon RX 7900XT拥有了全新的AI加速单元,能够大大提升大参数量下的计算速度。

而据AMD官方称,RDNA3架构下的AI计算性能相较于上一代拥有至高2.7倍的性能提升,在目前硬件性能逐渐显露瓶颈的当下,如此提升也能看出RDNA3架构的优势。

回到AI计算本身,以一经推出就广受大家追捧的文本to图像工具Stable Diffusion为例,由于软件本身并不是基于AMD硬件所开发,所以在Windows环境下,Stable Diffusion的运行效率并不是那么完美,发挥不出AMD硬件应有的超高计算性能。即便是AMD联合微软推出的Olive优化工具在进行模型优化后能够带来近乎翻倍的性能提升,但转译以及需要预先优化带来的繁琐依旧是不够完美。

实测Stable Diffusion,这次我们运行在Ubuntu环境下

那么一起来看看在Ubuntu环境下使用ROCm平台的Stable Diffusion能够拥有怎样的表现,测试平台如下:

显卡:AMD Radeon RX 7900XT

处理器:AMD Ryzen 9 7900

散热器:ROG RYUO龙王三代 360ARGB一体式水冷散热器

主板:华硕TUF GAMING B650M-PLUS重炮手

内存:阿斯加特(Asgard)32GB(16Gx2) 金伦加&TUF联名款 6400MT

硬盘:西部数据(WD)SStable Diffusion M.2 NVMe SN580 蓝盘 1TB

电源:长城(GreatWall) 巨龙电源金牌全模1250DA 90+

系统:Ubuntu 22.04.4 LTS

在完成系统部署之后,崭新的Ubuntu桌面引入眼帘,相较于Windows系统下部署Stable Diffusion需要准备复杂的变量设置、Git安装以及Python部署而言,Ubuntu系统只需简单的两行命令部署完ROCm以及Python即可准备好环境。

我们在安装完ROCm以及Python后,在主目录下完成基于Stable Diffusion的AUTOMATIC1111 WebUI部署,全程仅需花费十分钟左右,当然,大部分时间花销在在线拉取资源,如若网络环境优秀,几分钟即可安装一个Stable Diffusion。

与Windows环境下的Stable Diffusion WebUI相似,使用终端运行启动脚本,同时需要注意的是,由于原版Stable Diffusion添加了对CUDA环境的检测,如未检测到CUDA硬件会进行警告导致程序无法运行,当然,我们直接通过添加命令的方式跳过了这一检测步骤,同时,为了安装更多有意思的插件(如提示词翻译、提示词超市等),我们也一步到位提前通过命令关闭了Stable Diffusion对未经认证插件的安装限制。

在原版Stable Diffusion基础上,我们额外安装了非常常用的ControlNet、中文WebUI语言包等插件,打造成专属于自己的Stable Diffusion。

当然,你可以选择官方主线提供的海量插件,或者通过链接直接部署各种第三方插件,只要此前有接触过Windows版本的Stable Diffusion,那么Ubuntu环境下的Stable Diffusion自然能够很快上手。

简单小试牛刀,在Stable Diffusion自带的1.5版本模型下,采用DPM++ 2M Karras采样器,进行512x512分辨率,正向提示词为“a girl”,不添加反向提示词,迭代次数设置20次,不开启Hires.fix分辨率修复,其余参数默认的情况下,这块Radeon RX 7900 XT可以达到8.42it/s(步/秒)的速度,全图生成仅花费2.7秒,如此成绩相较Windows非ROCm环境下成绩提升极为夸张,当然,这才是这块Radeon RX 7900 XT的真正实力。

EF点评:

此前我们有讲过,目前借用AI形成一整套工作流的生产方式已经非常成熟,以从业人数众多的服装类电商行业为例,使用文生图AI工具进行服装打版、店铺装修、商品详情页设计,并且使用本地算力能够自由打造专属的图像风格,对于效率而言是一个极为夸张的提升。

而售前及售后,可以想象的是,针对店铺以及所售商品、平台政策甚至商家个性而打造的专属大语言模型能够7x24小时不间断服务,实现运营效率的极大提升。这一切都离不开一个专职的高算力终端,那么结合算力与构建成本来看,拥有ROCm平台加持的Radeon RX 7900 XT或许会是更好的选择。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
79岁林子祥和老婆上海购物,叶蒨文打扮贵气,脖子上挂着几串珍珠

79岁林子祥和老婆上海购物,叶蒨文打扮贵气,脖子上挂着几串珍珠

一盅情怀
2026-06-12 19:26:34
笑麻了!人一旦有了电瓶车,体重就彻底控制不住,评论区炸锅了

笑麻了!人一旦有了电瓶车,体重就彻底控制不住,评论区炸锅了

夜深爱杂谈
2026-06-12 19:42:26
中国管制磷化铟!全球 AI 芯片供应链遭重击!

中国管制磷化铟!全球 AI 芯片供应链遭重击!

EETOP半导体社区
2026-06-12 11:59:54
感谢电车,让我买到了20万的路虎。。。

感谢电车,让我买到了20万的路虎。。。

差评XPIN
2026-06-13 00:13:46
赛力斯张兴海:存储芯片、碳酸锂价格飞涨,一辆车成本增长超1.5万元

赛力斯张兴海:存储芯片、碳酸锂价格飞涨,一辆车成本增长超1.5万元

贝壳财经
2026-06-12 18:38:03
网传东方甄选离职主播唯独把中灿给甩开了?真相其实很简单!

网传东方甄选离职主播唯独把中灿给甩开了?真相其实很简单!

冯军同学
2026-06-13 08:33:09
在平安,孟羽童又能干多久?

在平安,孟羽童又能干多久?

正经社
2026-06-12 17:08:00
他在SpaceX最危险时刻借给马斯克100万美元,如今可能收获1300亿美元

他在SpaceX最危险时刻借给马斯克100万美元,如今可能收获1300亿美元

NASA爱好者
2026-06-09 00:30:03
一定要大量存钱,2026到2030年现金要比想象中更金贵!

一定要大量存钱,2026到2030年现金要比想象中更金贵!

猫叔东山再起
2026-06-12 08:15:11
是不是没戏了!一张截图引发的职场未解之谜

是不是没戏了!一张截图引发的职场未解之谜

自愈小日子
2026-06-12 00:33:30
苏州一对情侣,谈了7年,女子提了18次分手,分手后在街头痛哭!

苏州一对情侣,谈了7年,女子提了18次分手,分手后在街头痛哭!

川渝视觉
2026-04-17 22:13:14
比老板张雪懂球?34岁德比斯:姆巴佩不是法国队一哥!登贝莱才是

比老板张雪懂球?34岁德比斯:姆巴佩不是法国队一哥!登贝莱才是

念洲
2026-06-13 07:54:28
女子开LCC辅助驾驶自驾331国道,撞上土堆车辆腾空飞起,安全气囊弹出,当事人:交警告知该路段尚未正式交付,但现场无警示牌和围挡

女子开LCC辅助驾驶自驾331国道,撞上土堆车辆腾空飞起,安全气囊弹出,当事人:交警告知该路段尚未正式交付,但现场无警示牌和围挡

潇湘晨报
2026-06-12 18:28:14
曾经落地近90万的神车!路虎揽胜极光L跌至17.98万

曾经落地近90万的神车!路虎揽胜极光L跌至17.98万

中国能源网
2026-06-11 10:58:56
总决赛G5 尼克斯客场冲冠

总决赛G5 尼克斯客场冲冠

体坛周报
2026-06-13 06:44:14
利好来了!霍尔木兹海峡开放大消息,石油直线暴跌,全球股市拉升!

利好来了!霍尔木兹海峡开放大消息,石油直线暴跌,全球股市拉升!

中国基金报
2026-06-12 19:46:45
浦发集团,掀桌子了

浦发集团,掀桌子了

地产K线官方
2026-06-12 21:14:07
CBA官宣选秀大会初始完整顺位:四川状元签 江苏榜眼签天津探花签

CBA官宣选秀大会初始完整顺位:四川状元签 江苏榜眼签天津探花签

醉卧浮生
2026-06-12 18:15:15
晚节不保!黄百鸣被判入狱后,更多恶行被扒,李小冉也曾是受害者

晚节不保!黄百鸣被判入狱后,更多恶行被扒,李小冉也曾是受害者

嘴角上翘的弧度
2026-06-10 21:31:05
德国工程师在中国工厂待了7天,走时说:你们的工作方式太可怕了

德国工程师在中国工厂待了7天,走时说:你们的工作方式太可怕了

千秋文化
2026-06-12 20:37:03
2026-06-13 09:55:00
新潮电子杂志
新潮电子杂志
任何泛科技我们都要聊
3294文章数 830关注度
往期回顾 全部

数码要闻

樱桃发布XTRFY K63W Pro机械键盘:引入UWB技术 可实现 8000Hz 轮询

头条要闻

牛弹琴:全世界都要精疲力竭时 一个超级好消息要来了

头条要闻

牛弹琴:全世界都要精疲力竭时 一个超级好消息要来了

体育要闻

欧洲恐韩?肉德维德?

娱乐要闻

一天4个瓜,肖战热巴最意外

财经要闻

梁文锋向左,杨植麟向右

科技要闻

SpaceX上市首日破2万亿美元,马斯克再封神

汽车要闻

标配激光雷达/双动力可选 昊铂S600限时售17.99万起

态度原创

健康
本地
时尚
公开课
军事航空

老人、小孩、孕妇,吃粽子有啥风险

本地新闻

AK刘彰邂逅河北南大港湿地

今日热点:白鹿起诉蒙淇淇;岳云鹏回应开演唱会质疑……

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

伊外长披露伊美谅解备忘录草案部分内容

无障碍浏览 进入关怀版