网易首页 > 网易号 > 正文 申请入驻

ROCm加持下的AMD 显卡AI性能究竟有多强?RX 7900 XT Ubuntu环境下Stable Diffusion实测

0
分享至

如果说游戏的世界离不开高性能显卡的陪伴,那么在AI大肆发展的今天,个人如何利用显卡的高性能并行处理能力,实现游戏设备到生产力装备的华丽变身,或许就是普通人赶上AI热潮的重要节点。

算力决胜,ROCm为AMD GPU性能加成

但疑问总是有的,目前AI热潮中,云端和本地都是各大软硬件厂商们争夺的焦点,由于云端计算更容易发挥集群效能,更容易运行需要海量算力的巨无霸模型,尤其是在硬件厂商们提供的统一计算平台加持下,通用性、灵活性、弹性乃至算力都不是个人所能比拟的。但云端计算不可避免的需要网络以及涉及隐私的缺点,就让个人终端AI算力也有可用之地,最近爆火的NPU AI计算硬件就是如此,虽然算力远不及云端,但极度个性化的优点就注定了终端算力能够成为每个人的随身生产力工具。


问题就是,如何在兼顾隐私、高灵活性、高度个性化的同时,获得强大且随叫随到的性能呢?其实答案在上一段就有提到,就是通用计算平台,而AMD作为全球范围内为数不多的AI硬件提供商,也为自家的CPU、APU以及GPU开发了一套通用、开源的软件平台——ROCm。


作为一个玩家们不太了解的“新”名词,做一个大致的了解是必须的,ROCm,全称为Radeon Open Compute platform,是由AMD开发的用于图形处理器(GPU)编程的软件栈,以广泛通用而著称,但我们并不需要了解太深,只需要记住它的几个特点。

覆盖领域广:覆盖图形处理器通用计算(GPGPU)、高性能计算(HPC)和异构计算。

编程模型多:HIP(基于GPU内核的编程)、OpenMP/讯息传递介面(基于指令的编程)和OpenCL。

开放生态:ROCm是一个开放式软件堆栈,包含了多种编程模型、工具、编译器、库和运行时,用于开发面向AMD GPU的AI和HPC解决方案。它支持广泛的AI软件生态系统,包括大型语言模型、图像/视频检测与识别、生命科学与药物研发、自动驾驶、机器人等领域的优化方案。


一图以蔽之,作为介于算力硬件与AI生态的必要底层平台,ROCm可以为使用者发挥出AMD硬件应有的性能水准。

看20GB显存的Radeon RX 7900XT究竟有多大潜力

看到这儿你可能会有疑问,这与个人消费者关系有多大?或者说我们普通消费者能用到ROCm平台的便利吗?

别忘了,上文提到ROCm是为AMD自家算力硬件开发的,那么不仅是用于云端AI计算的MI300以及用于专业工作站的Pro系列显卡,个人消费用来玩游戏的Radeon显卡也能用上ROCm,而运行在ROCm的Radeon显卡究竟能发挥出多少性能,我们不妨探究一下。


为此我们特意请来了一块Radeon RX 7900XT显卡,作为专业的游戏玩家,这次我们不拿它讲游戏,而是来一场离经叛道的AI计算,在此之前我们已经探究过Radeon RX 7900XT在游戏方面有过出色的性价比表现,但这次我们可以单纯的看看Radeon RX 7900XT在各个精度的算力表现。


显然,Radeon RX 7900XT作为目前高端显卡,配备的20GB GDDR6显存对于AI计算推理来说有着不小的作用,当然,最为受用的是基于RDNA3架构打造的Radeon RX 7900XT拥有了全新的AI加速单元,能够大大提升大参数量下的计算速度。


而据AMD官方称,RDNA3架构下的AI计算性能相较于上一代拥有至高2.7倍的性能提升,在目前硬件性能逐渐显露瓶颈的当下,如此提升也能看出RDNA3架构的优势。


回到AI计算本身,以一经推出就广受大家追捧的文本to图像工具Stable Diffusion为例,由于软件本身并不是基于AMD硬件所开发,所以在Windows环境下,Stable Diffusion的运行效率并不是那么完美,发挥不出AMD硬件应有的超高计算性能。即便是AMD联合微软推出的Olive优化工具在进行模型优化后能够带来近乎翻倍的性能提升,但转译以及需要预先优化带来的繁琐依旧是不够完美。


实测Stable Diffusion,这次我们运行在Ubuntu环境下

那么一起来看看在Ubuntu环境下使用ROCm平台的Stable Diffusion能够拥有怎样的表现,测试平台如下:

显卡:AMD Radeon RX 7900XT

处理器:AMD Ryzen 9 7900

散热器:ROG RYUO龙王三代 360ARGB一体式水冷散热器

主板:华硕TUF GAMING B650M-PLUS重炮手

内存:阿斯加特(Asgard)32GB(16Gx2) 金伦加&TUF联名款 6400MT

硬盘:西部数据(WD)SStable Diffusion M.2 NVMe SN580 蓝盘 1TB

电源:长城(GreatWall) 巨龙电源金牌全模1250DA 90+

系统:Ubuntu 22.04.4 LTS

在完成系统部署之后,崭新的Ubuntu桌面引入眼帘,相较于Windows系统下部署Stable Diffusion需要准备复杂的变量设置、Git安装以及Python部署而言,Ubuntu系统只需简单的两行命令部署完ROCm以及Python即可准备好环境。

我们在安装完ROCm以及Python后,在主目录下完成基于Stable Diffusion的AUTOMATIC1111 WebUI部署,全程仅需花费十分钟左右,当然,大部分时间花销在在线拉取资源,如若网络环境优秀,几分钟即可安装一个Stable Diffusion。


与Windows环境下的Stable Diffusion WebUI相似,使用终端运行启动脚本,同时需要注意的是,由于原版Stable Diffusion添加了对CUDA环境的检测,如未检测到CUDA硬件会进行警告导致程序无法运行,当然,我们直接通过添加命令的方式跳过了这一检测步骤,同时,为了安装更多有意思的插件(如提示词翻译、提示词超市等),我们也一步到位提前通过命令关闭了Stable Diffusion对未经认证插件的安装限制。


在原版Stable Diffusion基础上,我们额外安装了非常常用的ControlNet、中文WebUI语言包等插件,打造成专属于自己的Stable Diffusion。


当然,你可以选择官方主线提供的海量插件,或者通过链接直接部署各种第三方插件,只要此前有接触过Windows版本的Stable Diffusion,那么Ubuntu环境下的Stable Diffusion自然能够很快上手。


简单小试牛刀,在Stable Diffusion自带的1.5版本模型下,采用DPM++ 2M Karras采样器,进行512x512分辨率,正向提示词为“a girl”,不添加反向提示词,迭代次数设置20次,不开启Hires.fix分辨率修复,其余参数默认的情况下,这块Radeon RX 7900 XT可以达到8.42it/s(步/秒)的速度,全图生成仅花费2.7秒,如此成绩相较Windows非ROCm环境下成绩提升极为夸张,当然,这才是这块Radeon RX 7900 XT的真正实力。


EF点评:

此前我们有讲过,目前借用AI形成一整套工作流的生产方式已经非常成熟,以从业人数众多的服装类电商行业为例,使用文生图AI工具进行服装打版、店铺装修、商品详情页设计,并且使用本地算力能够自由打造专属的图像风格,对于效率而言是一个极为夸张的提升。


而售前及售后,可以想象的是,针对店铺以及所售商品、平台政策甚至商家个性而打造的专属大语言模型能够7x24小时不间断服务,实现运营效率的极大提升。这一切都离不开一个专职的高算力终端,那么结合算力与构建成本来看,拥有ROCm平台加持的Radeon RX 7900 XT或许会是更好的选择。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
世联赛悲喜一夜:荷兰3-1抢9.37分,日本横扫韩国,9连胜球队诞生

世联赛悲喜一夜:荷兰3-1抢9.37分,日本横扫韩国,9连胜球队诞生

元爸体育
2024-06-16 20:45:37
泪目!黑龙江车祸5人遇难,高考生家长心如刀绞

泪目!黑龙江车祸5人遇难,高考生家长心如刀绞

起喜电影
2024-06-16 15:57:04
倒查30年税务?有企业被要求补齐消费税3亿,网友热议不断!

倒查30年税务?有企业被要求补齐消费税3亿,网友热议不断!

眼光很亮
2024-06-16 08:01:14
中国军舰抵达仙宾礁后!美航母编队也跟了过来,甲板上摆满了弹药

中国军舰抵达仙宾礁后!美航母编队也跟了过来,甲板上摆满了弹药

笔墨V
2024-06-14 10:02:01
汪小菲带马筱梅和孩子们民宿泡温泉,网友:孩子们玩儿美了!

汪小菲带马筱梅和孩子们民宿泡温泉,网友:孩子们玩儿美了!

娱记掌门
2024-06-16 16:45:05
料定不敢抓人?中国海警第3号令生效的当天,菲律宾向仙宾礁派兵

料定不敢抓人?中国海警第3号令生效的当天,菲律宾向仙宾礁派兵

文雅笔墨
2024-06-15 20:08:58
1-1!申花反超海港重夺中超榜首,蒋圣龙乌龙送大礼!费利佩失点

1-1!申花反超海港重夺中超榜首,蒋圣龙乌龙送大礼!费利佩失点

易说体坛
2024-06-16 21:40:45
上海失踪女童遗体已找到 排除刑事案件

上海失踪女童遗体已找到 排除刑事案件

北青网-北京青年报
2024-06-15 17:05:07
特朗普放弃抵抗,美大选提前终结?奥斯汀罕见对华交底,果不简单

特朗普放弃抵抗,美大选提前终结?奥斯汀罕见对华交底,果不简单

全民历史观
2024-06-16 09:19:07
喜出望外!火箭捡到宝了,2米01神锋化身训练狂魔,乌度卡摊牌了

喜出望外!火箭捡到宝了,2米01神锋化身训练狂魔,乌度卡摊牌了

老王体育说
2024-06-16 18:54:56
武汉黑恶势力、放高利贷、经营抵押典当行现象分析

武汉黑恶势力、放高利贷、经营抵押典当行现象分析

阿莱美食汇
2024-06-16 16:39:14
女副镇长出轨领导,聊天记录被丈夫曝光,内容露骨毁三观

女副镇长出轨领导,聊天记录被丈夫曝光,内容露骨毁三观

奇趣阁
2024-06-16 11:10:23
无法理解!手握三枚总冠军戒指,28岁却被裁掉,他的巅峰这么短?

无法理解!手握三枚总冠军戒指,28岁却被裁掉,他的巅峰这么短?

球毛鬼胎
2024-06-11 13:08:04
17岁身价上亿?亚马尔1年前15岁0身价,如今16岁已涨至9000万

17岁身价上亿?亚马尔1年前15岁0身价,如今16岁已涨至9000万

直播吧
2024-06-16 11:01:22
大陆无人机进金门,两岸战线一致,台退将行动了,邱毅狙击赖清德

大陆无人机进金门,两岸战线一致,台退将行动了,邱毅狙击赖清德

笔墨V
2024-06-16 21:30:21
鲁能大牌新归化夏窗正式到位,将锁定主力指挥官位置,本人已同意

鲁能大牌新归化夏窗正式到位,将锁定主力指挥官位置,本人已同意

罗掌柜体育
2024-06-15 19:35:29
县城的现状,一针见血!

县城的现状,一针见血!

深度知局
2024-05-18 18:01:33
税务总局:父母、配偶、子女等亲属间赠与房产,免20%个税!

税务总局:父母、配偶、子女等亲属间赠与房产,免20%个税!

周军律师聊案子
2024-06-10 08:49:06
她是新中国第一位女副总理,任职2年后主动辞职,今年已经86岁了

她是新中国第一位女副总理,任职2年后主动辞职,今年已经86岁了

江东浪流史
2024-06-16 12:22:21
广东一景区突发坍塌!多地紧急公告:临时闭园!禁止入内

广东一景区突发坍塌!多地紧急公告:临时闭园!禁止入内

奔流新闻
2024-06-16 16:33:52
2024-06-16 22:30:44
新潮电子杂志
新潮电子杂志
任何泛科技我们都要聊
2281文章数 819关注度
往期回顾 全部

数码要闻

或月底发布!一加 Pad Pro 通过认证:支持67W快充

头条要闻

牵涉越南“女首富”案 又一位越共中央高层受处分

头条要闻

牵涉越南“女首富”案 又一位越共中央高层受处分

体育要闻

没人永远年轻 但青春如此无敌还是离谱了些

娱乐要闻

上影节红毯:倪妮好松弛,娜扎吸睛

财经要闻

打断妻子多根肋骨 上市公司创始人被公诉

科技要闻

iPhone 16会杀死大模型APP吗?

汽车要闻

售17.68万-21.68万元 极狐阿尔法S5正式上市

态度原创

家居
房产
游戏
旅游
数码

家居要闻

空谷来音 朴素留白的侘寂之美

房产要闻

万华对面!海口今年首宗超百亩宅地,重磅挂出!

《夺宝奇兵》涉及多个关卡场景 新老角色都有

旅游要闻

@毕业生,江苏这些景区可享免票或优惠

数码要闻

AMD RDNA3.5核显跑分喜人!非常接近RTX 2050

无障碍浏览 进入关怀版