网易首页 > 网易号 > 正文 申请入驻

通过AMD锐龙AI 300系列处理器解锁消费级大语言模型巅峰性能

0
分享至

自GPT-2以来,语言模型已经取得了长足的进步,用户现在可以通过LM Studio等用户友好的应用程序快速轻松地部署高度复杂的大语言模型(LLM)。通过和AMD协作,这些工具致力于使每个人都可以使用AI,而不需要编码或技术知识。

llama.cpp和LM Studio概述

LM Studio基于llama.cpp项目,是当前非常流行的快速部署语言模型的框架。它没有依赖性,可以仅使用CPU进行加速——尽管它也有GPU加速功能。LM Studio使用AVX2指令来加速基于x86的CPU的现代大语言模型。

性能对比:吞吐量和延迟

AMD锐龙AI为这些最先进的工作负载进行加速,并在基于llama.cpp的应用程序(如用于x86笔记本电脑的LM Studio)中提供了领先的性能。值得注意的是,大语言模型通常对内存速度非常敏感。

在我们的对比测试中,英特尔笔记本电脑的RAM实际上更快,达到8533MT/s,AMD笔记本电脑的RAM为7500MT/s。尽管如此,AMD锐龙AI 9 HX 375处理器每秒token生成速度却比竞争对手快出27%。

参考信息:每秒token生成量或tk/s表示一个大语言模型(LLM)能够以多快的速度输出token(大致对应于每秒在电脑屏幕上显示的单词数)。】

AMD锐龙AI 9 HX 375处理器可以在Meta Llama 3.2 1b Instruct(4-bit量化)中实现每秒高达50.7个token的性能。

对大型语言模型进行基准测试的另一个指标是“输出首个token的时间”,它测量了从您提交提示到模型开始生成token所需时间之间的延迟。在这里,我们看到,在较大的模型中,基于AMD“Zen 5” 架构的锐龙AI HX 375处理器比竞争对手的同类处理器快3.5倍。

在Windows中使用可变显存(VGM)来加快模型吞吐量

AMD锐龙AI CPU中的三个加速器都有自己的工作负载专业化和它们擅长的场景。AMD基于XDNA 2架构的NPU在运行Copilot+工作负载时为持续的AI功能提供了令人难以置信的能效,CPU为工具和框架提供了广泛的覆盖范围和兼容性,而iGPU通常按需处理AI任务。

LM Studio提供了一个llama.cpp端口,可以使用与供应商无关的Vulkan API来加速框架。这里的加速通常取决于硬件功能和Vulkan API的驱动程序优化。与仅使用CPU模式相比,在LM Studio中打开GPU offload 后Meta Llama 3.2 1b Instruct的性能平均提升可达31%。Mistral Nemo 2407 12b Instruct这样的大型模型在token生成阶段由于受到带宽限制,平均提升可达5.1%。

我们观察到,当在LM Studio中使用基于Vulkan的llama.cpp版本并打开GPU offload时,与仅使用CPU的模式相比,竞争对手的处理器在除一个模型外的所有测试模型中的平均性能都明显较低。因此,为了保持对比测试的公平性,我们没有将英特尔酷睿Ultra7 258v在LM Studio中使用基于Vulkan的Llama.cpp的GPU offload性能纳入对比过程。

AMD锐龙AI 300系列处理器还包括一个名为可变显存(VGM)的功能。通常,程序将利用iGPU的512MB专用分配内存块以及位于系统RAM“共享”部分的第二个内存块。VGM允许用户将512MB专用分配块扩展到高达75%的可用系统RAM容量。这种连续内存分配显著提高了内存敏感型应用程序的吞吐量。

开启VGM(16GB)后,我们看到Meta Llama 3.2 1b Instruct的性能平均提升了22%与使用iGPU加速和VGM相结合时的CPU模式相比,平均速度总共提高了60%。即使是更大的模型,如Mistral Nemo 2407 12b Instruct,与仅使用CPU的模式相比,性能也提升了17%。

对比:Mistral 7b Instruct 0.3

虽然竞争对手的笔记本电脑在LM Studio中使用基于Vulkan的Llama.cpp版本没有提供加速,但我们使用英特尔AI Playground应用程序(基于IPEX-LLM和Lang Chain)比较了iGPU性能,力求在最佳的用户友好型LLM体验之间进行公平的比较。

我们使用了英特尔AI Playground提供的模型,即Mistral 7b Instruct v0.3和Microsoft Phi 3.1 Mini Instruct。在LM Studio中使用可比的量化后,我们发现AMD锐龙AI 9 HX 375在Phi 3.1中的速度相比竞争对手快了8.7%,在Mistral 7b Instruct 0.3中的速度相比对手快了13%。

AMD致力于推进AI前沿技术的发展,让每个人都能使用AI,但如果最新的AI成果被技术或编码技能等高门槛所限制,那这一切就不可能发生——这就是LM Studio这样的应用程序的重要性所在。除了作为在本地部署LLM的一种快速而轻松的方式之外,这些应用程序允许用户在第一时间体验最先进的模型(前提是llama.cpp项目支持该架构)。

AMD锐龙AI加速器提供了令人难以置信的性能,启用可变显存(VGM)等功能可以为AI用例提供更好的性能。所有这些结合在一起,为x86笔记本电脑上的语言模型提供了令人难以置信的用户体验。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
地狱之门将闭!土库曼斯坦巨坑燃烧半世纪,科学家探秘发现了啥?

地狱之门将闭!土库曼斯坦巨坑燃烧半世纪,科学家探秘发现了啥?

向航说
2026-03-18 00:20:03
正式退役!再见了,丁彦雨航!两度拒绝NBA双向合同

正式退役!再见了,丁彦雨航!两度拒绝NBA双向合同

篮球实战宝典
2026-03-20 21:31:09
女子被触摸隐私部位后续!衣服全被脱光,商家只开除,拒绝赔偿

女子被触摸隐私部位后续!衣服全被脱光,商家只开除,拒绝赔偿

潮鹿逐梦
2026-03-18 10:26:41
张雨绮怀了小鲜肉的孩子!?

张雨绮怀了小鲜肉的孩子!?

八卦疯叔
2026-03-20 10:57:18
豪门家族大洗牌!连生5胎女继承人上位,还干出一家“神仙公司”

豪门家族大洗牌!连生5胎女继承人上位,还干出一家“神仙公司”

金融八卦女
2026-03-19 13:42:42
西方意识到大事不妙,中国已经摸清楚美国有几斤几两

西方意识到大事不妙,中国已经摸清楚美国有几斤几两

混沌录
2026-03-20 21:31:05
涉嫌严重违纪违法,重庆市委副书记、市长胡衡华被查

涉嫌严重违纪违法,重庆市委副书记、市长胡衡华被查

吉刻新闻
2026-03-20 14:15:28
东体:常卫魏已不再担任武汉女足主帅,他还是女足国家队备选

东体:常卫魏已不再担任武汉女足主帅,他还是女足国家队备选

懂球帝
2026-03-20 18:09:07
沙特、阿联酋、卡塔尔、土耳其、巴基斯坦等12国发表联合声明

沙特、阿联酋、卡塔尔、土耳其、巴基斯坦等12国发表联合声明

中国经济网
2026-03-20 16:13:02
迪卡侬正式入驻拼多多

迪卡侬正式入驻拼多多

界面新闻
2026-03-20 11:07:11
A股:突然破位,主要原因是这三个,牛市下周或要这样走了!

A股:突然破位,主要原因是这三个,牛市下周或要这样走了!

夜深爱杂谈
2026-03-20 18:56:09
比披丝巾更可怕的是“瑜伽裤外穿”,廉价又卡裆,三角区更尴尬

比披丝巾更可怕的是“瑜伽裤外穿”,廉价又卡裆,三角区更尴尬

生命之泉的奥秘
2026-03-20 03:56:49
关税反击:特朗普已被逼到了悬崖边上,因为中国击中了他这个要害

关税反击:特朗普已被逼到了悬崖边上,因为中国击中了他这个要害

诡谲怪谈
2025-04-18 11:36:10
深圳百亿豪门丑闻曝光:妻子举报,公公劝儿媳接受,更多细节曝光

深圳百亿豪门丑闻曝光:妻子举报,公公劝儿媳接受,更多细节曝光

咸鱼金脑袋
2026-03-19 01:54:52
俄乌战争打了4年,中国终于明白:统一台湾前,这3种人必须铲除

俄乌战争打了4年,中国终于明白:统一台湾前,这3种人必须铲除

青烟小先生
2026-03-17 17:27:02
毛主席视察广西,韦国清端上蛇羹试探:主席您敢吃吗?结果主席一句话让全场愣住

毛主席视察广西,韦国清端上蛇羹试探:主席您敢吃吗?结果主席一句话让全场愣住

史海孤雁
2026-03-20 17:24:12
李嘉诚:不管是过去还是现在,我从未享受过政府丝毫“特殊待遇”

李嘉诚:不管是过去还是现在,我从未享受过政府丝毫“特殊待遇”

混沌录
2026-03-20 21:00:04
香港豪门“坏女孩”去世:袭警、殴打父母,她的一生比电影还离谱

香港豪门“坏女孩”去世:袭警、殴打父母,她的一生比电影还离谱

云舟史策
2026-03-12 12:40:43
又一位网坛天才诞生!17岁新星创纳达尔后最年轻的大师赛赢球纪录

又一位网坛天才诞生!17岁新星创纳达尔后最年轻的大师赛赢球纪录

体育妞世界
2026-03-20 08:50:28
全球最大天然气工厂爆炸,特朗普刚出手就怕了,引爆世界经济危机

全球最大天然气工厂爆炸,特朗普刚出手就怕了,引爆世界经济危机

军机Talk
2026-03-19 11:22:22
2026-03-21 00:19:00
中关村在线 incentive-icons
中关村在线
中关村在线全球第一科技门户
382389文章数 875127关注度
往期回顾 全部

数码要闻

唯卓仕折叠闪光灯首发仅148元,你冲不冲?

头条要闻

向特朗普提问日记者遭疯狂网暴 被骂帮中国让高市难堪

头条要闻

向特朗普提问日记者遭疯狂网暴 被骂帮中国让高市难堪

体育要闻

6年前的一场悲剧,造就了“法国瓦尔迪”

娱乐要闻

总台首届电影盛典,“沈马”CP再合体

财经要闻

金融法草案向社会公开征求意见

科技要闻

宇树招股书拆解,人形机器人出货量第一!

汽车要闻

何小鹏坦白局:每月3亿的“慌”与通向L4的坚定

态度原创

时尚
旅游
家居
手机
军事航空

推广中奖名单-更新至2026年3月4日推广

旅游要闻

加你更奇妙!上海迪士尼十周年启幕,全新城堡秀、限定巡游重磅登场

家居要闻

时空交织 空间绮梦

手机要闻

华为春季新品发布会阵容豪华:3款新机+4款穿戴 还有显示器、智慧屏

军事要闻

特朗普会晤高市早苗 把美国袭击伊朗比作偷袭珍珠港

无障碍浏览 进入关怀版