网易首页 > 网易号 > 正文 申请入驻

CPU与GPU跑本地 AI,谁速度更快?

0
分享至


答案并非“显卡好,CPU差”这么简单。

如果用户在本地运行人工智能,可能见过这样的建议:“买个好显卡”。但这到底是什么意思?CPU真的那么没用吗?答案并非“显卡好,CPU差”这么简单。关键在于每个处理器如何处理人工智能推理背后的数学运算,以及哪个处理器能够以足够快的速度处理数据,从而跟上计算进度。

人工智能推理过程中究竟发生了什么?

当运行本地 LLM 或图像模型时,硬件会反复执行同一件事:矩阵乘法。模型接收输入,将其转换为数字,然后将这些数字传递给各个层进行数十亿次的数学运算。硬件处理这些运算的速度越快,就能越快得到响应。

这是推理,即从训练好的模型中生成输出。用户并没有训练任何东西。只是逐个处理词元,进行数学运算。

CPU如何处理AI工作

CPU 的设计目标是面面俱到。它负责操作系统、浏览器标签页、文件系统,当然,它也能运行人工智能模型。现代 CPU 拥有多个核心(消费级芯片通常为 8 到 24 个),每个核心都功能强大且灵活。

问题在于:人工智能推理需要同时对海量数据执行相同的操作。CPU 可以做到这一点,但它处理这些操作的方式更偏向于顺序处理。这就像让几个速度极快的工人去完成一项实际上需要数百人同时协作才能完成的工作。

话虽如此,CPU并非完全无法胜任本地AI任务。像llama.cpp这样的工具就专门针对CPU推理进行了优化,如果模型能够装进系统内存,那么完全可以只用CPU运行它。只是速度有时会明显变慢,有时则不然,这取决于模型的大小。


GPU 如何处理 AI 工作

GPU 的设计核心就是并行计算。CPU 可能有 8 到 24 个核心,而现代 GPU 则拥有数千个更小的核心,这些核心可以同时处理同一问题的不同部分。这使得 GPU 在人工智能模型所依赖的大规模数学运算方面表现异常出色。

此外,GPU拥有独立的显存(VRAM),其带宽远高于系统内存。带宽至关重要,它决定了数据传输到数千个核心的速度。更高的带宽意味着更少的等待时间和更多的计算时间。

具体到局部LLM推理,GPU的优势体现在两方面:并行处理能力和内存带宽。这两者都直接影响输出中每秒显示的词元数量。


内存带宽

大多数人可能会感到惊讶:对于局部 LLM 推理而言,原始计算能力通常不是限制因素,内存带宽才是。

在推理过程中,需要从内存中读取每个生成的词元对应的模型权重。如果内存无法足够快地将数据传输给处理器,那么无论有多少个核心都无济于事,它们只会闲置等待。

这就是为什么显存带宽如此重要。典型的DDR5系统内存配置可能提供50-90 GB/s的带宽。而像RTX 5090这样的现代GPU可以提供超过1000 GB/s的带宽。这可是数量级的差距。

如果模型完全可以放入显存中,仅凭这一点,GPU 上的推理速度几乎总是比 CPU 上的推理速度更快。


何时仅使用 CPU 才是明智之举

GPU并非总是最佳选择。在某些情况下,使用CPU运行才是正确的选择:

  • 你运行的是一个小型模型(3B 参数或更少),速度差异几乎难以察觉。

  • 您的显卡不兼容,或者您的显卡显存不足以支持该型号。

  • 你想利用全部系统内存(通常比显存大得多)以较慢的速度运行更大的模型。

  • 你使用的是笔记本电脑或台式机,而GPU功耗或发热量是一个需要考虑的问题。

由于量化技术(降低模型精度以减少内存占用)以及针对量化技术优化的框架,CPU推理性能得到了显著提升。在配备32GB内存的现代CPU上运行量化后的70亿模型,足以胜任许多任务。

如果您的模型太大,超出显存容量,但您仍然希望获得 GPU 加速,大多数本地 LLM 工具都支持部分卸载。这意味着模型的某些层在 GPU 上运行,而其余层在 CPU 上运行。

这是一种权衡:虽然能获得一些 GPU 的速度优势,但 CPU 密集型层会成为瓶颈。VRAM 中能容纳的层越多,速度就越快。但如果只有少数几层最终在 GPU 上运行,那么数据在 GPU 和 GPU 之间来回传输的开销实际上可能会使其速度比纯 CPU 推理还要慢。

经验法则是:如果至少一半的模型无法放入显存中,那么最好完全在 CPU 上运行它,从而避免增加复杂性。

NVIDIA 与 AMD 在本地 AI 领域的竞争

NVIDIA 目前在本地 AI 领域占据主导地位,这主要归功于 CUDA。几乎所有 AI 工具都基于 CUDA 这个专有的计算框架构建。如果您在 Windows 系统上使用 LM Studio、Ollama 或 llama.cpp,NVIDIA GPU 将为您带来最流畅的体验,并将故障排除工作量降至最低。

AMD正在迎头赶上。ROCm(AMD对标CUDA的技术)取得了显著进展,像Ollama这样的工具也明确支持Windows上的AMD Radeon GPU。但目前的生态系统仍然较为有限,根据你使用的GPU型号和工具的不同,你可能会遇到兼容性问题。

如果购买显卡的目的是为了本地AI,那么目前NVIDIA显卡是更稳妥的选择。如果你已经拥有AMD显卡,那么也绝对值得一试,但最好先查看一下你所用工具的文档,确认它支持的型号。

*声明:本文系原作者创作。文章内容系其个人观点,我方转载仅为分享与讨论,不代表我方赞成或认同,如有异议,请联系后台。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
两年输光2000亿资产的王健林,可能是中国地产的最后赢家

两年输光2000亿资产的王健林,可能是中国地产的最后赢家

流苏晚晴
2026-05-12 19:20:28
起底那个声称海参崴不存在的微博大v杜建国

起底那个声称海参崴不存在的微博大v杜建国

笔杆论道
2026-05-13 00:01:53
互相取关!5年感情就这么结束了

互相取关!5年感情就这么结束了

柚子说球
2026-05-13 12:16:23
28亿美元!被字节逼到无路可走的喜马拉雅终于卖给了腾讯

28亿美元!被字节逼到无路可走的喜马拉雅终于卖给了腾讯

传心财经
2026-05-13 17:38:12
NBA官宣:骑士vs活塞天王山裁判组 名哨托尼兄弟担任主裁判

NBA官宣:骑士vs活塞天王山裁判组 名哨托尼兄弟担任主裁判

醉卧浮生
2026-05-13 22:15:04
小宝与王某雷,谁探访花的数量更多?

小宝与王某雷,谁探访花的数量更多?

挪威森林
2026-01-31 12:15:26
穆帅若回皇马要买谁?四人引援名单曝光,老佛爷看完得破产!

穆帅若回皇马要买谁?四人引援名单曝光,老佛爷看完得破产!

仰卧撑FTUer
2026-05-13 13:13:03
《主角》胡三元做梦想不到,他入狱后,易青娥被强奸、出轨、囚禁

《主角》胡三元做梦想不到,他入狱后,易青娥被强奸、出轨、囚禁

落雪听梅a
2026-05-13 10:24:05
突发!美股科技股急挫,纳指跌破26000点,闪迪跌8%,高通跌超10%,英特尔跌8%,“大空头”预警:美股或将崩盘

突发!美股科技股急挫,纳指跌破26000点,闪迪跌8%,高通跌超10%,英特尔跌8%,“大空头”预警:美股或将崩盘

台州交通广播
2026-05-13 00:36:21
卢比奥也来了?特朗普访华,美国务卿跟着上了飞机,怎么回事?

卢比奥也来了?特朗普访华,美国务卿跟着上了飞机,怎么回事?

一个有灵魂的作者
2026-05-13 09:56:06
彻底撕破脸!卡塞米罗公开怒怼卡拉格,争议口水战彻底爆发

彻底撕破脸!卡塞米罗公开怒怼卡拉格,争议口水战彻底爆发

夜白侃球
2026-05-13 10:03:45
暴涨 983%!比亚迪横扫韩国车市,杀入万台俱乐部已成定局!

暴涨 983%!比亚迪横扫韩国车市,杀入万台俱乐部已成定局!

郑谊
2026-05-11 17:43:04
爆卖260亿!王传福再开一枪,比亚迪致命一击

爆卖260亿!王传福再开一枪,比亚迪致命一击

象视汽车
2026-05-13 07:00:08
果然不出所料,特朗普访华专机上,藏了个不速之客,给中方出难题

果然不出所料,特朗普访华专机上,藏了个不速之客,给中方出难题

老鼳是个手艺人
2026-05-13 15:17:57
杜锋下课?广东男篮做法有深意,远超外界猜测,徐杰或成交易筹码

杜锋下课?广东男篮做法有深意,远超外界猜测,徐杰或成交易筹码

萌兰聊个球
2026-05-13 16:32:05
新华社消息|外交部:坚决反对所谓“哥本哈根民主峰会”执意邀请“台独”分子大放厥词

新华社消息|外交部:坚决反对所谓“哥本哈根民主峰会”执意邀请“台独”分子大放厥词

新华社
2026-05-13 19:59:39
导航怎么知道“红绿灯变化的”?你以为是黑科技,其实原理很简单

导航怎么知道“红绿灯变化的”?你以为是黑科技,其实原理很简单

Thurman在昆明
2026-05-11 14:19:39
人民日报:中美关系回不到过去,但能够有一个更好的未来

人民日报:中美关系回不到过去,但能够有一个更好的未来

新京报
2026-05-13 08:11:06
寿命与大便次数有关!研究发现:寿命长的人,每天排便在这个次数

寿命与大便次数有关!研究发现:寿命长的人,每天排便在这个次数

荔子言
2026-05-13 11:41:19
蔚来李斌直言:今年车卖不好,公司就没了,形势很严重了!

蔚来李斌直言:今年车卖不好,公司就没了,形势很严重了!

老特有话说
2026-05-11 16:12:23
2026-05-13 22:32:49
侃故事的阿庆
侃故事的阿庆
几分钟看完一部影视剧,诙谐幽默的娓娓道来
760文章数 8441关注度
往期回顾 全部

科技要闻

腾讯一季度营收1964.6亿元 同比增9%

头条要闻

媒体:黄仁勋绝非"顺路同行" 而是美方刻意纳入的筹码

头条要闻

媒体:黄仁勋绝非"顺路同行" 而是美方刻意纳入的筹码

体育要闻

14年半,74万,何冰娇没选那条更安稳的路

娱乐要闻

白鹿掉20万粉,网友为李晨鸣不平

财经要闻

美国总统特朗普抵达北京

汽车要闻

C级纯电轿跑 吉利银河"TT"申报图来了

态度原创

时尚
数码
手机
家居
公开课

快来解锁富家千金风穿搭,穿舒适又时髦,一键拿捏优雅气质

数码要闻

Framework官方简报:DDR5内存成本趋稳 SSD库存告罄面临大幅涨价

手机要闻

好消息:安卓17已正式发布!坏消息:留给开发者的时间不多了!

家居要闻

内在自叙,无域有方

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版