网易首页 > 网易号 > 正文 申请入驻

DeepSeek本地模型显卡横评 显存不够算力都白搭

0
分享至

DeepSeek本地化部署是当下热门的应用方式,它除了可以避免服务器繁忙之外,本地化运行还能够极大程度保护用户的隐私。

目前DeepSeek有众多版本,其中模型容量差距可达数十倍,到底该如何选择适合自己硬件的版本来部署,一直是用户比较头疼的问题。

今天我们就使用RTX 5090 D、RTX 5080、RTX 5070 Ti以及RTX 5070,共4张RTX 50系显卡来实测一下,不同显卡之间的性能差距。

测试使用LM Studio,无加速框架进行对比,完全凭借显卡自身算力。毕竟不同加速框架对不同厂商的显卡优化不同,测试变量太大。

这里我们首先选择【DeepSeek R1 Distill Qwen 32B】模型。

将GPU卸载拉满,这意味着DeepSeek模型将完全由GPU进行计算,其他参数默认即可。由于AI模型每次回答都会有所区别,这里设置3个问题,取平均值。

另外需要注意的是,我们设置的问题本身框定了范围,让AI在思考回答时不会过于发散。如果问“什么是哲学”这类无范围的问题,每次回答的结果将无法量化。

在32B模型中,可以看到RTX 5090 D的tok/sec还是很快的,毕竟作为本代旗舰产品,32GB大显存本就适合AI训练。

但在RTX 5080进行测试时便出现了问题,可以看到RTX 5080在回答问题时,思考时间达到了348秒,也就是将近6分钟。

这里需要提及一下,不同模型对于显存需求的换算大致有个公式,即:

(32)B÷2×1.15=显存

所以32B模型需要的最低显存,为18.4GB左右,这已经超出了RTX 5080的16GB显存。而这溢出的2GB显存,则由内存补足。

但对于模型来说,爆显存之后不管“外借”多少内存,都将按照最慢的速度运算。

实测同事的RTX 2060,在运行32B模型时,即便“外借”的内存更多,但思考时间同样为5分钟左右。

根据上面的公式,这里可以推测出8B模型大约仅需要4.6GB显存,即可满足运算需求。

从结果来看,tok/sec与显卡显存及算力有较大关系,并且呈现出应有的性能递进关系。而first token和思考时间没有太大规律可循,下面每张显卡的tok/sec成绩我们进行了柱状图汇总,方便大家看的更清晰。

对于大显存高算力的RTX 5090 D毫无意外拔得头筹,而显存相同RTX 5080及RTX 5070 Ti差距不大。根据不同显卡之间的AI算力来看:

RTX 5090 D(AI TOPS:2375);

RTX 5080(AI TOPS:1801);

RTX 5070 Ti(AI TOPS:1406);

RTX 5070(AI TOPS:988)

至少DeepSeek大语言模型对于AI算力的要求并不是最重要的,而是显存。只要显存足够大,在推理运算时即有压倒性的优势。

最后总结一下本次DeepSeek测试的要点,供大家快速记忆:

1. DeepSeek大语言模型对GPU的需求:显存>算力

2. 模型对显存要求的换算公式(x)B÷2×1.15=显存

3. 当显存无法满足模型最低需求,多少AI算力都无济于事

4. 思考时间与GPU并无绝对关系,而是问题的开放性

本次测试选择的LM Studio,目的就是为了使用显卡未经加速的真实算力。不过现在有很多针对不同架构的加速框架,甚至笔记本也能跑满血大模型,大家在自己使用时不妨自行尝试。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
邓世昌至死不知:掺沙子的炮弹其实没问题 沉舰的真相被隐藏百年

邓世昌至死不知:掺沙子的炮弹其实没问题 沉舰的真相被隐藏百年

掠影后有感
2026-06-01 11:05:19
奔放型体态,不穿个吊带紧身裙,真是浪费

奔放型体态,不穿个吊带紧身裙,真是浪费

飛尚日记
2026-06-22 07:10:38
俄乌开打之前,乌克兰亚速营为啥瞧不上中国人

俄乌开打之前,乌克兰亚速营为啥瞧不上中国人

贱议你读史
2026-05-18 17:08:39
彩礼谈崩!女方用“二婚都要四五十万”抬价,男方提二三十万被拒

彩礼谈崩!女方用“二婚都要四五十万”抬价,男方提二三十万被拒

风起见你
2026-06-13 20:27:08
口交、肛交等进入式性服务是卖淫行为吗?最高院定调了!

口交、肛交等进入式性服务是卖淫行为吗?最高院定调了!

黯泉
2026-06-02 11:54:54
陈建斌也没想到,被自己抛弃的吴越,如今竟凭一身黑衣碾压全场!

陈建斌也没想到,被自己抛弃的吴越,如今竟凭一身黑衣碾压全场!

精彩背后的故事
2026-06-22 03:03:28
又一款11000mAh新机官宣:6月22日,正式发布上市!

又一款11000mAh新机官宣:6月22日,正式发布上市!

科技堡垒
2026-06-22 09:58:50
正负值-10!男篮战胜澳大利亚,揪出最糟糕球员 他在场球队输10分

正负值-10!男篮战胜澳大利亚,揪出最糟糕球员 他在场球队输10分

小青年渌渌
2026-06-21 22:13:34
为什么往死里扫黄?网友分享太真实了,一次说透

为什么往死里扫黄?网友分享太真实了,一次说透

另子维爱读史
2026-05-27 20:16:03
内塔尼亚胡疯起来连特朗普都敢踹,万斯当场翻脸:你算什么东西

内塔尼亚胡疯起来连特朗普都敢踹,万斯当场翻脸:你算什么东西

阿校谈史
2026-06-22 09:12:42
2-1绝杀!世界杯4冠王出线了,终结12年等待,阿根廷卫冕难度加大

2-1绝杀!世界杯4冠王出线了,终结12年等待,阿根廷卫冕难度加大

球场没跑道
2026-06-21 08:16:11
布达拉宫地下世界复杂得吓人!
金碧辉煌下藏着1200多个“地垄”

布达拉宫地下世界复杂得吓人! 金碧辉煌下藏着1200多个“地垄”

西楼知趣杂谈
2026-06-12 08:54:44
世界女排联赛积分榜:美国队升至榜首,巴西第二,中国队第八

世界女排联赛积分榜:美国队升至榜首,巴西第二,中国队第八

湘楚风云聊体育
2026-06-22 05:32:24
高速限速80还配叫高速?四川车主集体吐槽,交通厅最新回应来了

高速限速80还配叫高速?四川车主集体吐槽,交通厅最新回应来了

生活魔术专家
2026-06-22 01:15:27
11国代表齐聚俄罗斯,普京单独邀菲律宾,绕开中国下了一盘大棋

11国代表齐聚俄罗斯,普京单独邀菲律宾,绕开中国下了一盘大棋

忠于法纪
2026-06-22 09:11:40
在职10年公司没交社保?老员工离职维权……老板抛出四个字:农夫与蛇!

在职10年公司没交社保?老员工离职维权……老板抛出四个字:农夫与蛇!

北青网-北京青年报
2026-06-21 14:08:23
赖清德天塌了!大陆采取行动,两大工程落地,2300万台湾民众受益

赖清德天塌了!大陆采取行动,两大工程落地,2300万台湾民众受益

卷史
2026-06-22 02:26:29
俯卧撑不掌握这三个技巧 练三年肌肉也难增长

俯卧撑不掌握这三个技巧 练三年肌肉也难增长

解说阿洎
2026-06-22 08:57:39
新加坡媒体不欢迎《给阿嬷的情书》原因不太方便讲……

新加坡媒体不欢迎《给阿嬷的情书》原因不太方便讲……

基本常识
2026-06-20 13:18:44
伊朗6天卖出3600万桶原油,市场最怕的供应反转来了

伊朗6天卖出3600万桶原油,市场最怕的供应反转来了

桂系007
2026-06-22 10:05:13
2026-06-22 10:55:00
中关村在线 incentive-icons
中关村在线
中关村在线全球第一科技门户
384282文章数 875166关注度
往期回顾 全部

数码要闻

电脑用内存、固态硬盘供货紧张:部分机型涨幅已超20%

头条要闻

日本知名教授:切断和中国的关系 日本没有未来

头条要闻

日本知名教授:切断和中国的关系 日本没有未来

体育要闻

18岁斩世界杯首球!亚马尔连创5大纪录

娱乐要闻

韩红帮冯小刚宣传,结果翻车了…

财经要闻

“床垫界的特斯拉”破产了

科技要闻

SpaceX 74天闪电IPO,OpenAI能照搬吗?

汽车要闻

全面提升 全新理想L8 livis将家用舒适再进化

态度原创

教育
游戏
艺术
时尚
手机

教育要闻

英语时态呼应:一个让90%学习者栽跟头的隐形语法规则

一封作弊道歉信,揭开了国内游戏社区最不堪的一面

艺术要闻

310米!欧盟第一高楼,坐落于波兰

不得不说,“T恤+九分裤”真的很适合夏天,清爽减龄又高级!

手机要闻

三星起诉Triller短视频应用欠下“数百万美元合作费用”

无障碍浏览 进入关怀版