网易首页 > 网易号 > 正文 申请入驻

DeepSeek本地模型显卡横评 显存不够算力都白搭

0
分享至

DeepSeek本地化部署是当下热门的应用方式,它除了可以避免服务器繁忙之外,本地化运行还能够极大程度保护用户的隐私。

目前DeepSeek有众多版本,其中模型容量差距可达数十倍,到底该如何选择适合自己硬件的版本来部署,一直是用户比较头疼的问题。

今天我们就使用RTX 5090 D、RTX 5080、RTX 5070 Ti以及RTX 5070,共4张RTX 50系显卡来实测一下,不同显卡之间的性能差距。

测试使用LM Studio,无加速框架进行对比,完全凭借显卡自身算力。毕竟不同加速框架对不同厂商的显卡优化不同,测试变量太大。

这里我们首先选择【DeepSeek R1 Distill Qwen 32B】模型。

将GPU卸载拉满,这意味着DeepSeek模型将完全由GPU进行计算,其他参数默认即可。由于AI模型每次回答都会有所区别,这里设置3个问题,取平均值。

另外需要注意的是,我们设置的问题本身框定了范围,让AI在思考回答时不会过于发散。如果问“什么是哲学”这类无范围的问题,每次回答的结果将无法量化。

在32B模型中,可以看到RTX 5090 D的tok/sec还是很快的,毕竟作为本代旗舰产品,32GB大显存本就适合AI训练。

但在RTX 5080进行测试时便出现了问题,可以看到RTX 5080在回答问题时,思考时间达到了348秒,也就是将近6分钟。

这里需要提及一下,不同模型对于显存需求的换算大致有个公式,即:

(32)B÷2×1.15=显存

所以32B模型需要的最低显存,为18.4GB左右,这已经超出了RTX 5080的16GB显存。而这溢出的2GB显存,则由内存补足。

但对于模型来说,爆显存之后不管“外借”多少内存,都将按照最慢的速度运算。

实测同事的RTX 2060,在运行32B模型时,即便“外借”的内存更多,但思考时间同样为5分钟左右。

根据上面的公式,这里可以推测出8B模型大约仅需要4.6GB显存,即可满足运算需求。

从结果来看,tok/sec与显卡显存及算力有较大关系,并且呈现出应有的性能递进关系。而first token和思考时间没有太大规律可循,下面每张显卡的tok/sec成绩我们进行了柱状图汇总,方便大家看的更清晰。

对于大显存高算力的RTX 5090 D毫无意外拔得头筹,而显存相同RTX 5080及RTX 5070 Ti差距不大。根据不同显卡之间的AI算力来看:

RTX 5090 D(AI TOPS:2375);

RTX 5080(AI TOPS:1801);

RTX 5070 Ti(AI TOPS:1406);

RTX 5070(AI TOPS:988)

至少DeepSeek大语言模型对于AI算力的要求并不是最重要的,而是显存。只要显存足够大,在推理运算时即有压倒性的优势。

最后总结一下本次DeepSeek测试的要点,供大家快速记忆:

1. DeepSeek大语言模型对GPU的需求:显存>算力

2. 模型对显存要求的换算公式(x)B÷2×1.15=显存

3. 当显存无法满足模型最低需求,多少AI算力都无济于事

4. 思考时间与GPU并无绝对关系,而是问题的开放性

本次测试选择的LM Studio,目的就是为了使用显卡未经加速的真实算力。不过现在有很多针对不同架构的加速框架,甚至笔记本也能跑满血大模型,大家在自己使用时不妨自行尝试。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
这就是背叛下场,被美欧轮番“吸血”后,如今没有一国愿意帮助它

这就是背叛下场,被美欧轮番“吸血”后,如今没有一国愿意帮助它

近史博览
2026-02-17 01:40:40
1978年,胡耀邦找宋任穷谈话:你接替我任中央组织部长,别犹豫了

1978年,胡耀邦找宋任穷谈话:你接替我任中央组织部长,别犹豫了

春秋砚
2026-02-20 14:55:03
广东有一个天然“铷矿”床,一吨估值46亿,日本:怎么又是中国的

广东有一个天然“铷矿”床,一吨估值46亿,日本:怎么又是中国的

三农老历
2026-02-18 13:39:25
今日!NBA开拓者VS掘金,全明星赛后杨瀚森再次亮相,CCTV5无直播

今日!NBA开拓者VS掘金,全明星赛后杨瀚森再次亮相,CCTV5无直播

晚池
2026-02-21 02:11:59
面相师傅:无论男女,眉心有竖纹,预示着你后半生的3种命运

面相师傅:无论男女,眉心有竖纹,预示着你后半生的3种命运

卡西莫多的故事
2026-02-02 11:46:25
特朗普称和高市早苗关系非常好,日本网友:没有人会拒绝随意取钱的ATM机

特朗普称和高市早苗关系非常好,日本网友:没有人会拒绝随意取钱的ATM机

上观新闻
2026-02-20 15:29:35
伊原子能组织主席:伊朗和平利用铀浓缩技术权利不容剥夺

伊原子能组织主席:伊朗和平利用铀浓缩技术权利不容剥夺

环球网资讯
2026-02-20 09:26:01
莫迪举手全场欢呼 两大AI掌门人却各自握拳尴尬对峙

莫迪举手全场欢呼 两大AI掌门人却各自握拳尴尬对峙

财联社
2026-02-20 01:50:17
单场38分!快船步行者交易,马瑟林才是最大赢家?

单场38分!快船步行者交易,马瑟林才是最大赢家?

篮球实录
2026-02-20 17:39:03
冠名费缩水7000万!中超赞助商没信心,为保品牌价值连续3年换名

冠名费缩水7000万!中超赞助商没信心,为保品牌价值连续3年换名

体坛鉴春秋
2026-02-20 17:18:08
我们为何会喜新厌旧?Nature子刊(20):重复行为使多巴胺受体变得“麻木”,让人对旧爱迅速“下头”

我们为何会喜新厌旧?Nature子刊(20):重复行为使多巴胺受体变得“麻木”,让人对旧爱迅速“下头”

梅斯医学
2026-02-20 07:53:36
雷佳音没撒谎!退出春晚,解散公司,性格大变的贾玲,证实他的话

雷佳音没撒谎!退出春晚,解散公司,性格大变的贾玲,证实他的话

说历史的老牢
2026-01-20 13:43:24
太平年:赵匡胤黄袍加身,柴荣麾下大将为何只有韩通一人抵抗?

太平年:赵匡胤黄袍加身,柴荣麾下大将为何只有韩通一人抵抗?

流云天下
2026-02-20 15:56:49
善恶终有报!49岁的李铁再传噩耗,终是为自己的贪婪付出代价

善恶终有报!49岁的李铁再传噩耗,终是为自己的贪婪付出代价

痞子时代
2026-02-12 15:36:53
有一说一,本赛季最让人失望的球星当属以下三位!

有一说一,本赛季最让人失望的球星当属以下三位!

君子一剑似水流年
2026-02-20 07:07:46
15年前,那个当着全世界喝下核污染水的日本官员,如今还活着吗?

15年前,那个当着全世界喝下核污染水的日本官员,如今还活着吗?

墨兰史书
2026-02-09 23:08:35
看完天津春晚,心痛又感慨:不是岳云鹏不行了,是相声的舞台没了

看完天津春晚,心痛又感慨:不是岳云鹏不行了,是相声的舞台没了

悠悠说世界
2026-02-21 05:27:45
WTT新加坡大满贯:多位名将已出局!2月21日赛程公布,附5项签表

WTT新加坡大满贯:多位名将已出局!2月21日赛程公布,附5项签表

郝小小看体育
2026-02-21 06:33:59
你有没有发现,今年春节很反常,大家都不再演了…

你有没有发现,今年春节很反常,大家都不再演了…

福建平子
2026-02-20 21:21:06
四强全部诞生,塞大师2-6出局,赵心童创历史,半决赛再迎劲敌

四强全部诞生,塞大师2-6出局,赵心童创历史,半决赛再迎劲敌

郝小小看体育
2026-02-21 07:40:21
2026-02-21 08:44:49
中关村在线 incentive-icons
中关村在线
中关村在线全球第一科技门户
381905文章数 875041关注度
往期回顾 全部

数码要闻

英特尔Bartlett Lake-S系列处理器阵容曝光:全大核、睿频5.9GHz

头条要闻

被问征收的约1750亿美元关税是否需要退还 特朗普表态

头条要闻

被问征收的约1750亿美元关税是否需要退还 特朗普表态

体育要闻

金牌夫妻!王心迪徐梦桃赛后拥抱太甜了

娱乐要闻

镖人反超惊蛰无声拿下单日票房第二!

财经要闻

特朗普全球关税被推翻!有何影响?

科技要闻

莫迪举手欢呼 两大AI掌门人却握拳尴尬对峙

汽车要闻

比亚迪的“颜值担当”来了 方程豹首款轿车路跑信息曝光

态度原创

亲子
本地
艺术
时尚
公开课

亲子要闻

那些你不知道的育儿小知识!网友:不要随便把孩子的东西送人!

本地新闻

春花齐放2026:《骏马奔腾迎新岁》

艺术要闻

这幅草书让亲戚大吃一惊:书法入门真的要从楷书开始吗?

2026纽约秋冬时装周,在春天开启美的新故事!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版