网易首页 > 网易号 > 正文 申请入驻

DeepSeek本地模型显卡横评 显存不够算力都白搭

0
分享至

DeepSeek本地化部署是当下热门的应用方式,它除了可以避免服务器繁忙之外,本地化运行还能够极大程度保护用户的隐私。

目前DeepSeek有众多版本,其中模型容量差距可达数十倍,到底该如何选择适合自己硬件的版本来部署,一直是用户比较头疼的问题。

今天我们就使用RTX 5090 D、RTX 5080、RTX 5070 Ti以及RTX 5070,共4张RTX 50系显卡来实测一下,不同显卡之间的性能差距。

测试使用LM Studio,无加速框架进行对比,完全凭借显卡自身算力。毕竟不同加速框架对不同厂商的显卡优化不同,测试变量太大。

这里我们首先选择【DeepSeek R1 Distill Qwen 32B】模型。

将GPU卸载拉满,这意味着DeepSeek模型将完全由GPU进行计算,其他参数默认即可。由于AI模型每次回答都会有所区别,这里设置3个问题,取平均值。

另外需要注意的是,我们设置的问题本身框定了范围,让AI在思考回答时不会过于发散。如果问“什么是哲学”这类无范围的问题,每次回答的结果将无法量化。

在32B模型中,可以看到RTX 5090 D的tok/sec还是很快的,毕竟作为本代旗舰产品,32GB大显存本就适合AI训练。

但在RTX 5080进行测试时便出现了问题,可以看到RTX 5080在回答问题时,思考时间达到了348秒,也就是将近6分钟。

这里需要提及一下,不同模型对于显存需求的换算大致有个公式,即:

(32)B÷2×1.15=显存

所以32B模型需要的最低显存,为18.4GB左右,这已经超出了RTX 5080的16GB显存。而这溢出的2GB显存,则由内存补足。

但对于模型来说,爆显存之后不管“外借”多少内存,都将按照最慢的速度运算。

实测同事的RTX 2060,在运行32B模型时,即便“外借”的内存更多,但思考时间同样为5分钟左右。

根据上面的公式,这里可以推测出8B模型大约仅需要4.6GB显存,即可满足运算需求。

从结果来看,tok/sec与显卡显存及算力有较大关系,并且呈现出应有的性能递进关系。而first token和思考时间没有太大规律可循,下面每张显卡的tok/sec成绩我们进行了柱状图汇总,方便大家看的更清晰。

对于大显存高算力的RTX 5090 D毫无意外拔得头筹,而显存相同RTX 5080及RTX 5070 Ti差距不大。根据不同显卡之间的AI算力来看:

RTX 5090 D(AI TOPS:2375);

RTX 5080(AI TOPS:1801);

RTX 5070 Ti(AI TOPS:1406);

RTX 5070(AI TOPS:988)

至少DeepSeek大语言模型对于AI算力的要求并不是最重要的,而是显存。只要显存足够大,在推理运算时即有压倒性的优势。

最后总结一下本次DeepSeek测试的要点,供大家快速记忆:

1. DeepSeek大语言模型对GPU的需求:显存>算力

2. 模型对显存要求的换算公式(x)B÷2×1.15=显存

3. 当显存无法满足模型最低需求,多少AI算力都无济于事

4. 思考时间与GPU并无绝对关系,而是问题的开放性

本次测试选择的LM Studio,目的就是为了使用显卡未经加速的真实算力。不过现在有很多针对不同架构的加速框架,甚至笔记本也能跑满血大模型,大家在自己使用时不妨自行尝试。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
博主:深圳换帅不是因为竞技层面,陈涛和体育总监严重不和

博主:深圳换帅不是因为竞技层面,陈涛和体育总监严重不和

懂球帝
2026-05-31 11:13:02
张水华骨折未愈坚持完赛!获半马第5名 无缘奖金+拿10万出场费

张水华骨折未愈坚持完赛!获半马第5名 无缘奖金+拿10万出场费

念洲
2026-05-31 09:33:36
资金狂减!年内最牛ETF榜单来了

资金狂减!年内最牛ETF榜单来了

新浪财经
2026-05-30 15:16:13
你无意中发现了不得的事?网友:大保健里遇见嫂子

你无意中发现了不得的事?网友:大保健里遇见嫂子

夜深爱杂谈
2026-05-28 07:59:33
张艺谋:两个弟弟都是残疾人,他超生是为了完成母亲的心愿

张艺谋:两个弟弟都是残疾人,他超生是为了完成母亲的心愿

细品名人
2026-05-18 07:17:31
福建这个村太牛了!4000口人3800人在美国!全村靠炒菜盖起小洋楼

福建这个村太牛了!4000口人3800人在美国!全村靠炒菜盖起小洋楼

瓜哥的动物日记
2026-05-31 00:48:26
女乘客在网约车上排泄,司机称清洁无效需更换座椅,滴滴出行:将承担相关费用,并配合警方跟进

女乘客在网约车上排泄,司机称清洁无效需更换座椅,滴滴出行:将承担相关费用,并配合警方跟进

极目新闻
2026-05-29 17:07:17
日本人在美网探问:如果日本再次侵略中国,中国人会不会害怕?

日本人在美网探问:如果日本再次侵略中国,中国人会不会害怕?

深析古今
2026-05-31 14:13:27
《亮剑》里一个连阻击日军联队8小时,在抗战中有可能吗?

《亮剑》里一个连阻击日军联队8小时,在抗战中有可能吗?

娱乐圈的哔哔王
2026-05-31 10:19:44
38军在三所里缴获无数,江拥辉:打半辈子仗,从未见过的人间奇景

38军在三所里缴获无数,江拥辉:打半辈子仗,从未见过的人间奇景

文史季季红
2026-05-31 10:15:03
内蒙古呼和浩特一药店高价销售集采药 当地约谈主要负责人

内蒙古呼和浩特一药店高价销售集采药 当地约谈主要负责人

新京报
2026-05-30 15:43:13
雷霆连冠梦碎!亚历山大叹卫冕太难,伤病成最大绊脚石

雷霆连冠梦碎!亚历山大叹卫冕太难,伤病成最大绊脚石

仰卧撑FTUer
2026-05-31 14:10:04
1960年,赵一曼的儿子写信讽刺毛主席,主席没有追究,说了6个字

1960年,赵一曼的儿子写信讽刺毛主席,主席没有追究,说了6个字

帝哥说史
2026-05-23 06:30:03
我供小叔子考上北大,他毕业后只汇款不回家,我去北京一看愣住了

我供小叔子考上北大,他毕业后只汇款不回家,我去北京一看愣住了

千秋文化
2026-05-18 20:02:10
新加坡香会取消中国专场!李显龙懵:中方不陪我们玩了

新加坡香会取消中国专场!李显龙懵:中方不陪我们玩了

怪味历史连连看
2026-05-30 01:43:28
靠山被炸死,每年7亿美元断了,以色列对真主党收网

靠山被炸死,每年7亿美元断了,以色列对真主党收网

叹为观止易
2026-05-30 17:04:10
一查吓一跳!16岁少女体内竟布满数百枚……部分已癌变!医生:这项检查要早做

一查吓一跳!16岁少女体内竟布满数百枚……部分已癌变!医生:这项检查要早做

蓬勃新闻
2026-05-30 16:41:30
日本“恨老”已近疯狂!陷入老龄危机的日本,给中国人拉响了警报

日本“恨老”已近疯狂!陷入老龄危机的日本,给中国人拉响了警报

阿莱美食汇
2026-05-31 12:04:43
39岁刘诗诗九寨沟生图曝光,脸僵疲态尽显

39岁刘诗诗九寨沟生图曝光,脸僵疲态尽显

牛油果生活观
2026-05-30 17:35:04
终于遭“报应”了!坑了我国20亿,如今卫星系统几乎全面瘫痪

终于遭“报应”了!坑了我国20亿,如今卫星系统几乎全面瘫痪

烟雨洛神生
2026-05-27 10:04:14
2026-05-31 15:15:00
中关村在线 incentive-icons
中关村在线
中关村在线全球第一科技门户
383838文章数 875159关注度
往期回顾 全部

数码要闻

电视屏幕为啥会出现反光 华为李小龙科普 一看就懂

头条要闻

男子怀疑妻子出轨在车上装定位:兄弟不给我借钱给她借

头条要闻

男子怀疑妻子出轨在车上装定位:兄弟不给我借钱给她借

体育要闻

阿森纳用最悲壮的方式,成就了巴黎王朝

娱乐要闻

贾玲最新动作!侯明昊给虞书欣抬轿!

财经要闻

医学首席转岗搞科技,A股科技股遭遇巨震

科技要闻

戴尔诺基亚又回来了!AI重估老牌科技公司

汽车要闻

900V+3.2秒破百 领克10+&领克10上市16.99万元起

态度原创

教育
亲子
房产
时尚
军事航空

教育要闻

四年级简便运算的易错题:掌握方法很easy

亲子要闻

我国儿童新药连续五年增长,2025年批准138个

房产要闻

红动五月!全国抢入核心资产,广州盯紧凯旋新世界!

梓渝:慢下来,也很好

军事要闻

解放军代表质问日防卫大臣:日本何时道歉

无障碍浏览 进入关怀版