网易首页 > 网易号 > 正文 申请入驻

Deepseek学妹真是太贵了——本地部署平台搭建推荐

0
分享至

前段时间做过关于本地部署Deepseek的教程。不记得可以点击下方图片回忆。

《服务器繁忙,请稍后再试。》

其实Deepseek的部署问题还有很多很多,我们对比现在线上的功能可以发现。云端的Deepseek有些可以生成图片甚至文件。还有支持上传文件,识别图片甚至联网搜索等功能。所以要想在本地部署一个完全私有化的Deepseek,还是需要下不少功夫的。但我个人的目标还是想部署一个至少能用,能联网且满足我日常办公辅助的本地完整版Deepseek(或者其他AI)。

OK,那今天来就聊两件比较天马行空的事情,第一件事是当前最有性价比的本地部署671B满血版(无蒸馏,混合量化)的配置。第二件事就是我们穷人最该关注的,有没有什么方法便宜搞DS之主板篇,毕竟穷人屁事多,所以我们好事多磨。

本地部署性价比方案

如果说当前想要本地部署完整版本的话,CPU推理无疑是最具性价比的方案。考虑到当前最多通道的AMD CPU搭配的主板还算可以接受的范围。所以优选还是AMD EPYC。因为是性价比方案,所以当然用一些自己搭建的方案更好,因此这里就不考虑准系统了(虽然其实准系统才是更高性价比的选择,但十个有九个是机柜)。我们还是用标准的ATX作为方案。

CPU:

CPU首选EPYC里最便宜的CPU,我这里选择16C/32T的3.65GHz 9135是明显包含个人情感的,更省钱其实完全可以选择9015。毕竟对于671B的模型,大部分都是带宽问题。甚至部分计算密集类型的区域可以搬移到GPU计算。如果真有人买了这个配置我再细致摊开来讲。总之CPU的预算在1W内没什么问题。

主板:

选超微算是一个通用解法。不过超微最大的毛病就是容易过热,所以散热问题是必须要注意的。需要留意的是H13SSL-N需要V2才能支持9005 CPU,所以要指定与店家要求2.0版本。不过近期有个三方9004主板正在准备实现9005的支持,而且价格在4000左右。可以期待一下,如果有替换就完美了。即使真的找不到支持,也可以选择MZ33-AR1。就是版型基本拒绝了好显卡的可能。

内存:

5代EPYC支持6000内存,但是这个规格的内存又难找,所以可以直接上6400的内存。价格稍微多找找,一条能便宜100多点。

散热:

散热的选择就不用担心了,因为CPU不是很多核的处理器, 更何况是巴掌那么大的CPU,散热更好,区区250W以内的CPU用六热管足矣。这里选择一些入门的服务器散热即可。

其他诸如硬盘,机箱,电源就不用说了。因为走的是ATX路线,所以传统的家用装机配置都可以用上。如果不上显卡,甚至600W的电源都足矣。

不过根据我过去组装服务器的经验,以上的配置十有八九会出现无货,或者需要加钱等问题。主要就是主板。那此时有两个选择,一个是向下降级到9004级别,接近规格的9124只需要4000左右。此时主板也可以找一些三线SP5主板,价格可以再便宜1000。内存也可以换成DDR5-4800,每根便宜400。代价就是内存带宽损失20%,但对于不到两位的Token/s来说,似乎又可以接受。总之抛开一些通用件,核心件的价格在3W-4.5W。

本地部署暗黑性价比方案(全选可以看清)

当然说是这么说,其实最近有一个歪门邪道的东西诞生——扩容显卡。通过换显存颗粒的方式把原来的显卡翻倍,甚至四倍。而最近就诞生了一张邪恶显卡,RTX 4090 96G。

按照最低部署的要求,理论只需要5张4090 96G就可以实现671B的部署。但是如果要考虑后续消耗,加多一张或者满8张也没问题。目前4090 96G的价格还没有,不过参考48G的价格,满打满算3W甚至5W,也比H100 80G便宜不少。那么就此我们就可以选择一个全新的配置。

准系统:

这里可以直接上8卡准系统,除了注意要PCI-E 4.0以外,其他平台任选。G292-Z20主要是2U,所以可以省很多空间。

CPU:

因为准系统用的是7002/7003,所以选一些性价比高的CPU就行,比如7K62之类的。这个自由度很高。

内存:

同理,DDR4-3200的内存,8条插满即可,32G略小,64G尚可。不过因为DDR4的2666和3200差了一倍的价格,所以个人认为保证容量优先,这样还可以部署一些小东西在CPU上。当然你真要速度,也可以32G-3200,反正价格和64G-2666一样。

整套平台下来预计将在15-25W之间,能带来近2倍的性能提升。当然功耗也得暴涨。但是为了响应速度,也没办法。

穷人(垃圾佬)爱折腾环节

好了,终于到我最喜欢的环节了。正所谓人没钱就需要靠脑力换金金金。即使用性价比方案,一台能完整部署671B的机子也要3-5W。这个预算我相信大部分人也没有……还是说就我没有?

总之我们需要明确需求。要实现671B的部署,我们需要满足以下条件:

  • 能够放进671B的空间

  • 可以接受的运行速度

其中能够放进671B的空间,我们可以进一步拆分出几层的速度区间。分为显卡——内存——硬盘。

而可接受的运行速度,基本与部署空间的存取速度有关(不完全相关,只是超大模型得先满足放得快再考虑算得快)。如果考虑当前K-Transformer,混合量化等优化策略,可以弄出很多不同的操作方法。但我们先暂时不考虑这些优化方法。

我们以当前8块H100 SMX5(带宽3350GB/s,带NVLink)部署671B模型能实现约25Token/s为参考点。十分之一的带宽可能只有不到5Token/s。当然这个数值很难评判,可能更低。

但CPU有一个好的地方在于,因为NUMA与互联技术,多路的收益应该会显著优于多卡。因此我们可以充分发挥多路CPU带来多宽带的优势。但目前我暂时还没有进行过多路CPU的性能测试。所以先将单路实现完整部署且性价比较为合理的选择。比如5K-1W预算实现完整部署。其后预留出空间用作可能的升级。比如那张传奇的RTX 4090 96G。

最后,考虑价格,目前想要部署671B内存至少需要64G*8起步。DDR5 64G一根起步2000,DDR4 64G就只要300。分析至此,我们可以确定可选择的平台了。

Intel LGA3647 Xeon 1-2代:

LGA3647的志强1-2代处理器普遍支持DDR4-2666和DDR4-2933。单路127.9GB/s和 140.8GB/s。单路主板普遍在2000元左右,CPU从百元到千元不等,尤其是一些M系列CPU,如过去很火的8124M,现在就是百元一颗的价格。作为入门5K预算的完整部署主机来说非常划算。不过需要注意的是8124M等超205W的CPU要改专用BIOS。所以优先可以看看闲鱼里的永擎(如EPC621D8A)等系列板子。搭配8根内存,5000预算左右搞定。

AMD SP3 7002/7003:

AMD性价比高真的不是吹的。尤其是同代Intel只提供6通道的情况下,AMD能给8通道。7002/7003均支持DDR4-3200。如果内存后续降价了,加内存就很方便了。理论用满DDR4-3200的情况下,7002单路达到204.8GB/s。同理,单路的SP3主板价格都在2000上下,不过CPU会贵不少,要500起步,一些好价可能会在1600左右。而且做AMD SP3的主板厂商并不多,市场上主流销售的除了超微,就是技嘉的板子,而技嘉的板子由于是为2U/4U设计的版型,PCI-E槽会与内存平行,对于普通DIY玩家来说后续加显卡会要多花点心思。所以SP3系列主板属于带刺玫瑰,前期好发育,后期难处理。这种平台是妥妥的需要靠软件优化的。

后话

就在2月27日,Deepseek团队放出了FlashMLA,这是一个能够实现高效运行的内核代码。简单来说就是绕开老黄弯弯绕绕的CUDA,实现超高效能的内核。而且重要的是,这个项目并不拘束于N卡,理论上是可以实现其他平台部署的。这也标志着大模型计算不一定需要大显存大计算力显卡。这对于我们来说是一件好事。

而我目前也大概完成了本地部署Deepseek 次顶配(70B)的最佳性价比方案,并且实现网络接入,图文识别,生成的基本功能,除了模型不是完整的,和网上版Deepseek基本无疑,只是还要测试一下找找问题。后续我会继续放出我的方案。也期待科技真的能渗透到平民百姓。感谢DS学妹开源。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
为何说年龄超过80岁的人:即便身体健康,也没有多少来日方长?

为何说年龄超过80岁的人:即便身体健康,也没有多少来日方长?

芹姐说生活
2026-05-10 14:11:36
王皓最新爆料:梁靖崑打张本智和之前,我在房间里问了他3个问题

王皓最新爆料:梁靖崑打张本智和之前,我在房间里问了他3个问题

等等talk
2026-06-03 11:13:26
上不了台面?方媛迎来骂潮,因为国人最讨厌的3个雷区,全部踩中

上不了台面?方媛迎来骂潮,因为国人最讨厌的3个雷区,全部踩中

林轻吟
2026-05-20 07:42:53
华人老板无罪!开枪打死14岁黑人少年,轰动全美3年的案件终宣判

华人老板无罪!开枪打死14岁黑人少年,轰动全美3年的案件终宣判

北国向锡安
2026-06-03 10:02:15
土伦杯排名大变!5:3,3:0,四队同3分,国足U19第三,下轮迎决战

土伦杯排名大变!5:3,3:0,四队同3分,国足U19第三,下轮迎决战

霁寒飘雪
2026-06-03 11:43:54
没想到,李宁签约库里不到1天,却意外让杨瀚森,实现口碑暴增

没想到,李宁签约库里不到1天,却意外让杨瀚森,实现口碑暴增

生命之泉的奥秘
2026-06-03 05:38:20
孙正义重登亚洲首富

孙正义重登亚洲首富

21世纪经济报道
2026-06-03 09:26:33
美国发话也不行,中方正式通告全球:打日本,中国具备“正当性”

美国发话也不行,中方正式通告全球:打日本,中国具备“正当性”

凤语谈
2026-05-28 12:13:58
拄拐跨十小时赴法婚礼,陈学冬这份友情,打醒多少功利社交的人

拄拐跨十小时赴法婚礼,陈学冬这份友情,打醒多少功利社交的人

可乐谈情感
2026-06-03 09:36:11
一种比三文鱼营养却更便宜的鱼,真心建议你常吃

一种比三文鱼营养却更便宜的鱼,真心建议你常吃

食栗派
2026-05-22 21:50:33
果然有内情!广西老表收割机爬梯被偷后续,当事人透露更多引热议

果然有内情!广西老表收割机爬梯被偷后续,当事人透露更多引热议

火山詩话
2026-06-02 07:04:40
不再晒玥儿!汪宝儿百日宴扎堆海外亲戚,张兰悄悄改换立场!

不再晒玥儿!汪宝儿百日宴扎堆海外亲戚,张兰悄悄改换立场!

水泥土的搞笑
2026-06-03 07:58:43
后院起火,卢卡申科立场动摇,官方声明:白俄绝不会出兵帮普京

后院起火,卢卡申科立场动摇,官方声明:白俄绝不会出兵帮普京

面包夹知识
2026-06-01 20:22:17
释永信4罪并罚,不仅私生子多,资产多,还有3位家喻户晓明星徒弟

释永信4罪并罚,不仅私生子多,资产多,还有3位家喻户晓明星徒弟

辉哥说动漫
2026-06-03 12:36:34
等了10年中了签,最后却作废了?这些坑千万别踩

等了10年中了签,最后却作废了?这些坑千万别踩

坠入二次元的海洋
2026-06-03 12:42:58
我中了1亿刚要报喜,我爸说老家拆迁了,把200万拆迁款全给了我哥

我中了1亿刚要报喜,我爸说老家拆迁了,把200万拆迁款全给了我哥

千秋文化
2026-05-30 20:03:08
花滑奥运冠军陈巍考入哈佛医学院,曾任霍普金斯大学研究助理

花滑奥运冠军陈巍考入哈佛医学院,曾任霍普金斯大学研究助理

懂球帝
2026-06-02 16:45:55
李斌谈特斯拉 FSD 进入中国:算力优势非常大,对整个智驾发展是正面的事情!

李斌谈特斯拉 FSD 进入中国:算力优势非常大,对整个智驾发展是正面的事情!

新浪财经
2026-06-01 00:29:09
世体:由于美国移民局问题,恩博洛的入境许可暂未获得批准

世体:由于美国移民局问题,恩博洛的入境许可暂未获得批准

懂球帝
2026-06-02 23:26:32
马刺胜率超6成!NBA总决赛前瞻:文班布伦森最强矛盾抢七定胜负?

马刺胜率超6成!NBA总决赛前瞻:文班布伦森最强矛盾抢七定胜负?

锅子篮球
2026-06-03 13:08:50
2026-06-03 13:59:00
电脑吧评测室
电脑吧评测室
每天推荐一款电脑硬件科普知识
10169文章数 68524关注度
往期回顾 全部

科技要闻

员工抗议键鼠追踪,Meta让步:可暂停30分钟

头条要闻

受贿数额特别巨大 内蒙古自治区政府原主席王莉霞被诉

头条要闻

受贿数额特别巨大 内蒙古自治区政府原主席王莉霞被诉

体育要闻

选择中国品牌的库里,和他们的巨大野心

娱乐要闻

著名演员魏宗万去世!曾演活司马懿

财经要闻

左手通胀右手衰退,欧美当下的困局

汽车要闻

瑞虎8 PLUS/PRO非凡冠军上市 限时10.19万元起售

态度原创

亲子
时尚
家居
旅游
手机

亲子要闻

孩子长高选什么赖氨酸好?2026推荐度高的氨基丁品牌测评,科学激活发育潜能

休闲T恤舒适感极佳,夏天必不可少!轻轻松松拿捏日常的造型

家居要闻

江畔轻奢 观云大宅

旅游要闻

赶紧来打卡!重庆新发布5条生态文化精品线路

手机要闻

星星海梦幻外观+4K原生实况!vivo S60手机全面评测:一台懂年轻人日常需求的轻旗舰

无障碍浏览 进入关怀版