网易首页 > 网易号 > 正文 申请入驻

本地运行大模型,要买什么显卡?

0
分享至

大家好,我是章北海

大模型训练动辄几千个 A100,几个月的训练,上亿美元的成本。

像 GPT-4o 这样的模型训练成本约为 1 亿美元,Anthropic 最新严打的大模型训练成本可能高达 10 亿美元。

前段时间震惊海外的 DeepSeek V3 最亮眼的是大幅压缩的预训练成本,也使用了 2000 多个 H800GPU、2 个月时间和 550 万美元。

训练模型这事儿跟普通人太过遥远。。。

本地部署做做推理还稍微能拼一拼

众所知识,模型参数越大、精度越高,做推理时所需的显卡性能越强(显存、算力、带宽)。

大模型按模型参数量分为:亿级(比如常见的 0.5B)、十亿级(4B、7B、8B)、百亿级(14B、32B、72B)、千亿级(110B、405B)等等。

大模型参数浮点精度包括:float32(占用 4 字节,32bit)、float16(16bit)、int8(8bit)、int4(4bit)等。

我看到一种大致的估算关系,不过这样太不严谨了:

  • 1 亿参数:约需要 1-2GB 显存;

  • 10 亿参数:约需要 8-10GB 显存;

  • 100 亿参数:约需要 30-40GB 显存;

  • 1000 亿参数:则至少需要 80GB 甚至更多显存。

HuggingFace上有一个模型运行时所需显存的评估工具 accelerate estimate-memory

https://huggingface.co/spaces/hf-accelerate/model-memory-usage

这个工具可以计算用于推理和训练的模型的内存使用量,解决诸如:

  • 一个大模型,比如 Qwen2.5-72B,需要多少 GPU 显存才可以推理和训练呢?

  • 不同的数据类型,不同的量化,可以节省多少内存呢?

在网页中输入模型名称或 URL,该工具将提供内存使用情况的全面细分,包括数据类型、最大层、总大小和使用不同优化器的训练内存使用情况。比如我让其计算阿里Qwen2.5-72B的显存需求,结果如下:


dtype Largest Layer or Residual Group Total Size Training using Adam (Peak vRAM) float32 4.64 GB 276.21 GB 1.08 TB float16/bfloat16 2.32 GB 138.11 GB 552.42 GB int8 1.16 GB 69.05 GB N/A int4 594.0 MB 34.53 GB N/A

精度为float32 所需显存时276G, 到int4,就仅需34G了

总共使用了约 69GB 显存,这个值和用工具测试的int8是一致的。

由此可见,ollama是对qwen2.5做过量化的。

如何选择显卡?推荐两个测评网站

一是NVIDIA 显卡排行榜,此网站能实时对比各种型号显卡,主要是英伟达消费级显卡。

https://technical.city/zh/video/nvidia-rating

二是大语言模型推理专用显存天梯,主要关注内存带宽,这里还有对苹果芯片的测评

https://vmem-for-llms.kcores.com/index-cn

目前国内企业都还在各显神通拿A100,路子不硬就L40、A6000,是在没招的就消费级4090了。

个人啊,咬咬牙4090吧,不过个人没必要一定本地离线跑大模型,毕竟现在大模型api都约等于白送的白菜价。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
苏州中学附属三亚学校项目发生事故,海南住建厅启动督办程序

苏州中学附属三亚学校项目发生事故,海南住建厅启动督办程序

澎湃新闻
2026-05-07 17:38:26
在拼多多批量“造爆款”,露营赛道挤满国产新锐玩家

在拼多多批量“造爆款”,露营赛道挤满国产新锐玩家

定焦One
2026-05-07 08:44:10
台官员曝赖清德成功返台内幕,大陆出手阻止未果,背后有难言之隐

台官员曝赖清德成功返台内幕,大陆出手阻止未果,背后有难言之隐

共工之锚
2026-05-07 00:04:56
前体操冠军吴柳芳再回应擦边风波:“把债还完了,我才能把体面重新捡起来”;谈及与管晨辰的争执,吴柳芳表示:“我不会去恨一个人”

前体操冠军吴柳芳再回应擦边风波:“把债还完了,我才能把体面重新捡起来”;谈及与管晨辰的争执,吴柳芳表示:“我不会去恨一个人”

扬子晚报
2026-05-07 07:43:31
曝莫斯科全面断网并关闭所有机场!胜利日前夕全城紧张

曝莫斯科全面断网并关闭所有机场!胜利日前夕全城紧张

项鹏飞
2026-05-06 16:51:22
对话“洪迪厄斯”号邮轮乘客:“我头天下船,汉坦病毒阳性乘客第二天登船”

对话“洪迪厄斯”号邮轮乘客:“我头天下船,汉坦病毒阳性乘客第二天登船”

红星新闻
2026-05-07 19:26:32
“机车女神”痞幼拿下张雪!评论区沦陷了!

“机车女神”痞幼拿下张雪!评论区沦陷了!

4A广告文案
2026-05-07 09:13:48
中国16城准一线城市排名:苏州第六,成都超南京,福州新入围

中国16城准一线城市排名:苏州第六,成都超南京,福州新入围

最新声音
2026-05-07 02:39:00
北京三位女大学生青海自驾游两死一伤 伤者一审被判入刑4年

北京三位女大学生青海自驾游两死一伤 伤者一审被判入刑4年

经济观察报
2026-05-07 10:43:05
先是海参崴,再是图瓦和库页岛,俄罗斯对中国,心态完全变了

先是海参崴,再是图瓦和库页岛,俄罗斯对中国,心态完全变了

番外行
2026-05-07 10:07:04
全场轰11记Ace球!郑钦文两盘横扫30号种子,跻身罗马站32强

全场轰11记Ace球!郑钦文两盘横扫30号种子,跻身罗马站32强

全景体育V
2026-05-07 18:48:36
魏凤和案、李尚福案一审宣判

魏凤和案、李尚福案一审宣判

新京报
2026-05-07 18:08:25
不能失忆!人民日报平安校园:海参崴的街头,中国孩子在为谁欢呼

不能失忆!人民日报平安校园:海参崴的街头,中国孩子在为谁欢呼

瑜说还休
2026-05-07 17:45:15
又一个“爱国大V”人设翻车!靠爱国捞金千万,私下悄悄办移民!

又一个“爱国大V”人设翻车!靠爱国捞金千万,私下悄悄办移民!

麦杰逊
2026-05-07 13:13:17
5月20官宣三婚!头发都白了,何洁现状惹人心疼

5月20官宣三婚!头发都白了,何洁现状惹人心疼

陈意小可爱
2026-05-07 16:55:39
三峡“无缝大坝”缔造者落马!功勋满身,却没管住心中一道缝

三峡“无缝大坝”缔造者落马!功勋满身,却没管住心中一道缝

甜柠聊史
2026-03-25 18:43:05
旋转木马暂时不拆了,上海这个“火出圈”的花艺装置将开放至8月底

旋转木马暂时不拆了,上海这个“火出圈”的花艺装置将开放至8月底

澎湃新闻
2026-05-07 15:40:27
第三轮第六批中央生态环境保护督察全面启动

第三轮第六批中央生态环境保护督察全面启动

生态环境部
2026-05-07 10:04:40
国际足联要疯了,没有软肋的中国足球已经天下无敌

国际足联要疯了,没有软肋的中国足球已经天下无敌

枫冷慕诗
2026-05-07 11:32:38
恒大集团创始人许家印被曝出猛料

恒大集团创始人许家印被曝出猛料

地产微资讯
2026-05-07 09:28:09
2026-05-07 20:19:00
Ai学习的老章 incentive-icons
Ai学习的老章
Ai学习的老章
3378文章数 11146关注度
往期回顾 全部

数码要闻

8盘位大肚能容!雷孜LaCie 8big Pro5 64TB外置硬盘图赏

头条要闻

19名中国船员被困霍尔木兹超2个月:船舱如同巨型蒸笼

头条要闻

19名中国船员被困霍尔木兹超2个月:船舱如同巨型蒸笼

体育要闻

巴黎再进欧冠决赛,最尴尬的情况还是发生了

娱乐要闻

Lisa主持!宁艺卓观看脱衣秀风波升级

财经要闻

金融“风暴”,AI制造

科技要闻

月之暗面完成20亿美元融资,估值突破200亿

汽车要闻

雷克萨斯全新纯电三排SUV 全新TZ全球首发

态度原创

手机
数码
教育
亲子
公开课

手机要闻

消息称某子系迭代旗舰工程机配备6.6英寸中屏+8500mAh电池

数码要闻

3A游戏的大容量仓库优选:希捷FireCuda X Vault硬盘体验报告

教育要闻

5月名师工作坊直播预告出炉,速来预约!|AI智能体赋能中学英语读写教研会

亲子要闻

Little Girl Slides into Feed with Flawless Express...

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版