我们先把电脑想象成一个大公司,公司里要干活就得有人干活,这些“人”就是芯片。
1、CPU —— 公司老总(万能但只有一个)
类比:CPU 就像公司里最聪明的老总,一个超级大脑。
他什么都会干:写邮件、算账、管人、开会、做PPT……样样精通。
但问题来了:老总只有一个人!公司几千件事都要他亲自干,他再牛也忙不过来。
所以CPU的特点是“串着干活”,一条指令做完再做下一条,特别聪明但特别慢当活太多的时候。
现在的电脑、手机里一般有4核、8核、16核CPU,相当于请了4~16个老总一起干活,但还是远远不够。
类比:GPU 就像包工头一下带了2000个民工去砌墙。
每个民工都不聪明,只能干最简单的“搬砖-放砖-抹水泥”这一套动作。
但2000个人一起干呢?一天就能砌好一栋楼!
所以GPU特别适合“成千上万个简单重复的计算同时进行”。
玩3A游戏为什么需要好显卡?因为游戏里要同时算几百万个像素的光影、反射、爆炸特效……这些都是“同一类简单计算”,GPU一口气全算完,画面就丝滑了。
最早GPU只能打游戏,后来聪明人发现:
“这2000个民工这么能干,干嘛只让他们砌墙?能不能让他们去算科学计算、挖比特币、训练AI?”
于是就有了GPGPU(General-Purpose GPU,意思是“通用GPU”。
2006年NVIDIA推出CUDA以后,程序员终于能方便地命令这2000个民工去干以前只有老总(CPU)能干的复杂活。
现在所有现代GPU默认都是GPGPU了,这个词反而很少单独提了。
现在最火的ChatGPT、Midjourney、文心一言、Sora……全靠AI芯片训练和运行。
AI芯片其实分两类:
A. 训练芯片(最烧钱)
代表:NVIDIA H100、A100、华为昇腾910B、谷歌TPU v5
类比:这是盖100层摩天大楼需要的超级大工地,要成千上万的民工(算力核心)一起干几年。
一张H100卖30多万人民币,还买不到,就是这种。
B. 推理芯片(用AI时用的)
代表:手机里的NPU(神经网络处理器)、苹果的Neural Engine、英伟达Jetson系列
类比:大楼盖好了,保安、电梯、灯全自动运行,这就靠推理芯片。
AI芯片和GPU长得很像(都是几千上万个小核心),但内部电路专门为矩阵乘法、神经网络优化过,比普通GPU跑AI快几十倍,还省电。
类比:一个超级大数据中心就像一个10万人居住的小区。
CPU = 小区主任(啥都管,但忙死)
GPU = 建筑工人(干重活)
DPU = 专门请来的“物业公司”!
DPU(Data Processing Unit 数据处理单元)专门干以下脏活累活:
网络数据包的收发、转发、加密解密
存储数据的压缩、去重、备份
虚拟化、安全防火墙、负载均衡……
把这些事从CPU手里抢过来以后,CPU终于能专心跑真正的程序了。
代表产品:NVIDIA BlueField系列、Intel IPU、阿里云含光800(部分功能)、华为昇腾310(也做DPU)
以后云服务器都会标配DPU,就像现在都标配GPU一样。
名字
类比
擅长干啥
典型场景
CPU
公司老总
什么都会,但就那么几个人
运行软件、办公、编程
GPU
2000个民工
成千上万相同的简单计算
打游戏、渲染视频、挖矿
GPGPU
民工开始干精细活
上面说的都能干(现在默认就是)
科学计算、早期AI训练
AI芯片
专为AI优化的民工团
矩阵乘法、神经网络算得飞快
ChatGPT训练、手机AI拍照
DPU
物业公司
管网络、存储、安全,让CPU休息
阿里云、谷歌云、5G基站
总结:CPU是万能老总,GPU是人多力量大,AI芯片是GPU的加强版专门打AI,DPU是帮老总打杂的新员工。
欢迎加入半导体学习社区,每天了解一点知识。
欢迎加入行业交流群,备注岗位+公司,请联系老虎说芯
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.