网易首页 > 网易号 > 正文 申请入驻

8个字引爆国产芯片!UE8M0 FP8到底是个啥?

0
分享至


DeepSeek V3.1发布后,一则官方留言让整个AI圈都轰动了:


新的架构、下一代国产芯片,总共短短不到20个字,却蕴含了巨大信息量。

国产芯片企业股价也跟风上涨,比如寒武纪22日早盘盘中大涨近14%,午后涨停,总市值跃居科创板头名。


半导体ETF,同样也是在半天的时间里大涨5.89%。(不知道作为放出消息的DeepSeek背后公司幻方量化,有没有趁机炒一波)

这个UE8M0 FP8到底是个啥?下一代国产芯片,又是指什么?

接踵而来的疑问,挤爆了人们的大脑。


在知乎上,也有不少大神开始边科普边分析自己对这件事的理解。


咱抱着学习心态,不妨就从UE8M0 FP8的概念开始说起。


什么是UE8M0 FP8?

“UE8M0 FP8”这个概念,可以拆分成前后两个部分来解释,前面的UE8M0,是MXFP8路径里的“缩放因子”

MXFP8是Open Compute Project在2023年发布的《Microscaling (MX) Formats Specification v1.0》里定义的8 bit微缩块格式

Open Compute Project是2011年由Facebook(现Meta)联合英特尔、Rackspace等发起的开源硬件协作计划,目的是通过共享数据中心及服务器设计推动行业效率提升。

其成员阵容相当强大,国外还有微软、谷歌、亚马逊、AMD、英伟达等,而国内的阿里、腾讯、百度等也参与其中。

说回MXFP8,它以FP8为基础建立,FP8是把常规浮点格式压缩到8 bit的一种编码方式。

MXFP8的核心思想是先把张量切成固定长度的“块”,然后为每个块单独指定一个2的整数次幂作为“缩放因子”,把块内所有数一起除以这个系数后再写成FP8。

这种块级(而不是全张量级)的缩放,让MXFP8既保留了8 bit位宽,又把可用动态范围扩展了几十倍。


来源:英伟达技术博客

而这里的“缩放因子”也是包含8个bit,其中包含符号位、指数位和尾数位,开发者可以自行将这8个bit分配给这三种不同的位。

其中符号位只区分有无,若有则占一个bit,无则不占用,而UE8M0中的U表示的就是无符号(有符号可表示为S或省略不写)。

E和M则分别表示指数位和尾数位分配到的bit数,E8M0指的就是8个bit全都分配给了指数位。

其他常用的格式还有E4M3、E5M2(缩放引子外的本体部分也常采用这两种)等,它们均包含符号位,其余7个bit在指数和尾数位之间分配。


DeepSeek之前开源的5.6k星标项目FP8 GEMM内核DeepGEMM就已经支持UE8M0,不过这个项目主要是适配英伟达芯片和CUDA生态。


那么,采用这种全指数表示缩放因子的方式,有什么好处呢?

首先,由于UE8M0不含尾数与符号位,处理器在根据缩放因子对数据进行复原时,只需要乘以对应的2的幂,也就是移动一下指数位,而不需要浮点乘法、规格化或舍入逻辑,缩短了时钟关键路径。

并且UE8M0的动态范围覆盖2^(−127)到2^128,其指数表可轻松容纳这一跨度,为后续块缩放提供充足空间。

另外UE8M0还能解决单尺度FP8无法同时顾及大/小值,导致溢出或被压成0的问题,将UE8M0作为分块的尺度后,错误率曲线从整张曲线下降到一条远低水平的横线,在保持8 bit张量精度的同时大幅减少信息损失


来源:英伟达技术博客

UE8M0 FP8的好处我们了解了,现在可以解释为什么它更适配“下一代国产芯片”了。

大部分已量产的国产AI加速器仍沿用FP16/BF16 + INT8的计算通路,并未集成E4M3/E5M2这类完整的FP8乘加单元。

不过,摩尔线程MUSA 3.1 GPU、芯原VIP9000 NPU等2025 H2首发的新款国产芯片已经在宣传资料里列出“原生 FP8”或“Block FP8”支持,并与 DeepSeek、华为等15家厂商联合验证UE8M0格式。

虽然下一代国产芯片虽然已经在为FP8做出准备,但HBM/LPPDDR带宽仍然与顶尖芯片存在较大差距。

而UE8M0让一组32个FP8数据只追加8bit缩放引子,相比传统的4B(32bit) FP32缩放直接节省75%的流量,这种空间节约措施被视作下一代架构的重要优化方向。


DeepSeek为哪个国产芯片做了优化?

在搞清楚啥是UE8M0 FP8之后,回过神来的网友们又开始纷纷猜测:

DeepSeek这是在说哪一家的国产芯片呢?

在官方有意卖关子的情况下,人们只好首先把目光放在了首批通过“DeepSeek大模型适配”的8家厂商。


来源:中国信通院官微

这当中大家看好的“头号种子选手”当属寒武纪,市场反应相当直观——

截至22日收盘,寒武纪盘中大涨20%,总市值超5200亿元,超过中芯国际跃居科创板头名(实际以最新为准)。

理由也很简单,该公司旗下的MLU370-S4、思元590及最新690系列芯片均支持FP8计算,在架构设计和低精度计算优化上一直相对比较领先。

而基于类似理由,海光、沐曦,中昊芯英甚至包括名单之外的摩尔线程等也都被网友们挨个点名

  • 海光:其深算三号DCU支持FP8计算,存在进一步优化的空间;

  • 沐曦:今年7月发布的曦云C600,也支持FP8精度计算;

  • 中昊芯英: 其“刹那”TPU AI芯片支持FP8精度;

  • 摩尔线程:作为国内极少数原生支持FP8的GPU厂商,旗舰产品MTT S5000支持FP8精度计算。

与此同时,一些很有可能“即将上车FP8”的厂商也出现在了一众盘点名单中。

例如华为昇腾,虽然昇腾910B和910C暂不支持原生FP8,但官方路线图已经写明“2025Q4原生FP8”,所以众人预计或将在2026年推出的910D(可能的命名)很有可能是所谓的“下一代芯片”。

除了以上这些,还有一大串芯片厂商的名字出现在了讨论当中,堪称盛况空前。

虽然猜来猜去没有最终定论,但不妨碍市场给予热烈回应。根据最新消息,22日国产芯片概念集体高开,科创50大涨8.5%创近三年半新高,芯片产业链集体走强。

所以,大家为什么集体狂欢?这些国产芯片一旦支持UE8M0 FP8究竟意味着什么?

综合当前国内外各方说法来看,一切都可以用一句话来概括:

这代表了国产AI正走向软硬协同阶段,能够实质性减少对英伟达、AMD等国外算力的依赖。

这里头的逻辑也很简单清晰,正是由于UE8M0 FP8精度格式所具备的上述优势(更小的带宽、更低的功耗、更高的吞吐),这意味着同样的硬件今后能跑更大的模型,所以国产芯片的“性价比”被大幅拉高了

换句话说,这些国产芯片厂商将在竞争中更具优势,因此也就属于利好了。

从另一方面来看,DeepSeek通过改动精度格式,相当于主动贴合国产芯片的最佳性能点,这种软硬协同的模式无疑是把国产芯片们拉进了一个统一的生态坐标系。

这就像当年的“Wintel联盟”一样——微软和英特尔通过深度技术绑定,筑起了个人计算机领域的生态护城河,只不过如今换成了DeepSeek和国产芯片厂商们。


One More Thing

事实上,官方在正文部分提到UE8M0 FP8的只有一句话:

需要注意的是,DeepSeek-V3.1使用了UE8M0 FP8 Scale的参数精度。

而且位置相当“隐蔽”,藏在了一大段洋洋洒洒的功能更新介绍之后。


要不是官方特意在评论区补了一句,估计大家还没啥感觉。

所以你说它这个动作吧,不知道算无意还是刻意为之,总之是相当微妙了(手动狗头)。

来源:量子位(QbitAI) 作者克雷西 一水

参考链接:
[1]https://www.zhihu.com/question/1941891000319580108
[2]https://www.zhihu.com/question/1941882763503473149/answer/1942093625908524069
[3]https://docs.nvidia.com/cuda/nvmath-python/0.3.0/tutorials/notebooks/matmul/04_fp8.html
[4]https://www.ainvest.com/news/deepseek-ue8m0-fp8-optimization-rise-china-sufficient-ai-stack-2508/

⭐星标华尔街见闻,好内容不错过

本文不构成个人投资建议,不代表平台观点,市场有风险,投资需谨慎,请独立判断和决策。

觉得好看,请点“在看”

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
第一批赞成“加装电梯”的老小区业主,现在哭着喊后悔了!

第一批赞成“加装电梯”的老小区业主,现在哭着喊后悔了!

巢客HOME
2026-01-19 05:40:03
笑发财!第一次对广东人的松弛感起了敬意,网友:入乡随俗

笑发财!第一次对广东人的松弛感起了敬意,网友:入乡随俗

另子维爱读史
2026-01-19 18:38:23
江苏大一女生开养老院,无人入住却有近400名客户,员工全是60后

江苏大一女生开养老院,无人入住却有近400名客户,员工全是60后

法老不说教
2026-01-16 23:26:38
老人打乒乓球猝死,球馆被索赔40余万!法院判决还社会公道

老人打乒乓球猝死,球馆被索赔40余万!法院判决还社会公道

乒乓网国球汇
2026-01-19 00:02:00
1936 年被俘国民党中将走完长征,到延安后伟人挥手让他回去

1936 年被俘国民党中将走完长征,到延安后伟人挥手让他回去

唠叨说历史
2026-01-12 14:59:24
秦始皇陵建好后,72万工人全被杀,后世是怎么知道皇陵内部情况的

秦始皇陵建好后,72万工人全被杀,后世是怎么知道皇陵内部情况的

铭记历史呀
2026-01-19 16:51:15
就在刚刚,39家A股上市公司发布重大利好 利空消息,看看都有哪些?

就在刚刚,39家A股上市公司发布重大利好 利空消息,看看都有哪些?

股市皆大事
2026-01-19 18:34:48
副总离任索要融资奖金210万元,反被公司起诉索赔经济损失1909万元!法院判了

副总离任索要融资奖金210万元,反被公司起诉索赔经济损失1909万元!法院判了

红星新闻
2026-01-19 14:46:07
郭台铭做正确选择?带回46台光刻机、300亿,喊话"力挺"国产芯片

郭台铭做正确选择?带回46台光刻机、300亿,喊话"力挺"国产芯片

燕梳楼频道
2026-01-18 19:51:34
中央特科最美传奇女特工被判枪决,毛主席拍案大怒:她是全党的恩人

中央特科最美传奇女特工被判枪决,毛主席拍案大怒:她是全党的恩人

睡前讲故事
2025-12-21 16:15:28
还有一个月才过年,农村却出现了5个“怪现象”,咋回事?

还有一个月才过年,农村却出现了5个“怪现象”,咋回事?

社会日日鲜
2026-01-17 09:13:38
股民站稳扶好!不出意外的话,1月20日,明天周二将迎核弹级别行情?

股民站稳扶好!不出意外的话,1月20日,明天周二将迎核弹级别行情?

股市皆大事
2026-01-19 15:58:01
“我阻止了8场战争,却不给我和平奖”,特朗普给挪威首相发信息:不再有义务只考虑和平!欧洲反击,或动用“经济核武器”

“我阻止了8场战争,却不给我和平奖”,特朗普给挪威首相发信息:不再有义务只考虑和平!欧洲反击,或动用“经济核武器”

每日经济新闻
2026-01-19 18:32:10
5岁孩子长期玩"玩具",黑眼珠逐渐"消失",医生:很难恢复了

5岁孩子长期玩"玩具",黑眼珠逐渐"消失",医生:很难恢复了

大果小果妈妈
2026-01-15 20:16:55
曝梁小龙去世过程!凌晨两点半胸口痛,下午抢救不及,儿女在澳洲

曝梁小龙去世过程!凌晨两点半胸口痛,下午抢救不及,儿女在澳洲

裕丰娱间说
2026-01-19 13:40:53
护士长曝光李亚鹏感人细节!医院早没钱了,却硬不裁员,不停手术

护士长曝光李亚鹏感人细节!医院早没钱了,却硬不裁员,不停手术

谈史论天地
2026-01-18 13:23:55
U23国足4战越南全胜!越媒:很难击败中国足球,他们已习惯死守

U23国足4战越南全胜!越媒:很难击败中国足球,他们已习惯死守

奥拜尔
2026-01-19 16:32:19
大多数人都被骗了!提出“斩杀线”的牢A,不简单!

大多数人都被骗了!提出“斩杀线”的牢A,不简单!

毛豆论道
2026-01-18 18:36:36
陈冠希一家洛杉矶参加婚礼,留小胡子像赵本山,女儿更像秦舒培!

陈冠希一家洛杉矶参加婚礼,留小胡子像赵本山,女儿更像秦舒培!

明星私服穿搭daily
2026-01-19 07:30:49
被搅黄的试训,没有“身份”的国少球员!到底是谁害了邝兆镭?

被搅黄的试训,没有“身份”的国少球员!到底是谁害了邝兆镭?

中国足球的那些事儿
2026-01-19 08:00:20
2026-01-19 20:47:00
华尔街见闻官方 incentive-icons
华尔街见闻官方
中国领先的金融商业信息提供商
140308文章数 2652198关注度
往期回顾 全部

科技要闻

这一仗必须赢!马斯克死磕芯片"9个月一更"

头条要闻

特朗普给挪威首相发信息:不再有义务只考虑和平

头条要闻

特朗普给挪威首相发信息:不再有义务只考虑和平

体育要闻

错失英超冠军奖牌,他却在德甲成为传奇

娱乐要闻

吴磊起诉白珊珊诽谤,白珊珊称被盗号

财经要闻

公章争夺 家族反目 双星为何从顶端跌落?

汽车要闻

徐军:冲击百万销量,零跑一直很清醒

态度原创

艺术
教育
亲子
家居
公开课

艺术要闻

有一种美,叫做中国园林!

教育要闻

孩子说“太累了想休息一天”,你会给老师请假吗?

亲子要闻

东莞望牛墩金宝宝幼儿园食材配送启动招标 此前大米生虫被罚

家居要闻

隽永之章 清雅无尘

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版