网易首页 > 网易号 > 正文 申请入驻

华为昇腾推出高性能INT8量化方案,更好适配DeepSeek

0
分享至

(文/万肇生 编辑/张广凯)

近日,华为公开了昇腾服务器上部署DeepSeek V3/R1推理的最佳实践,并介绍了一系列创新技术。

其中,华为在降低计算资源需求方面,创新提出了昇腾亲和的低比特量化解决方案OptiQuant,最终实现了INT8量化模式与FP8的模型推理精度持平。


由于DeepSeek V3/R1模型是基于英伟达生态训练,并推荐使用FP8精度推理,而国产芯片普遍没有原生支持FP8精度,导致国产芯片对DeepSeek的适配不佳。华为昇腾的上述研究应该就是为了解决这一问题。

通常情况下,在模型推理阶段,进行量化(如FP8量化为INT8)可以显著降低模型对硬件的存储需求和计算复杂度,但也会造成模型推理精度的损失以及逻辑错误等问题。因此如何保持推理精度,是低比特量化满足不同平台部署需求时的前提。

据华为介绍,基于BF16的DeepSeek需要1.3TB的显存空间,同时导致极大的算力和跨机通信开销。而校准集的泛化性缺失导致了在很多任务上难以达到与原有模型相近的精度水平,甚至在某些场景下精度下降十分严重。同时,还要考虑如何设计昇腾亲和的量化算法,以发挥硬件性能。

针对上述问题,华为提出了OptiQuant量化框架,一种高性能保精度量化方案,设计了层间自动混精、自动混合校准、离群值抑制、可学习的截断和SSZW参数量化算法。除了支持业界主流量化算法功能之外,它还新增支持三个功能:接入自定义量化算法和数值类型,可以将多种量化算法的自由组合搭配使用;支持业内主流评测数据集和用户自定义的数据校准集;支持数据并行和流水并行,针对不同大小的大语言模型实现精度验证性能加速。

OptiQuant框架主要由以下几个模块组成:

量化类型和数值类型:OptiQuant支持了Int2/4/8和FP8/HiFloat8等数据类型,支持业界的Qserve,HQQ,LUT等量化方法,在此基础上提出了可学习截断和量化参数优化等算法,进一步减少了量化误差。 多样化测试数据集和用户自定义校准集:多样化测试数据集和用户自定义校准集:OptiQuant支持了判断题,问答题,代码题和数学题等多种测试类别,语种上支持了十种常见语言。此外,OptiQuant支持用户自定义校准集,提升模型量化过程中的泛化性。 量化权重生成:OptiQuant提出了自适应层间混精算法,并且根据对应的量化配置生成对应的权重参数,通过去冗余技术减少参数保存的参数量;OptiQuant进一步提出了FlexSQ等算法,在数据校准过程中,对大模型激活异常值进行了平滑处理,有助于对激活做低比特量化。

最终,基于Atlas 800I A2服务器的精度测试实验结果显示,对于DeepSeek-V3-0324模型,W8A8C16和W4A8C16均采用Per-channel量化,实现了推理精度与FP8-GPU持平。



华为表示,在DeepSeek R1/V3大模型推理场景中,实现了INT8量化模式与FP8的模型推理精度持平,而且进一步发挥了华为Atlas 800I A2和CloudMatrix384集群推理硬件性能。而相关代码也将逐步开源。

本文系观察者网独家稿件,未经授权,不得转载。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
乌克兰猛攻克里米亚的占科伊基地!萨拉托夫油厂遇袭燃烧

乌克兰猛攻克里米亚的占科伊基地!萨拉托夫油厂遇袭燃烧

项鹏飞
2025-09-17 13:19:40
确定!回来了,再见CBA,考辛斯正式签约,又是降维打击啊,真好

确定!回来了,再见CBA,考辛斯正式签约,又是降维打击啊,真好

球童无忌
2025-09-16 21:52:18
情绪崩溃到发飙!34岁男演员跪地求原谅

情绪崩溃到发飙!34岁男演员跪地求原谅

极目新闻
2025-09-17 12:12:30
博主:国安今晚不去工体踩场,塞蒂恩携张稀哲参加赛前发布会

博主:国安今晚不去工体踩场,塞蒂恩携张稀哲参加赛前发布会

懂球帝
2025-09-17 13:58:07
央媒发文一周后,石平在华资产被扒,千万财产被冻结,家属受牵连

央媒发文一周后,石平在华资产被扒,千万财产被冻结,家属受牵连

妙知
2025-09-17 11:17:50
社保的石头 韩国已经摸过了

社保的石头 韩国已经摸过了

卢诗翰
2025-08-13 21:58:51
著名电影人罗伯特·雷德福去世,享年89岁

著名电影人罗伯特·雷德福去世,享年89岁

可乐谈情感
2025-09-17 13:41:05
春晚爆红后,她洗完澡从23楼一跃而下,临终时最后喊了声“妈妈”

春晚爆红后,她洗完澡从23楼一跃而下,临终时最后喊了声“妈妈”

来科点谱
2025-09-11 09:23:28
演员李勤勤发文:愿意兜底,收留于朦胧爱犬,为这么优秀的孩子离去惋惜,此前曾收养周海媚的爱犬

演员李勤勤发文:愿意兜底,收留于朦胧爱犬,为这么优秀的孩子离去惋惜,此前曾收养周海媚的爱犬

极目新闻
2025-09-14 19:11:54
攀附省委书记妻子获提拔的杨慧,认罪悔罪

攀附省委书记妻子获提拔的杨慧,认罪悔罪

新京报政事儿
2025-09-16 16:26:06
“柴怼怼”和他的“假宝玉”丨大象深度

“柴怼怼”和他的“假宝玉”丨大象深度

大象新闻
2025-09-17 12:01:06
首款国产DUV光刻机或正测试,中芯国际大涨近9%刷新历史新高!半导体设备ETF(561980)受提振直线拉涨3.04%

首款国产DUV光刻机或正测试,中芯国际大涨近9%刷新历史新高!半导体设备ETF(561980)受提振直线拉涨3.04%

和讯网
2025-09-17 10:48:03
太恶心!上海知名景区门口有人卖不明饮料,不少游客中招,城管部门已介入调查

太恶心!上海知名景区门口有人卖不明饮料,不少游客中招,城管部门已介入调查

北青网-北京青年报
2025-09-17 13:56:19
马纳法手球逃点成悬案?解说员:足协评议无结果,将咨询国际足联

马纳法手球逃点成悬案?解说员:足协评议无结果,将咨询国际足联

奥拜尔
2025-09-17 14:12:49
日本要接盘美国大豆?美国被曝准备将滞销的大豆转售给日本。

日本要接盘美国大豆?美国被曝准备将滞销的大豆转售给日本。

忠于法纪
2025-09-17 09:17:02
于东来3次力挺西贝是图啥?网友扒出猛料,他2年前或许就在布局了

于东来3次力挺西贝是图啥?网友扒出猛料,他2年前或许就在布局了

娱乐看阿敞
2025-09-17 11:24:36
今晚开播!央视38集黑马大剧震撼来袭,演员阵容强大,想不火都难

今晚开播!央视38集黑马大剧震撼来袭,演员阵容强大,想不火都难

可乐谈情感
2025-09-17 09:54:30
32强出炉!斯诺克英格兰公开赛:赵心童轰3杆破百,傅家俊2-4出局

32强出炉!斯诺克英格兰公开赛:赵心童轰3杆破百,傅家俊2-4出局

墨羽怪谈
2025-09-17 04:44:33
中新网评西贝争议:老板教育消费者,本质是爹味营销作怪

中新网评西贝争议:老板教育消费者,本质是爹味营销作怪

澎湃新闻
2025-09-16 17:19:18
中国女篮决战尤文图特大名单揭晓,争议球员再次入选,王思雨淘汰

中国女篮决战尤文图特大名单揭晓,争议球员再次入选,王思雨淘汰

宗介说体育
2025-09-16 13:49:40
2025-09-17 15:04:49
观察者网 incentive-icons
观察者网
全球视野,中国关怀
124689文章数 1849100关注度
往期回顾 全部

科技要闻

英伟达RTX6000D遇冷,中国大厂不买账

头条要闻

浙江女子开水果店亏钱"像在守活寡" 网友吵翻了

头条要闻

浙江女子开水果店亏钱"像在守活寡" 网友吵翻了

体育要闻

什么小火龙?申京已经是MVP水平!

娱乐要闻

官媒发文证实,李乃文再破天花板

财经要闻

曝匹克大幅降薪 员工还要进行"三观培训"

汽车要闻

唐DM-i智驾版175KM长续航版上市售价17.98万起

态度原创

时尚
手机
健康
公开课
军事航空

气质女人,都少不了亦舒笔下的开衫

手机要闻

消息称荣耀下一代数字系列手机标配2亿像素主摄,折叠屏同步测试

内分泌科专家破解身高八大谣言

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

以色列攻入加沙城 多国寻求将其逐出联合国

无障碍浏览 进入关怀版