网易首页 > 网易号 > 正文 申请入驻

华为推出新款AI加速卡:国内唯一支持FP4,算力是H20近三倍

0
分享至

(文/观察者网 吕栋)

在刚刚结束的华为中国合作伙伴大会2026上,华为副总裁、ICT产品组合管理与解决方案部总裁马海旭宣布,Atlas 350加速卡正式上市销售,该卡搭载的是昇腾950PR处理器。这也标志着,在去年华为首次介绍昇腾950PR之后,该芯片如期上市。

华为昇腾计算业务总裁张迪煊介绍,Atlas 350的单卡算力达到了英伟达H20的2.87倍,是目前国内唯一支持FP4低精度的推理产品;其次内存上,它的HBM容量是H20的1.16倍,达到了112GB,多模态生成速度可以提升60%;第三内存访问颗粒度从512字节减少到128字节,小算子访存效率提升4倍。

支持FP4低精度意味着什么?观察者网梳理发现,英伟达现在想往中国销售的H200就不支持原生PF4,只有更先进的Blackwell才引入。而支持FP4,本质上是用精度换效率的极致推理方案,意味着70B参数的模型仅需35GB显存,单卡即可加载,推理延迟大幅降低,而FP16需要140GB显存。

在现场,昆仑、华鲲振宇、神州鲲泰、长江计算、宝德、软通华方、百信7家核心伙伴首发基于Atlas 350的整机产品,标志着昇腾950代际推理算力正式进入商用阶段。科大讯飞也表示,新一代星火大模型将与昇腾910/950系列算力底座进行适配。


Atlas 350加速卡 图源:观察者网

观察者网在展台上看到,Atlas 350的FP4精度算力为1.56P,带宽达到了1.4TB/s;功耗达到了600W,是H20的1.5倍。

去年华为在全联接大会上介绍,昇腾950系列分为昇腾950PR和昇腾950DT,前者主要面向Prefill和推荐场景,它采用的是华为自研低成本HBM,HiBL 1.0,相比高性能、高价格的HBM3e/4e,能大大降低推理Prefill阶段和推荐业务的投资。

从单卡指标来看,昇腾950PR与英伟达H20掰掰手腕应该不成问题,而在FP8/FP16算力以及显存带宽上,与H200仍存一定差距,其600W的功耗指标,也已十分接近H200的700W。

但在训练场景,随着模型参数的规模越来越大,比较单卡的性能指标意义已经有限,华为也顺势提出了超节点战略。在今年的巴展上,华为面向全球展示了Atlas 950超节点,它最大支持8192张昇腾950DT卡通过“灵衢”全光互联,即便与英伟达计划2027年上市的NVL576相比,Atlas 950超节点各方面依然有优势。

在此次合作伙伴大会的昇腾人工智能伙伴峰会上,清华大学计算机系教授、昇腾荣誉顾问郑纬民表示,超节点凭借其超高带宽、超低时延,以及内存统一编址等核心特点,已成为推动AI技术发展的关键力量,正逐步成为AI基础设施建设的新常态。

他还提到,超节点技术已在互联网、电信、制造等行业落地应用。实践证明,唯有具备内存统一编址能力的超节点,才能真正实现算力的Scale-Up扩展。超级点让中国算力具备了支撑世界级大模型的能力,推动我国AI算力从技术跟随迈向架构引领。


图源:观察者网

技术突破只是第一步,真正的挑战在于生态持续发展建设。马海旭在会上表示,2025年8月5号,华为正式明确昇腾全量软件开源开放。截止目前,CANN等软件已完成架构解耦,安装包从8个拆分为29个,支持开发者按需使用,编译效率提升58%。

“我们还将全流程的支持和贡献三方开源生态,从算子编程框架Trion到AI框架PyTorch,再到训推加速引擎FSDP、vLLM等,目前已累计支持了50多个三方开源社区和项目,贡献了650多个关键特性。匹配伙伴开发者的使用习惯的同时,让大家更好的基于昇腾实现创新落地。今年,我们还将持续提升软件易用性,进一步优化开箱性能,从易用全面走向好用。”他在演讲中说道。

为了体现昇腾的易用性,张迪煊还提到了智谱的例子。他表示,智谱基于昇腾在3个月时间里,完成多模态大模型GLM-Image的训练,这个模型创新采用自回归加扩散的混合架构,在开源不到24小时内,登顶全球最大开源社区Hugging Face的Trending榜单,证明了昇腾可以训练出世界级领先的大模型。

在当下,人工智能正快速融入每个人的工作和生活中。今年春节期间,平均每隔1.5天就有一个新模型发布,模型能力也越来越强,比如Seedance2.0可提供、专业级视频生成;应用层面,OpenClaw引爆全球Agentic AI发展,实现AI应用从“理解与建议”到“感知与执行”的转变,短短几周几乎超越Linux三十年的成就,已成为最受欢迎的开源项目,推动AI算力需求高速增长。


图源:观察者网

但从碎片化场景来看,也并不是每家企业都需要巨无霸算力系统,对于万亿参数大模型训练,可能需要384卡、768卡,甚至更大的规模。而对于更广大的企业,8卡满足基础推理、小规模训练,成本可控、运维简单;64卡突破性能瓶颈,适配中大型训练,成本远低于数百卡、千卡,运维难度也在可承受范围内。

华为也注意到了更多算力档位的需求。张迪煊表示,针对不同规模大模型,昇腾产品实现了分级分档升级:面向百亿级模型推出A2标卡,内存带宽达业界1.8倍;面向千亿级模型提供单机服务器,算力为业界2.3倍;面向万亿级模型采用双机超节点服务器,灵衢直连可部署T级模型,整机算力达业界3.78倍。

当下“养虾”正成为热潮,再度激起了对一体机的需求。马海旭等人在会上透露,过去一个多月已有10几家伙伴推出了基于昇腾的Claw一体机,支撑了100多客户完成基于openClaw的Agent应用开发。截至目前,昇腾已联合伙伴打造400多款行业一体机,服务2700多家客户,占据国内一体机市场80%以上份额。

技术先进性和生态成熟度,最终需要市场来验证。根据Bernstein Research预测,以收入计算,预计2026年华为在中国AI加速器市场的份额将提升到50%,英伟达受产品禁售影响或将降至8%,AMD升至12%,海光提升到8%,寒武纪升至9%,摩尔线程、昆仑芯、沐曦股份和壁仞科技等处于1%-3%的位置。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
中年周杰伦不过是绝望的文盲 求别再硬凹什么艺术家人设了

中年周杰伦不过是绝望的文盲 求别再硬凹什么艺术家人设了

六子吃凉粉
2026-03-30 09:48:33
第二个 “富士康” 诞生,年收7771亿,员工96万,郭台铭后悔了吗

第二个 “富士康” 诞生,年收7771亿,员工96万,郭台铭后悔了吗

老谢谈史
2026-03-28 21:39:04
反转了! 刘晓庆妹妹录音曝光:她要是真把房子捐国家,我们签字配合

反转了! 刘晓庆妹妹录音曝光:她要是真把房子捐国家,我们签字配合

陈意小可爱
2026-03-28 15:49:01
在医院你遭遇过最羞耻的事是什么?网友:一个比一个炸裂啊

在医院你遭遇过最羞耻的事是什么?网友:一个比一个炸裂啊

解读热点事件
2026-02-04 00:05:07
霍尔木兹海峡全面封锁,中国船只也不能通过,海湾国家坐不住了

霍尔木兹海峡全面封锁,中国船只也不能通过,海湾国家坐不住了

阿讯说天下
2026-03-30 00:09:49
白幼瘦哪有这种轻熟风有韵味

白幼瘦哪有这种轻熟风有韵味

牛弹琴123456
2026-03-28 12:21:44
苏州追悼会:那辆落灰的电驴,看哭无数中年人

苏州追悼会:那辆落灰的电驴,看哭无数中年人

小鹿姐姐情感说
2026-03-29 12:29:13
“华人神探”李昌钰辞世:去年确诊脑瘤,去世前两天刚完成新书初稿

“华人神探”李昌钰辞世:去年确诊脑瘤,去世前两天刚完成新书初稿

大风新闻
2026-03-28 15:20:15
没想到不翻不知道,一翻吓一跳,张雪峰几乎每个月都在网上喊累

没想到不翻不知道,一翻吓一跳,张雪峰几乎每个月都在网上喊累

岁月有情1314
2026-03-26 12:13:10
摊牌了!中国发强硬警告,必须给个交代,一张明牌已亮出

摊牌了!中国发强硬警告,必须给个交代,一张明牌已亮出

Ck的蜜糖
2026-03-29 15:08:03
嘉吉暂停对华出口巴西大豆

嘉吉暂停对华出口巴西大豆

新浪财经
2026-03-29 08:26:16
杨瀚森6分4板开拓者大胜,被抱摔吃T需更强硬

杨瀚森6分4板开拓者大胜,被抱摔吃T需更强硬

余憁搞笑段子
2026-03-30 09:21:29
无耻!伊朗把征兵年龄降到12岁了

无耻!伊朗把征兵年龄降到12岁了

老马拉车莫少装
2026-03-27 15:27:16
打疯了!申京36+14+7+3+3+5三分追平生涯纪录 他才是火箭头牌

打疯了!申京36+14+7+3+3+5三分追平生涯纪录 他才是火箭头牌

醉卧浮生
2026-03-30 09:24:45
网传张雪峰公司“峰学蔚来”换帅了?他叫武亮,家长终于放心了

网传张雪峰公司“峰学蔚来”换帅了?他叫武亮,家长终于放心了

谈史论天地
2026-03-29 07:53:45
为了印度得罪中国,要中国归还港口99年使用权,看到违约金后傻眼

为了印度得罪中国,要中国归还港口99年使用权,看到违约金后傻眼

混沌录
2026-03-29 22:37:05
俄罗斯正斥资数百亿在乌东打造“新俄罗斯”,巩固对占领区的控制

俄罗斯正斥资数百亿在乌东打造“新俄罗斯”,巩固对占领区的控制

你的雷达站
2026-03-30 09:44:10
她首度回应“辱华”争议!汤森德坦言:文化差异太大了

她首度回应“辱华”争议!汤森德坦言:文化差异太大了

体育妞世界
2026-03-29 20:58:19
一觉醒来伊朗发动联合打击!以色列工业区被炸!美方称将达成协议

一觉醒来伊朗发动联合打击!以色列工业区被炸!美方称将达成协议

阿讯说天下
2026-03-30 09:12:19
V我五十,给你一个红军未来主力中卫?

V我五十,给你一个红军未来主力中卫?

靴室笑谈社
2026-03-30 09:59:22
2026-03-30 10:27:00
观察者网 incentive-icons
观察者网
全球视野,中国关怀
137594文章数 1850311关注度
往期回顾 全部

科技要闻

DeepSeek“崩了”一夜,仍无法正常使用

头条要闻

牛弹琴:开战30天后 一场更猛烈的风暴即将到来

头条要闻

牛弹琴:开战30天后 一场更猛烈的风暴即将到来

体育要闻

绝杀卫冕冠军后,他单手指天把胜利献给父亲

娱乐要闻

汪峰定律再现!李荣浩喊话单依纯侵权

财经要闻

油价冲击,有些亚洲货币先扛不住了!

汽车要闻

岚图泰山X8配置曝光 四激光雷达/华为新一代座舱

态度原创

艺术
时尚
游戏
旅游
数码

艺术要闻

毛主席的草案遭吐槽!退休前能否再创辉煌?

来到1980的周也,好毛利兰

《无限机兵》DLC“厄瑞涅的战争熔炉”试玩报告:另辟蹊径

旅游要闻

香江四季繁花盛,湾区共促“赏花经济”正当时

数码要闻

555.5万台!中国大陆投影仪稳居全球最大单一市场

无障碍浏览 进入关怀版