网易首页 > 网易号 > 正文 申请入驻

华为昇腾、阿里平头哥、沐曦、壁仞:四大国产GPU可以在一起了!

0
分享至

快科技3月8日消息,上海人工智能实验室(上海AI实验室)官方宣布,基于此前的DeepLink混训技术方案、跨千公里多智算中心长稳混训千亿参数大模型,正式推出DeepLink多元算力混合推理加速方案,实现了对华为昇腾、沐曦、阿里平头哥、壁仞等多款国产GPU芯片的混合调度与协同推理。

据悉,DeepLink混推方案基于统一推理中间件、低时延通信、智能流量路由、策略求解器等原创技术,不仅可对多款芯片混合调度与协同推理,性能也大幅提升,对比单一芯片方案,推理时延TTFT最大可优化34.5%,推理吞吐最大可提升32%。


近些年,国产AI GPU如雨后春笋,性能越来越强,但一方面都是各自为战,另一方面大模型推理技术也需要深入优化和提升。

上海AI实验室在国产GPU异构算力中,运用了预填充-解码分离(PD分离)策略,验证了混合芯片高效协同推理的路径。

同一数据中心内不同规格属性的GPU芯片组合优化使用,可以形成最具性价比的异构算力配比。

具体实现上,上海AI实验室通过四大原创技术底座,实现了对异构算力资源的兼容调度。

推理中间件(DLInfer):

以标准化融合算子接口打通上层框架与底层硬件壁垒,实现算法模型在多元硬件上的统一推理,降低应用门槛。

高速通信库(DLSlime):

全面兼容各类主流物理连接协议,实现跨架构设备高速互联,核心场景带宽利用率突破97%;具有较强的异步处理能力,可实现计算与通信的重叠。

智能流量路由系统(DLRouter):

支持KVCache感知的请求路由,最大限度减少重复或重叠请求,节省计算资源,实现分布式集群负载均衡分配。

策略求解器(DLSolver):

自动获取异构芯片全方位评测数据,结合模型配置以及用户服务等级目标等输入,匹配最优PD分离配置策略,兼顾推理性能与成本。



单一算力平台推理加速方面,可以实现在华为昇腾A2上,针对千卡规模下的化学数据生成场景,吞吐率提升61.9%;在沐曦曦云C500上,MinerU多模态生成推理加速60%。

多款国产GPU芯片的深度混合调度与协同推理方面,千卡规模推理集群实测数据表明,在多模态生成、高并发智能服务等典型场景下,比单芯片方案推理时延TTFT最大可优化34.5%;

在科学论文处理等长输入短输出推理任务中,推理吞吐可提升32%。


值得一提的是,除了以上四家,寒武纪、燧原科技、天数智芯、无问芯穹、商汤科技、中科曙光等也都是上海AI实验室和DeepLink技术方案的合作伙伴。

相信会看到越来越多的国产GPU并肩战斗!

DeepLink官网:https://deeplink.org.cn/home

DeepLink Github:https://github.com/DeepLink-org

DLInfer仓库:https://github.com/DeepLink-org/dlinfer

DLSlime仓库:https://github.com/DeepLink-org/DLSlime


DeepLink合作伙伴

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
6家房企老板长居香港,是为拯救企业,还是另有打算?

6家房企老板长居香港,是为拯救企业,还是另有打算?

帅真商业
2026-03-09 18:52:41
炸锅!央视新版《西游记》开拍!费振翔演悟空变导演,选角吵翻

炸锅!央视新版《西游记》开拍!费振翔演悟空变导演,选角吵翻

动物奇奇怪怪
2026-03-09 19:04:44
特朗普将举行对伊朗动武以来首次新闻发布会

特朗普将举行对伊朗动武以来首次新闻发布会

环球网资讯
2026-03-10 02:06:17
张国立没想到,央剧《我的山与海》播出仅3天,赵亮竟口碑逆转

张国立没想到,央剧《我的山与海》播出仅3天,赵亮竟口碑逆转

吴锎旅行ing
2026-03-10 05:56:05
巴基斯坦也没有想到,跟着中国混来混去,结果自己也混了一个霸主

巴基斯坦也没有想到,跟着中国混来混去,结果自己也混了一个霸主

老范谈史
2025-12-09 20:00:56
神奇的中国村:一村两国,一天出国数次,游客跨过黄线会被罚款

神奇的中国村:一村两国,一天出国数次,游客跨过黄线会被罚款

壹知眠羊
2026-03-10 07:25:20
欠中国的钱,委内瑞拉不还了?美财长:中国已无法继续获得委石油

欠中国的钱,委内瑞拉不还了?美财长:中国已无法继续获得委石油

萌城少年强
2026-01-22 12:47:40
第32波打击!以色列本土告急,美军迎来不眠之夜,特朗普发表讲话

第32波打击!以色列本土告急,美军迎来不眠之夜,特朗普发表讲话

头条爆料007
2026-03-10 06:13:31
中日关系跌至冰点,日企却用55.5%的暴涨,打了高市早苗一记耳光

中日关系跌至冰点,日企却用55.5%的暴涨,打了高市早苗一记耳光

安珈使者啊
2026-03-10 10:48:22
清算终于开始了!一个要求,震动东京:中国要求日本限期内归还

清算终于开始了!一个要求,震动东京:中国要求日本限期内归还

壹知眠羊
2026-01-28 22:03:28
13中10!21分!恭喜杨瀚森,开拓者憾负,斯普利特寻理由

13中10!21分!恭喜杨瀚森,开拓者憾负,斯普利特寻理由

林子说事
2026-03-10 07:36:28
氢弹威力上不封顶,但核武器有个不成文的规定:扔不到对方头上去

氢弹威力上不封顶,但核武器有个不成文的规定:扔不到对方头上去

没有偏旁的常庆
2026-03-01 07:00:11
两条“好报道”,又翻车了?

两条“好报道”,又翻车了?

走读新生
2026-03-09 12:26:32
54岁艾美奖女演员下海:仅用75分钟还清房贷

54岁艾美奖女演员下海:仅用75分钟还清房贷

小椰的奶奶
2026-03-08 21:03:06
回顾:孙子长相神似爷爷,婆婆怀疑儿媳12年,亲子鉴定后全家愣住

回顾:孙子长相神似爷爷,婆婆怀疑儿媳12年,亲子鉴定后全家愣住

谈史论天地
2026-02-28 14:55:57
真正有远见的父母,会在自己60岁那年,主动跟儿女“谈钱”

真正有远见的父母,会在自己60岁那年,主动跟儿女“谈钱”

朗威谈星座
2026-02-03 20:04:33
两家航运巨头,被约谈

两家航运巨头,被约谈

极目新闻
2026-03-10 11:19:59
为啥有些人超害怕安检?网友:没有好心态不要干安检

为啥有些人超害怕安检?网友:没有好心态不要干安检

带你感受人间冷暖
2026-03-06 00:31:11
1332人遇难!中美罕见一致,内塔尼亚胡或下台,特朗普开始找帮手

1332人遇难!中美罕见一致,内塔尼亚胡或下台,特朗普开始找帮手

来科点谱
2026-03-10 10:28:20
为何要增加高中学位?因为不改现状,五五分流根本撑不住

为何要增加高中学位?因为不改现状,五五分流根本撑不住

老特有话说
2026-03-07 16:16:46
2026-03-10 12:03:00
快科技 incentive-icons
快科技
一起关注每日科技热点
107305文章数 260158关注度
往期回顾 全部

科技要闻

“龙虾”狂欢 卖“饲料”先挣钱了?

头条要闻

业主举报违建次日接"邻居"电话:连我妈在哪打拳都知道

头条要闻

业主举报违建次日接"邻居"电话:连我妈在哪打拳都知道

体育要闻

韩国女足羡慕的奢侈品,为何选择中国女足

娱乐要闻

肖战首夺SMG视帝,孙俪四封视后创历史

财经要闻

全民"养龙虾"背后 第一批受害者浮现

汽车要闻

蔚来换电和理想5C,谁能硬刚,比亚迪兆瓦闪充?

态度原创

本地
时尚
教育
旅游
公开课

本地新闻

云游中国|候鸟高颜值亮相!沉浸式打卡青海湿地

爱马仕的暮色时分有多美?

教育要闻

2026保研机构排名与保研机构对比:真实服务揭秘及保研机构推荐

旅游要闻

AI谱曲留住500年乡愁 四川泸县新溪古街会“唱歌”了

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版