网易首页 > 网易号 > 正文 申请入驻

元脑服务器的创新应用:浪潮信息引领AI计算新时代

0
分享至

浪潮信息的元脑 R1 服务器现已全面支持开源框架 SGLang,能够在单机环境下实现 DeepSeek 671B 模型的高并发性能,用户并发访问量超过1000。通过对 SGLang 最新版本的深度适配,元脑 R1 推理服务器在运行高性能模型时,展现出卓越的处理能力,满足了现代AI应用对算力的严苛要求。

DeepSeekR1参数量达到6710亿,采用了MLA注意力机制和共享专家、路由专家共同组成的混合专家(MoE)架构,其创新的模型架构也带来了在推理服务上的性能挑战。浪潮信息团队从AI服务器和推理框架入手开展了协同优化工作。

元脑R1推理服务器NF5688G7原生搭载FP8计算引擎,针对DeepSeek R1 671B模型部署速度快且无精度损失,1128GB HBM3e高速显存满足671B模型 FP8精度下不低于800GB显存容量的需求,单机支持全量模型推理情况下,仍保留充足的KV缓存空间。显存带宽高达4.8TB/s,完美契合DeepSeek R1模型"短输入长输出、显存带宽敏感"的技术特征,在推理解码阶段可实现极致加速。在通信方面,GPU P2P带宽达900GB/s,保障单机部署张量并行最佳通讯性能。

SGLang是新兴的开源推理框架项目,其得到活跃的社区支持,并在工业界获得了广泛应用。SGlang的核心特性包括:快速的后端运行时、灵活的前端语言、广泛的模型支持等。尤其值得关注的是,SGLang针对MLA注意力机制开展了针对性的工程优化,并在框架上对MoE架构的推理做了优化设计。SGLang也是最早适配DeepSeek v3和R1的优选推理框架之一。

目前,元脑R1推理服务器 NF5688G7已完成SGLang最新版本 0.4.3的适配优化工作。通过硬件调优、算子优化、混合并行、多token预测等多方面的工程实践,在元脑R1推理服务器 NF5688G7上运行DeepSeek671B R1模型,成功实现了单用户解码最高33 tokens/s及最大用户并发超1000的优异性能表现。

单路并发性能测试日志,根据TPOT换算用户解码性能为33.3 tokens

DeepSeekR1 671B是一个稀疏度较高的MoE架构模型,具有模型参数量大、计算量小的特点。和Dense模型相比,在满足KV cache的显存占用的前提下,可以支持更高的并发访问需求。实测数据表明,基于单台NF5688G7,在使用DeepSeek R1进行带思维链深度思考的短输入长输出的问答场景下,使用100/1000作为输入输出长度,实测在单个用户并发时的解码性能为33.3tokens/s;在16个用户并发时,每个用户有约20 tokens/s的解码性能;在64个用户并发时,每个用户有约10.4 tokens/s的解码性能。而在使用1024个用户并发访问的极限测试时,单台NF5688G7实现了3975.76 tokens/s的吞吐性能,可以满足超高并发场景下多用户使用需求。

1024路并发性能测试日志,测试使用了1000/1000的输入输出长度,实现了3975.76 tokens/s的总设备吞吐

浪潮信息团队正与业内团队密切合作,在计算架构、算子调优、并行策略、框架适配、调度管理等多个方面持续发力,旨在为用户带来高性能、高效稳定、性价比高的DeepSeek大模型部署服务方案,助力大模型快速落地应用。

浪潮信息团队与行业内的合作伙伴紧密协作,持续在计算架构、算子优化、并行策略及框架适配等多个领域进行创新,旨在为用户提供高效、稳定且具性价比的 DeepSeek 大模型部署服务。作为全球领先的 IT 基础设施产品和服务提供商,浪潮信息致力于通过元脑服务器推动人工智能的快速发展与应用落地,构建开放、绿色的智能计算生态。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
千亿龙头开盘涨停后跌超2%,刚公告再签百亿算力大单

千亿龙头开盘涨停后跌超2%,刚公告再签百亿算力大单

21世纪经济报道
2026-06-02 10:17:04
上海队开出了巨额奖金!

上海队开出了巨额奖金!

体育哲人
2026-06-02 13:41:18
复仇之战冯彦哲失误不断,印尼公开赛首轮石宇奇大玩心跳

复仇之战冯彦哲失误不断,印尼公开赛首轮石宇奇大玩心跳

佑铭羽球
2026-06-02 12:09:04
寿命短的男性,一般会有“3大1白”,如果没有,说明身体很健康

寿命短的男性,一般会有“3大1白”,如果没有,说明身体很健康

熊猫医学社
2026-05-31 11:30:03
他是外交部原部长,1985年被邓小平怒批“胡说八道”,活到了98岁

他是外交部原部长,1985年被邓小平怒批“胡说八道”,活到了98岁

历史人文2
2026-05-09 22:00:03
比新生儿暴跌更可怕!中国迎来死亡人口高峰,未来十年彻底变天

比新生儿暴跌更可怕!中国迎来死亡人口高峰,未来十年彻底变天

维纳斯的眼泪
2026-06-02 12:03:24
从14万到5.5万,蒸发2500万:广州天河顶豪,戳破了豪宅的旧神话

从14万到5.5万,蒸发2500万:广州天河顶豪,戳破了豪宅的旧神话

地产一品塘
2026-06-02 08:00:16
美国媒体报道 伊朗已疏通大量被阻塞的地下导弹设施入口

美国媒体报道 伊朗已疏通大量被阻塞的地下导弹设施入口

国际在线
2026-06-01 14:23:12
给5岁女儿买11200元连衣裙,明明打对折,结果专柜收了全款!销售求原谅:工资低也可怜;爸爸怒了:他们道德绑架!

给5岁女儿买11200元连衣裙,明明打对折,结果专柜收了全款!销售求原谅:工资低也可怜;爸爸怒了:他们道德绑架!

扬子晚报
2026-06-01 12:26:28
郑丽文深夜登机赴美,国民党内部反应亮了,萧旭岑一段话不简单

郑丽文深夜登机赴美,国民党内部反应亮了,萧旭岑一段话不简单

DS北风
2026-06-02 10:46:13
“死在家里,没人嫌弃你”——这是22岁老狗临终时,人给它的最后一句情话

“死在家里,没人嫌弃你”——这是22岁老狗临终时,人给它的最后一句情话

消化石医生
2026-05-25 12:12:28
特朗普安抚市场:黎以所有交火行动将立即停止 与伊朗的谈判正“快速推进”

特朗普安抚市场:黎以所有交火行动将立即停止 与伊朗的谈判正“快速推进”

财联社
2026-06-02 03:37:15
把瑜伽裤穿成日常的松弛感美女

把瑜伽裤穿成日常的松弛感美女

只要高兴就好
2026-04-13 14:30:30
用丰腴,拉高普通且傻乎乎的颜值

用丰腴,拉高普通且傻乎乎的颜值

梅梅聊点实在嗑
2026-05-27 07:22:56
港股,突发!五大巨头,集体猛拉!发生了什么?

港股,突发!五大巨头,集体猛拉!发生了什么?

数据宝
2026-06-02 12:26:14
刚刚获批!越南南北高铁敲定2035年完工,17个独立项目同时推进,中国力量参与人才培训

刚刚获批!越南南北高铁敲定2035年完工,17个独立项目同时推进,中国力量参与人才培训

缅甸中文网
2026-06-01 13:40:05
二十年警服半生荣光,一念失守满盘皆输,温州一案敲醒众人

二十年警服半生荣光,一念失守满盘皆输,温州一案敲醒众人

叮当当科技
2026-06-02 09:36:46
男人为何和未婚女人偷情后,就很难再断关系了?

男人为何和未婚女人偷情后,就很难再断关系了?

思絮
2026-06-02 12:22:32
秀才刁难寡妇,出上联“有木也是桥,无木也是乔”,寡妇下联妙了

秀才刁难寡妇,出上联“有木也是桥,无木也是乔”,寡妇下联妙了

历史龙元阁
2026-06-02 13:45:10
老年人腿无力、使不上劲?医生建议:补充8种营养,走起路更有劲

老年人腿无力、使不上劲?医生建议:补充8种营养,走起路更有劲

美食店主
2026-06-02 01:34:07
2026-06-02 14:28:49
今天星期天
今天星期天
工作之外的我才是不可替代的!上班的时候我只是一颗螺丝钉!
129文章数 0关注度
往期回顾 全部

科技要闻

英伟达RTX Spark 很猛,但首批机型不便宜

头条要闻

乌克兰战场现"人形机器人" 美企:本来就是为打仗而生

头条要闻

乌克兰战场现"人形机器人" 美企:本来就是为打仗而生

体育要闻

1米74的业余联赛替补,在英超踢中卫

娱乐要闻

奚梦瑶何猷君婚礼曝光 深情热吻甜蜜

财经要闻

锂电“资源墙”高筑 全球性长期博弈开始

汽车要闻

星途神秘新车轮廓曝光 又一款性能SUV要来了?

态度原创

亲子
本地
时尚
公开课
军事航空

亲子要闻

今年育儿补贴补助资金999亿元已下达,较上年增长10.6%

本地新闻

用剪纸的方式,打开江苏扬州

安妮海瑟薇40岁后美出新高度, 开挂的关键原来是这个

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

伊朗媒体新发布最高领袖照片

无障碍浏览 进入关怀版