网易首页 > 网易号 > 正文 申请入驻

阿里云第八代企业级实例g8i算力升级

0
分享至

速途网讯 1月11日,全球领先的云计算厂商阿里云宣布第八代企业级通用计算实例ECS g8i算力再升级,国内首发代号Emerald Rapids的第五代英特尔至强可扩展处理器,依托阿里云自研的「飞天+CIPU」架构体系,ECS g8i实例的整机性能最高提升85%,AI推理性能最高提升7倍,可支撑高达72B参数的大语言模型,帮助中小规模模型起建成本降低50%。同时新实例还提供了端到端安全防护,为企业构建可信AI应用提供强有力的隐私增强算力支撑。

阿里云弹性计算产品线总经理张献涛表示,“阿里云ECS g8i实例的强劲表现,证明了以CPU为中心的计算体系同样具备加速AI推理的巨大潜力,公共云不仅可胜任超大规模的AI模型,也为AI应用加速落地开辟了新路径。”

英特尔中国数据中心和人工智能集团至强客户解决方案事业部总经理李亚东表示:“最新上市的第五代英特尔至强® 可扩展处理器每个内核均内置 AI 加速功能,完全有能力处理要求严苛的 AI 工作负载。与上代相比,其AI训练性能提升多达 29%,AI推理能力提升高达 42%。我们希望借由阿里云第八代企业级实例(ECS g8i)共同助力开发者实现技术普惠,让 AI 技术无处不在。”

通用算力再提升,整机性能提升85%

作为企业级通用计算实例,ECS g8i实例在计算、存储、网络和安全等能力得到了全方位提升。从关键参数上看,ECSg8i实例的L3缓存容量提升到320MB,内存速率高达5600MT/s,整机性能提升85%,单核性能提升25%;存储方面,ESSD云盘提供100万 IOPS,全面搭载NVMe,存储延迟低至百微秒;网络方面,PPS高达3000万,标配阿里云自研eRDMA大规模加速能力,时延低至8微秒;安全方面,ECS g8i实例支持可信计算与加密计算等特性,全球率先支持机密虚拟机TDX技术,构建了全面的安全防护。



在E2E场景下,ECSg8i实例可将MySQL性能提升最高达60%,Redis和Nginx的性能分别提升40%和24%,面向游戏、视频直播、电商、金融、医疗、企业服务等行业提供强劲的算力支持,满足其在数据库、大数据、AI推理等应用场景下对性能的严苛要求。

此外,ECS g8i实例还提供了多种硬件原生加速能力,包括QAT和IAA等加速器。阿里云通过自研技术,将硬件加速能力更细颗粒度透传至实例虚拟机,小规格的ECS g8i实例也同样具备加速能力。其中,依托于QAT原生加解密加速器,ECS g8i实例在压缩/解压缩场景下性能最大可提升70倍,加解密性能提升4倍以上。

为AI提速,可支撑72B参数的大语言模型

生成式AI掀起的技术革命,正在推动计算范式发生根本性的变化。当前,AI大模型推理在算力上依然面临诸多挑战,例如首包延迟受限于并行处理能力与浮点运算能力,吞吐性能则受限于内存带宽和网络延迟。

阿里云ECS g8i实例针对这些难题都进行了相当程度的优化,包括内置指令集从AVX512升级到了Intel AMX高级矩阵扩展加速技术,可让生成式AI更快地运行。相对于AVX512指令集,启用AMX AI加速后,ECS g8i 实例在int 8矩阵计算的性能最高提升7倍。



基于AMX AI加速能力,g8i可更迅速地响应中小规模参数模型,运行知识检索、问答系统及摘要生成等AI工作负载时,起建成本相比A10 GPU云服务器下降50%。此外,配合阿里云平台的Spot抢占式实例,成本优势将进一步凸显,进一步降低AI推理成本。

与此同时,基于自研eRDMA超低延时弹性网络,阿里云g8i实例集群拥有超低延时网络和高弹性优势,可轻松支撑72B参数级别的大语言模型分布式推理,推理性能随集群规模接近线性加速,并可支持超过32batchsize的超大参数规模的AI模型负载,运行文生图、AI生成代码、虚拟助手以及创意辅助工具等AI工作负载。



以阿里云通义千问开源的Qwen-72B大模型为例,可在g8i实例eRDMA网络构建的集群实现高效运行,在输入小于500字情况下,首包延时小于3秒,每秒可生成7个Token。

为安全加码,助力企业构建可信AI应用

安全方面,阿里云在全产品线构建了端到端的安全防护,可保障数据存储、数据传输、数据计算的全流程安全。在最底层,基于CIPU的安全架构搭载安全芯片TPM作为硬件可信根,实现服务器的可信启动,确保零篡改;虚拟化层面,支持虚拟可信能力vTPM,提供实例启动过程核心组件的校验能力;在实例可信的基础上支持不同平台的机密计算能力,实现了运行态的内存数据隔离和加密的保护。



值得一提的是,此次升级的ECS g8i实例全量支持Trust Domain Extension TDX 技术能力,业务应用无需更改,即可部署到 TEE 之中,极大降低了技术门槛,并以极低的性能损耗为大模型等AI应用提供隐私增强算力,护航大模型的云上数据安全。



以Qwen-Chat-7B模型为例,启用TDX后,既确保了模型推理的安全可信,也保护了数据的机密性和完整性。

“阿里云将不断深耕技术、持续产品创新,为企业提供更加稳定、强大、安全、弹性的计算服务,推动各行业的AI应用进入全量爆发时代。”张献涛表示。(栀橙)

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
这位满口“外交豁免权”的大妈,到底是何方神圣?

这位满口“外交豁免权”的大妈,到底是何方神圣?

麦杰逊
2024-06-18 21:37:50
历史罕见!今天,彻底“杀疯了”!

历史罕见!今天,彻底“杀疯了”!

中国基金报
2024-06-18 19:10:00
华春莹推介!张家界这一幕爆火,外国人都被硬控住了

华春莹推介!张家界这一幕爆火,外国人都被硬控住了

潇湘晨报
2024-06-18 22:53:07
没等来高速免费,却迎来国道收费!7省宣布新增公路收费站!

没等来高速免费,却迎来国道收费!7省宣布新增公路收费站!

椰青美食分享
2024-06-19 04:55:42
北大硕士赵斌:姜萍连题目都看不懂,点名王润秋,说错愿承担后果

北大硕士赵斌:姜萍连题目都看不懂,点名王润秋,说错愿承担后果

东东趣谈
2024-06-18 17:25:07
令人泪目!山西8岁男孩:反正穷光蛋,长大捡破烂吧,能活着就好

令人泪目!山西8岁男孩:反正穷光蛋,长大捡破烂吧,能活着就好

贾文彬的史书
2024-06-18 23:36:34
从明年开始,个人存款超过30万以上的家庭,或将面对“三大麻烦”

从明年开始,个人存款超过30万以上的家庭,或将面对“三大麻烦”

山茶谈
2024-06-18 22:17:39
世界名画?39岁的C罗开球冲刺画面在国外疯传,球迷:真顶流

世界名画?39岁的C罗开球冲刺画面在国外疯传,球迷:真顶流

侧身凌空斩
2024-06-19 06:39:04
嚣张跋扈!使馆车违停叫嚣有外交豁免权:余琦本人发声道歉!

嚣张跋扈!使馆车违停叫嚣有外交豁免权:余琦本人发声道歉!

毒舌说历史1
2024-06-19 09:00:35
乡党委书记在学校调戏女老师,没想到女老师的老公竟是县委书记

乡党委书记在学校调戏女老师,没想到女老师的老公竟是县委书记

南山青松
2024-06-18 17:57:38
“拜登身体机能衰退”?美官方回应

“拜登身体机能衰退”?美官方回应

新京报
2024-06-19 08:40:36
曹县翰林府不雅视频曝光后续:女销售身份被扒,长相身材很一般

曹县翰林府不雅视频曝光后续:女销售身份被扒,长相身材很一般

180°视角
2024-06-18 12:55:47
社会正在批量生产文盲和精神病!

社会正在批量生产文盲和精神病!

读史
2024-06-18 07:00:46
前行政长官林郑月娥,退休后因被制裁,沦落到只能在香港租房住?

前行政长官林郑月娥,退休后因被制裁,沦落到只能在香港租房住?

史二了
2024-06-18 14:01:44
上海地铁站持刀伤3人后续:行凶者身份曝光,目击者透露案发细节

上海地铁站持刀伤3人后续:行凶者身份曝光,目击者透露案发细节

洛洛女巫
2024-06-19 11:23:22
“人造数学天才”,一个非常拙劣的谎言,彻头彻尾的炒作

“人造数学天才”,一个非常拙劣的谎言,彻头彻尾的炒作

爆角追踪
2024-06-18 17:25:17
太悲壮!网传杭州亚运村业主联名:我自持自住,誓与亚运村共存亡

太悲壮!网传杭州亚运村业主联名:我自持自住,誓与亚运村共存亡

火山诗话
2024-06-18 16:52:31
看完甘肃天水这件事,才真的让我后怕!

看完甘肃天水这件事,才真的让我后怕!

顾礼先生
2024-06-18 16:11:00
最高法“大老虎”落马:官至中央部级,腐受贿1.14亿,儿子家中被查出3亿现金

最高法“大老虎”落马:官至中央部级,腐受贿1.14亿,儿子家中被查出3亿现金

天闻地知
2024-06-19 09:36:11
失去中国国籍代价有多高?身价千亿依然是待宰的羔羊

失去中国国籍代价有多高?身价千亿依然是待宰的羔羊

枫冷慕诗
2024-06-18 19:09:58
2024-06-19 14:24:49
速途网
速途网
互联网科技资讯
2025文章数 11389关注度
往期回顾 全部

科技要闻

英伟达超越苹果、微软登顶全球新股王

头条要闻

8名大龄女工坐冷藏车窒息身亡 车内有大量未包装干冰

头条要闻

8名大龄女工坐冷藏车窒息身亡 车内有大量未包装干冰

体育要闻

欧洲杯最大的混子,非他莫属

娱乐要闻

黄一鸣“杀疯了” 直播间卖大葱养孩子

财经要闻

吴清:证监会将推出“科创板八条”

汽车要闻

双肾格栅变化大/内饰焕新 新一代宝马X3官图发布

态度原创

家居
健康
旅游
教育
军事航空

家居要闻

自然开放 实现灵动可变空间

晚餐不吃or吃七分饱,哪种更减肥?

旅游要闻

遭遇极端高温天气导致希腊多名游客死亡

教育要闻

敬请投稿!“年轻不可轻”第二届新民青少年社论大赛正式开启。邀你来这里挥斥方遒,浪遏飞舟!

军事要闻

美国务卿:除部分炸弹 其他对以武器援助均在正常运输

无障碍浏览 进入关怀版