网易首页 > 网易号 > 正文 申请入驻

Astera Labs推出新型高基数交换芯片,剑指碎片化AI工作负载

0
分享至


随着AI基础设施投资持续攀升,集群设计与实际工作负载行为之间的鸿沟正导致大量算力闲置。Astera Labs针对这一问题推出了新型高基数架构交换芯片,旨在提升碎片化工作负载场景下的协同效率。

该公司本周发布了Scorpio X系列320通道智能交换芯片,将其定位为一种内存语义架构,目标是在AI系统规模扩展过程中降低延迟、提升加速器利用率。目前该产品已开始向超大规模云服务商出货,更大规模的量产预计于2026年下半年启动。

工作负载打破传统假设

AI基础设施长期以来建立在紧密耦合、持续执行的假设之上。然而随着训练和推理任务频繁出现分支、暂停和等待数据或外部调用的情况,这一假设正逐渐失效,集群设计与实际运行方式之间的落差直接体现为算力的闲置。

Moor Insights & Strategy副总裁兼首席分析师Matt Kimball表示,这种不匹配已成为效率损失的主要来源。"这些工作负载并不是整洁、连续的任务,它们会暂停、分支、等待数据或外部调用,但基础设施的供给方式往往仍默认一切都是紧密耦合的,利用率就是在这个落差中开始崩解的。"

Astera通过改变数据在交换网络中的流动方式来弥补这一缺口。其内存语义方案允许加速器通过读写操作直接访问共享资源,从而削减传统软件栈中层层叠加的开销。

Futurum研究总监Brendan Burke表示,减少集群内部的数据移动在规模化场景下能带来超出预期的影响。"将集体IO削减49%,意味着GPU能将更多时间用于它本应执行的计算任务。在超大规模场景下,这一效率提升将直接转化为更优的每瓦Token产出和更快的模型迭代周期。"

Astera Labs计算互联产品组副总裁Ahmad Danesh表示,当集群内部通信路径出现分化时,影响最为显著。"当部分GPU只需经过一跳,而其他GPU需要经过三跳时,完成时间由最长路径决定,较快的路径因此处于未充分利用状态,而其他路径则在等待数据。"

这一方案并不涉及调度或碎片化问题的解决,但它消除了规模化场景下最难优化的环节之一:组件间的数据传输摩擦。

Kimball说:"它并不能解决所有问题,但确实针对了最难攻克的难题之一。随着AI基础设施持续扩展,这种架构层面的转变将愈发重要。"

算力下沉至交换网络

Astera还通过其Hypercast引擎将集体通信操作卸载至交换网络,推动网内计算落地。

这一理念并不新鲜,瓶颈在于规模。Kimball表示:"将集体操作卸载到网络中的想法早已存在,真正改变的是规模。随着集群规模扩大,同步开销已成为实实在在的性能瓶颈。"

Burke指出,集体通信操作仍是AI系统中隐性开销的主要来源。"GPU在等待all-reduce或all-gather期间消耗的每一个周期,都是没有产生Token的周期。在大规模场景下,这些开销会累积成显著的性能税。"

Astera宣称在集体通信操作上可实现最高2倍的性能提升。若这一数据成立,收益将在高度同步的训练环境中最为明显,因为这类场景要求大规模GPU组保持步调一致。

Danesh表示,在新型模型架构中收益会更加突出。"不同GPU在不同时间交换数据,而这些分组关系还会动态变化,这正是非阻塞式内存语义通信以及动态重定义分组能力发挥价值的地方。"

目前尚不明确这些增益在受控环境之外——尤其是工作负载更难预测的多租户部署场景中——能否同样显现。

Astera未提供系统级利用率或延迟数据,原因是客户对生产部署信息较为敏感。

纵向扩展成为首要约束

工作负载行为的转变也正在重塑系统构建方式。纵向扩展(scale-up)与横向扩展(scale-out)已不再是相互独立的设计选择,运营商正将二者结合使用,以精细控制数据的流向与流动频率。

Kimball表示:"两者是互补的。模型规模越来越大,工作负载的相互依赖性越来越强,通过传统横向扩展方式移动数据的代价也越来越明显。"

Burke表示,纵向扩展交换市场的快速扩张,折射出优先级转变的速度。"当一家厂商将纵向扩展交换市场规模从50亿美元上调至200亿美元,且这一切发生在不到两年的时间里,说明机架级网络议题的演进速度有多快。交换网络现在已是基础设施层面的一等决策要素。"

这正推动更多通信在向外扩展之前先在机架或计算单元内部完成。高基数交换网络在其中扮演核心角色,通过增加直连端点数量、减少中间层级来提升效率。

Astera的320通道设计直接应对这一约束,简化拓扑结构,降低集群内部的跳数。

Kimball表示:"瓶颈正在向软件栈上层迁移。这不再只是原始算力的问题,而是关乎如何高效地连接、协调,并持续为算力供给所需数据。"

交换网络之争格局扩大

Astera正进入软件栈中一个竞争激烈的层级。

英伟达凭借NVLink和NVSwitch主导着紧密集成的纵向扩展方案,将互联技术与GPU深度捆绑。与此同时,一个围绕UALink标准的开放生态正在形成,AMD、博通、Marvell和Astera均参与其中。

Burke表示,Astera的市场定位契合了AI基础设施领域对灵活性的日益增长的需求。"开放生态系统的定位意味着一种替代NVLink锁定的路径。随着加速器种类日趋多样,超大规模云服务商和AI实验室正寻求对系统连接方式拥有更多主导权。"

Danesh表示,随着架构多样化,公司预计多种技术路线将长期并存。"不同加速器有不同需求,NVLink在特定生态系统内至关重要,而UALink和基于PCIe的方案则在扩大互操作性方面持续发力。"

Astera押注于开放式内存语义交换网络将随着运营商混合部署加速器、寻求在不依赖单一厂商的情况下提升利用率而获得更广泛的市场认可。

趋势已然明朗:随着AI系统规模持续扩大,制约因素正从峰值算力转向如何在碎片化工作负载中保持算力的同步性与有效利用率。

Q&A

Q1:Astera Labs的Scorpio X系列交换芯片主要解决什么问题?

A:Scorpio X系列320通道智能交换芯片主要针对AI集群中算力闲置的问题。由于AI训练和推理任务频繁出现分支、暂停和等待,传统基础设施的紧密耦合假设已不再适用。该芯片通过内存语义架构,允许加速器直接通过读写操作访问共享资源,减少软件层开销,从而降低延迟并提升加速器利用率。

Q2:Astera Labs的Hypercast引擎有什么作用?

A:Hypercast引擎的核心功能是将集体通信操作(如all-reduce、all-gather)从GPU卸载到交换网络中执行,即网内计算。GPU在等待这些集体操作时无法产出有效计算,这些等待周期在大规模集群中会累积成显著的性能损耗。Astera宣称Hypercast可在集体通信操作上实现最高2倍的性能提升,在需要大规模GPU高度同步的训练场景中效果尤为明显。

Q3:Astera Labs的开放式交换网络方案与英伟达NVLink相比有何差异?

A:英伟达NVLink和NVSwitch是与自家GPU深度绑定的闭环方案,在特定生态内具有高度集成的优势,但也带来厂商锁定的问题。Astera Labs则选择加入以UALink为核心的开放生态,联合AMD、博通、Marvell等厂商,主打跨加速器的互操作性。随着超大规模云服务商和AI实验室越来越希望混合使用不同品牌的加速器,开放式方案的吸引力正在上升。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
商业航天稀缺高毛利:张素芬重仓1家,社保加仓3家,最长横盘2年

商业航天稀缺高毛利:张素芬重仓1家,社保加仓3家,最长横盘2年

长风价值掘金
2026-05-08 17:34:01
关键2+1被吹掉!41岁勒布朗多次冲框仅4罚:鏖战38分钟轰23+6累惨

关键2+1被吹掉!41岁勒布朗多次冲框仅4罚:鏖战38分钟轰23+6累惨

颜小白的篮球梦
2026-05-08 12:20:00
被骂“酸黄瓜”三个月后,闫学晶回东北老家,这次她真的大变样

被骂“酸黄瓜”三个月后,闫学晶回东北老家,这次她真的大变样

网络易不易
2026-05-08 12:55:15
光纤+存储芯片+商业航天+算力租赁,深度布局的10家潜力公司

光纤+存储芯片+商业航天+算力租赁,深度布局的10家潜力公司

粤语音乐喷泉
2026-05-08 18:52:45
虽然赢不了中国队,却赢得了全世界球迷的心!

虽然赢不了中国队,却赢得了全世界球迷的心!

杨晨大神
2026-04-20 12:06:28
爆冷输球!CBA强队折戟客场仅得94分,晋级形势急转直下,仅两人得分上双

爆冷输球!CBA强队折戟客场仅得94分,晋级形势急转直下,仅两人得分上双

kio鱼
2026-05-09 01:17:47
男子冒充大老板,订购5辆奔驰,总价450万。美女销售为促成大单,为其垫付6000余元食宿,谁知,3天后,男子突然消失,女销售才发现被骗

男子冒充大老板,订购5辆奔驰,总价450万。美女销售为促成大单,为其垫付6000余元食宿,谁知,3天后,男子突然消失,女销售才发现被骗

大爱三湘
2026-05-08 11:09:27
余华:若想一日不得安宁,你就请客;若想一年不得安宁,你就盖屋;若想一辈子不得安宁,那就结婚生子。

余华:若想一日不得安宁,你就请客;若想一年不得安宁,你就盖屋;若想一辈子不得安宁,那就结婚生子。

大爱三湘
2026-05-08 19:55:07
年内暴涨540%!比存储芯片更猛的大牛股爆了

年内暴涨540%!比存储芯片更猛的大牛股爆了

财经锐眼
2026-05-08 19:16:41
月薪几万却招不到人?远洋海员背后的残酷,配偶:男女关系太乱了

月薪几万却招不到人?远洋海员背后的残酷,配偶:男女关系太乱了

李将平老师
2026-05-08 09:42:27
三花智控、领益智造、卧龙电驱、拓普集团,人形机器人含金量谁高

三花智控、领益智造、卧龙电驱、拓普集团,人形机器人含金量谁高

长风价值掘金
2026-05-08 15:10:46
蒋万安被问懵:不认中国人身份,凭何迁两蒋灵柩回大陆?

蒋万安被问懵:不认中国人身份,凭何迁两蒋灵柩回大陆?

娱乐的宅急便
2026-05-08 13:39:15
22点 vs 23 点入睡,1 小时的差距到底有多大?

22点 vs 23 点入睡,1 小时的差距到底有多大?

猫大夫医学科普
2026-05-08 06:52:35
绝密的钛金属拼图:为何人类再也造不出第二架SR-71“黑鸟”?

绝密的钛金属拼图:为何人类再也造不出第二架SR-71“黑鸟”?

航空之家Aviation
2026-05-06 19:31:24
1938年,王耀武发现日军身材矮小,想出一条妙计,一夜全歼日军

1938年,王耀武发现日军身材矮小,想出一条妙计,一夜全歼日军

饭小妹说历史
2026-05-06 09:28:08
中国光伏的堡垒,被印度从内部攻破

中国光伏的堡垒,被印度从内部攻破

观察者网
2026-05-08 09:00:37
碰掉充电器就绝食,穷人家养出长公主,到底是公主病还是抑郁症?

碰掉充电器就绝食,穷人家养出长公主,到底是公主病还是抑郁症?

今朝牛马
2026-05-08 16:14:02
最高院:提供 “口交” “肛交”等进入式性服务,是否属卖淫行为?

最高院:提供 “口交” “肛交”等进入式性服务,是否属卖淫行为?

周军律师聊案子
2026-04-21 09:50:16
勇士大交易预案曝光!送走波神,砸1.12亿锁定未来全明星

勇士大交易预案曝光!送走波神,砸1.12亿锁定未来全明星

夜白侃球
2026-05-08 10:27:09
衡水中学的清北人数彻底崩了!巅峰期275人,跌至2025年的45人…

衡水中学的清北人数彻底崩了!巅峰期275人,跌至2025年的45人…

火山詩话
2026-05-08 17:44:41
2026-05-09 03:51:00
至顶头条 incentive-icons
至顶头条
记录和推动数字化创新
18279文章数 49703关注度
往期回顾 全部

科技要闻

SK海力士平均奖金600万 工服成相亲神器

头条要闻

美公布首批UFO文件 视频公开:阿联酋现水母状物体

头条要闻

美公布首批UFO文件 视频公开:阿联酋现水母状物体

体育要闻

他把首胜让给队友,然后用一年时间还清账单

娱乐要闻

古天乐被曝隐婚生子,新娘竟是她

财经要闻

估值3000亿 DeepSeek寻求500亿元融资

汽车要闻

MG 4X实车亮相 将于5月11日开启盲订

态度原创

房产
教育
时尚
数码
公开课

房产要闻

豪掷6.8亿拿地!何猷君大手笔投资三亚!

教育要闻

摒弃打压式教育,皮格马利翁效应

衣服其实没有必要买很贵,准备这三件基础款,百搭实用又不挑人

数码要闻

华硕京东重磅新品日,华硕天选7系列游戏本开启预约

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版