Scale-across这个概念,是英伟达首次正式提出的,它的核心思想是通过跨区域互联的方式,将分布式的数据中心整合成一个巨型的 AI 超级工厂。这种跨区域扩展不仅仅是算力的简单叠加,而是将不同地理位置的资源连接起来,形成一个紧密的协作网络,从而实现资源的全面调度和大规模的协同计算。
主要组成:
相干光模块(Coherent Optics):在跨区域互联中,相干光模块作为基础设施的核心部件,通过光信号传输提供高带宽和低延迟的连接。它可以高效地传输大规模数据,降低传统光纤传输中的损耗和延迟。
空芯光纤(Hollow Core Fiber):传统的光纤通信存在信号衰减问题,空芯光纤则能够显著降低这些衰减,提高传输效率和延迟表现,尤其适用于长距离、高速光信号传输。
OCS交换机(Optical Circuit Switches):作为光通信网络中的核心交换设备,OCS交换机能够在不同的计算资源节点之间动态调整带宽分配和数据路由,提升数据中心间的通信效率和灵活性。
光芯片与信号处理算法:相干光模块中的光芯片需要处理多维度的光信号(如幅度、相位和偏振)。这些芯片的设计和制造工艺是相干光模块的技术壁垒,国内只有如华工科技等少数公司能够生产这种复杂的光芯片。
算力扩展与调度问题:在传统数据中心内,算力主要依赖于单点的强大处理能力;而在跨区域扩展的情况下,需要解决如何在不同地域的数据中心之间高效协调、调度算力的问题。这就要求在硬件、网络协议、资源调度等层面进行优化,确保跨数据中心的资源调配能无缝衔接,避免瓶颈。
超高速、超低延迟的跨数据中心互联:未来的AI算力不仅仅依赖于单个数据中心的算力,而是依赖于多个数据中心之间的快速数据传输与协调。传统的宽带光纤和网络技术很难满足这种需求,必须采用更为先进的相干光模块和光通信交换技术来提升通信质量。
AI变革的基础设施:英伟达的黄总提到,巨型AI工厂将成为AI变革的核心基础设施。Scale-across 模式的推出意味着,未来 AI 算力不仅依赖单个超级计算机或数据中心,而是形成一个跨地域、跨行业的超大规模算力网络,推动 AI 技术的持续突破。
总结来说,Scale-across是解决当前 AI 算力需求增长、跨区域协作等问题的关键技术路线。它通过相干光模块、空芯光纤和 OCS 光交换机等新一代光通信技术,推动 AI 算力向更大规模、更高效、更低延迟的方向发展。
欢迎加入行业交流群,备注岗位+公司,请联系老虎说芯
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.