国产超节点风云再起。近日,业内多家媒体爆料,中科曙光将于乌镇世界互联网大会发布超节点新品,以千卡级算力集成度刷新国产超节点纪录。结合其此前公布的AI计算开放架构,该产品或已成功打通算力全栈生态壁垒,引领国产计算路线展开系统化突围。
![]()
倒吃甘蔗甜?开放式路线跑通千卡超节点
近年来, 人工智能计算需求呈指数级增长,在AI大模型等创新需求驱动下,算力体系的工程化提升成为必选题。其中,集成规模更大、兼容性更好、协同效应更强的开放式计算路线,受到浪潮、中兴、新华三等超节点主流玩家认可。
值得注意的是,尽管开放式超节点被视为算力产业系统化进阶的最优解,但在产业链跨层协作上仍存在诸多堵点,比如上下游非标技术环节多、接口规范不统一、算力流通成本高等。产业各方亟需由难而易打造标准化、商品化的软硬件技术,以代替定制化、专有化的系统。
曙光此次突然曝出千卡超节点新品,并且据说完全基于 AI计算开放架构设计,可以对接主流AI生态以及多品牌国产加速卡,这很可能代表着开放式路线已经啃下最硬的那块骨头。
有业内人士指出,曙光在不久前的重庆智博会上就接连打出三张牌:统一异构编程工具包UPTK、人工智能基础软件栈OpenDAS、人工智能应用管理平台DAP全面开放。这一套组合拳为开放式超节点进阶奠定了关键基础。
其中,UPTK具备丰富的统一异构编程工具,主流国产加速卡可以实现对运行时接口的标准化封装,极大降低各家厂商接入“类CUDA”软件生态的成本,并支持CUDA程序快速移植到不同后端上运行,大幅提高异构集群使用效率。
OpenDAS则提供了从算子层、框架组件层、模型层等全栈深度优化能力,从而通过算法-系统协同释放底层硬件的极限性能,构建开放、灵活且易用的开发体系,加速AI技术落地与产业生态共建。
DAP主要在应用层面实现了主流国产加速卡的全面适配,开发者无需关心底层算力即可直接使用DAP调用智能问答、知识库管理、智能体应用、模型微调、模型推理等功能,进而深度体验SSO、精细化权限、全面审计等企业级特性。
彼时,这一系列前置动作表面上并未掀起太大波澜,直到“千卡超节点”轰然砸向算力江湖,开放式路线俨然抵临国产超节点最前沿,向外界演绎出“倒吃甘蔗甜”精彩一幕。
封闭=落后?昇腾384或被后来者超车
相较于开放式路线的后发先至,依托封闭式路线遥遥领先的昇腾384超节点,也曾博得空前热度。然而算力市场并未遵循马太效应,有业内人士分析,昇腾在“千卡超节点”关口被后来者超车,很大程度或在于两者之间的创新活性差异。
根据业内报道,昇腾384超节点主要采用“以网联算”的技术路径,基于高速互联总线突破算力协同瓶颈,实现“一卡一专家”并行推理,追求的是“小而精”的极致互联性能。
与曙光超节点不同的是,384超节点在加速卡选择上,仅支持华为昇腾910系列芯片,并且上下游生态角色只能基于CANN进行开发,无法直接与主流CUDA生态实现适配。
毋庸置疑,这种模式有助于催熟CANN生态,并带动昇腾芯片销量稳步增长。但对于用户及伙伴来说,生态壁垒导致产品易用性有限,并且产业链高度集权压制了上下游创新活力。
其中,最关键的底层逻辑是“受益者积极”效应。浪潮某高管认为,开放会带来更多的技术创新与良性的市场竞争,最终会促进整个生态的繁荣。最大的受益者是用户。并且,这也会带动产业链各个环节增强投入信心,摆脱内卷困局,携手在国际市场赢得更多话语权。
相对来看,封闭式路线更依赖于链主力量驱动。上述人士指出,华为以昇腾计算底座向开发者提供“黑土地”,本质上属于“集万千伟力于一身”,但受限于架构封闭、产品成熟度不足,上下游目前很难形成投入-回报的正循环,叠加国产算力选择越发开放和丰富,进一步放大了“独木难支”的生态劣势,进而造成“越封闭越落后、越开放越进步”的反差现象。
当然,从AI计算开放架构的生态整合,再到千卡超节点的系统性跃迁,曙光虽然为上述逻辑提供了佐证,但开放式路线涉及的系统环节庞大繁杂,需要在生态层面进行持续性投入。
也许对于国产超节点玩家来说,无论是当前的千卡里程碑,抑或下一步万卡集群落地目标,能否顶着成本压力将“协同共赢”口号落到实处,才是阶段性领先或持续领先的决定因素。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.