1月27日,国产GPU厂商曦望(Sunrise)举办首届Sunrise GPU Summit,正式发布新一代推理GPU芯片启望S3,并披露了围绕推理场景构建的算力产品体系及共建推理云生态计划。这也是曦望在近一年累计完成约30亿元战略融资后的首次集中公开亮相。
![]()
据介绍,启望S3是一款面向大模型推理深度定制的GPGPU芯片。在架构与存储设计上,该芯片支持从FP16到FP4的精度切换,并采用了LPDDR6显存方案,显存容量较上一代提升4倍,以缓解大模型推理中的显存瓶颈问题。
官方数据显示,在DeepSeek V3/R1满血版等主流大模型推理场景中,S3的单位Token推理成本较上一代降低约90%,旨在推动“百万Token一分钱”的工程化落地。目前,其基础软件体系已覆盖ModelScope平台90%以上的主流大模型。
![]()
在系统级解决方案方面,曦望同步发布了面向大模型推理的寰望SC3-256超节点方案。该方案采用全液冷设计,支持大规模专家并行(EP)部署。曦望方面表示,在同等算力规模下,该方案的整体交付成本控制在千万元级别,相较行业内同类方案有明显下降。
此外,曦望还宣布了推理云共建计划,试图重构算力交付模式。据了解,该计划以启望S3为底座,通过MaaS(模型即服务)模式向企业提供标准化推理服务,降低企业底层运维门槛。目前,曦望已联合商汤科技、第四范式等生态伙伴共同推进相关计划。
发布会现场,曦望与浙江大学签署战略合作协议,成立“智能计算联合研发中心”,并与中交信科集团、杭钢数字科技、浙江算力科技、三一集团、协鑫科技等企业达成战略合作。曦望董事长徐冰透露,2025年曦望芯片交付量已突破万片,未来将继续围绕“芯片+系统+生态”布局,推动推理算力基础设施化。(袁宁)
本文来自网易科技报道,更多资讯和深度内容,关注我们。
