网易首页 > 网易号 > 正文 申请入驻

曦望启望S3推理成本较上一代降约90%,押注极致性价比

0
分享至



2025年芯片交付量已突破万片。

在大模型产业从“训练驱动”走向“推理驱动”的关键拐点上,国产GPU厂商正重新审视算力的商业价值与交付方式。

据IPO早知道消息,1 月 27 日,曦望(Sunrise)于首届Sunrise GPU Summit中,正式发布新一代推理GPU芯片启望S3,并披露其围绕推理场景构建的算力产品体系及共建推理云生态计划。这也是曦望在近一年累计完成约30亿元战略融资后首次集中公开亮相。

曦望董事长徐冰表示,随着大模型进入规模化应用阶段,AI产业正从“训练驱动”转向“推理驱动”。相比一次性投入巨大的训练,推理更强调长期交付能力、单位成本和系统稳定性。

“谁能持续降低推理成本,谁就掌握了AI产业的成本曲线。”他指出,曦望并不希望只做一家卖芯片的公司,而是围绕推理场景,构建“芯片+系统+生态”的整体布局,让推理算力真正成为可规模化、可持续的基础设施。

2025年,专注于推理GPU的曦望芯片交付量已突破万片。徐冰表示,希望通过推理算力体系的系统性创新,助力AI应用实现规模化落地与可持续增长。

S3继续强化推理,主流场景成本较上一代降低约90%

与强调峰值算力和通用能力的训推一体GPU路线不同,曦望在启S3芯片上继续强化其“All-in 推理”的定位。

曦望联席CEO王勇在发布会上表示,AI行业正在进入以应用落地为核心的下半场,推理逐步超越训练,成为主要算力消耗场景。相比训练阶段的一次性高投入,推理更强调长期交付能力、单位成本和系统稳定性,这也正在改变GPU的竞争逻辑。

据介绍,启望S3是一款面向大模型推理深度定制的GPGPU芯片,围绕真实推理负载,对芯片架构、存储体系与互联方式进行了系统级设计。相比上一代产品,S3在典型推理场景下的整体性价比提升超过10倍。

在算力与存储设计上,S3支持从FP16到FP4的精度自由切换,在保证模型效果的前提下显著提升低精度推理效率;同时率先在国内GPGPU产品中采用LPDDR6显存方案,显存容量较上一代提升4倍,缓解了大模型推理中常见的显存瓶颈问题。

在DeepSeek V3/R1满血版等主流大模型推理场景中,S3的单位Token推理成本较上一代降低约90%。王勇表示,这使“百万 Token 一分钱”从概念走向可规模化部署的工程能力。

王勇表示,曦望的推理GPU并非单点硬件创新,而是通过芯片架构、软件体系与算力交付方式的一体化设计,将硬件能力稳定转化为可交付、可计价的推理算力。目前,曦望已构建与CUDA兼容的基础软件体系,支持推理应用低成本迁移与持续优化,相关能力已覆盖 ModelScope平台90%以上主流大模型形态。

围绕启望S3,曦望同步发布了面向大模型推理的寰望SC3-256超节点方案,可高效支撑PD分离架构与大规模专家并行(EP)部署,适配千亿、万亿级参数的多模态MoE推理场景。

在交付形态上,寰望SC3采用全液冷设计,核心能效指标PUE表现极致。曦望方面表示,在同等算力规模下,该方案的整体交付成本控制在千万元级别,相较行业内同类亿元级方案降低一个数量级。

同时,曦望还推出覆盖PCIe、OAM模组、一体机及AI计算集群在内的S3产品矩阵,覆盖从单机推理到大规模集群部署的多样化需求。

重构推理算力交付模式,生态协同成关键变量

相较于S3回答的“推理算力如何更便宜”,此次曦望共建的推理云计划,则进一步指向“算力如何更好用”。

随着推理逐渐成为大模型算力消耗的主要来源,推理算力在实际落地中普遍存在资源碎片化、运维复杂、成本不可预测等挑战。

在当前推理更强调持续交付能力与长期单位成本的背景下,曦望将生态共建推理云视为其推理算力体系中的关键一环。依托自研推理GPU,曦望已实现从底层芯片到上层平台的全栈优化,将硬件能力以平台化方式稳定释放,从而降低模型适配和系统部署复杂度,形成面向应用落地的完整算力交付路径。

曦望联席CEO王湛表示,新一代AI算力平台,应具备软硬件深度协同、资源利用高度弹性、技术门槛低且运行稳定可靠等特征。基于这一判断,曦望通过云化方式对算力交付模式进行重构,使推理算力从“设备能力”转化为可标准化、可规模化的服务能力。

据介绍,共建推理云以启望S3为底座,通过GPU池化与弹性调度,将分散的算力资源整合为统一的推理算力池,并以MaaS(Model as a Service)作为核心入口,向企业提供开箱即用的大模型推理服务。企业无需关注底层硬件配置和集群运维,即可按需调用模型能力,并根据业务负载灵活扩展算力规模。

在稳定性与运维层面,共建推理云在千卡级集群场景下可用性达到99.95%,横向扩展效率超过95%。

为此,曦望联合商汤科技、第四范式等生态伙伴,共同发起“百万 Token 一分钱”推理成本计划。曦望表示,该计划并非单一产品能力的展示,而是多方围绕推理算力成本形成的协同共识,标志着大模型推理正在从“技术可行”走向“经济可行”,为 AI 应用规模化落地提供清晰的成本锚点。

此外,随着推理算力竞争从单点技术走向系统工程能力比拼,产业协同的重要性日益凸显。

现场,曦望与浙江大学签署战略合作协议,联合成立“智能计算联合研发中心”,围绕光互连GPU超节点架构、半导体虚拟制造(计算光刻)以及AI高精度气象预测等前沿方向展开协同研究。

此外,曦望还与中交信科集团、杭钢数字科技、浙江算力科技、三一集团、协鑫科技等企业达成战略合作,推动推理算力在交通、制造、医疗等行业的落地应用。

本文为IPO早知道原创

作者|苏打

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
快船记者曝光尼德豪泽DNP原因:有潜力但需成长磨练

快船记者曝光尼德豪泽DNP原因:有潜力但需成长磨练

老壥说体育
2026-01-30 01:21:34
零容忍!申花海港国安等13队遭罚分 73人终身禁足

零容忍!申花海港国安等13队遭罚分 73人终身禁足

体坛周报
2026-01-29 12:22:31
蔡正元:中国应该给特朗普颁个奖,外交几十年不如特朗普闹一年

蔡正元:中国应该给特朗普颁个奖,外交几十年不如特朗普闹一年

议纪史
2026-01-28 18:15:03
杀妻案第三者照片被扒,挑衅原配,妻子险些获自由

杀妻案第三者照片被扒,挑衅原配,妻子险些获自由

王楔晓
2025-12-12 15:15:49
乌外长:泽连斯基愿与普京会面!俄方回应:可以邀请他来莫斯科,并保障其安全

乌外长:泽连斯基愿与普京会面!俄方回应:可以邀请他来莫斯科,并保障其安全

每日经济新闻
2026-01-28 22:11:06
巴特勒+4首轮 vs 唐斯+4互换!四队报价雄鹿字母哥,勇士断层领先

巴特勒+4首轮 vs 唐斯+4互换!四队报价雄鹿字母哥,勇士断层领先

奕辰说球
2026-01-29 12:01:39
“性萧条”才是这个时代真正的危机

“性萧条”才是这个时代真正的危机

深蓝夜读
2025-09-24 16:00:09
央视春晚二次联排!19位大腕亮相,最后一位女星稳居观众最爱

央视春晚二次联排!19位大腕亮相,最后一位女星稳居观众最爱

老特有话说
2026-01-27 23:27:26
冯绍峰没想到,离婚4年,赵丽颖会因黄晓明的一句话实现口碑暴增

冯绍峰没想到,离婚4年,赵丽颖会因黄晓明的一句话实现口碑暴增

娱小余
2026-01-28 23:14:08
C 罗前女友伊莉娜40 岁了?纽约街头一身黑皮衣,这身材谁敢信?

C 罗前女友伊莉娜40 岁了?纽约街头一身黑皮衣,这身材谁敢信?

述家娱记
2026-01-14 11:28:25
2-0夺15连胜!中国网球15岁天才少女进8强:边哭边扫追赶郑钦文?

2-0夺15连胜!中国网球15岁天才少女进8强:边哭边扫追赶郑钦文?

李喜林篮球绝杀
2026-01-29 12:35:41
绵阳女首富被带走,媒体翻出老底,20年前曾低价买走国有资产

绵阳女首富被带走,媒体翻出老底,20年前曾低价买走国有资产

壹只灰鸽子
2026-01-28 14:04:21
新增或重新设计2700个零部件 新款奔驰S实车曝光

新增或重新设计2700个零部件 新款奔驰S实车曝光

答答买车
2026-01-29 15:23:34
江西令人惋惜的监狱旧址,规模不大功能齐全,废弃多年杂草丛生

江西令人惋惜的监狱旧址,规模不大功能齐全,废弃多年杂草丛生

旅游探秘行者
2026-01-27 22:54:03
回顾:那个因拍“假老虎”,被判刑2年的陕西农民,后来怎样了?

回顾:那个因拍“假老虎”,被判刑2年的陕西农民,后来怎样了?

可乐88
2024-04-18 08:31:32
又一个大V被封!任何政治狂热,都是国家和人民的灾难!

又一个大V被封!任何政治狂热,都是国家和人民的灾难!

深度报
2025-12-10 22:37:02
上海炒股大赛冠军的箴言:如果手里只有10万,不妨死磕"七大口诀"

上海炒股大赛冠军的箴言:如果手里只有10万,不妨死磕"七大口诀"

一方聊市
2026-01-19 13:13:48
古巴人饿了,就有人给粮食,我不理解,没有战争,没有内乱

古巴人饿了,就有人给粮食,我不理解,没有战争,没有内乱

忠于法纪
2026-01-26 18:44:10
迪亚洛16分山西负浙江遭遇四连败,山西新援盖伊验货合格

迪亚洛16分山西负浙江遭遇四连败,山西新援盖伊验货合格

李广专业体育评论
2026-01-29 21:47:22
命运弄人!中超劲旅:赶走功臣,痛失最佳夺冠良机?

命运弄人!中超劲旅:赶走功臣,痛失最佳夺冠良机?

话体坛
2026-01-29 15:42:41
2026-01-30 02:48:49
IPO早知道 incentive-icons
IPO早知道
IPO情报专家。
6545文章数 2407关注度
往期回顾 全部

科技要闻

周亚辉的AI新赌局:国内太卷 出海另起炉灶

头条要闻

金晨被指肇事逃逸让助理顶包 律师:顶包者或被判刑

头条要闻

金晨被指肇事逃逸让助理顶包 律师:顶包者或被判刑

体育要闻

詹姆斯哭了!骑士视频致敬41岁超巨

娱乐要闻

曝金晨涉嫌交通肇事逃逸 本人尚未回应

财经要闻

崔东树:中国汽车未来年销或达5000万辆

汽车要闻

车长超5米还带后轮转向 比亚迪海豹08/海狮08将亮相

态度原创

本地
时尚
旅游
房产
公开课

本地新闻

云游中国|拨开云雾,巫山每帧都是航拍大片

她穿一身大红参加葬礼,浪漫又感人?真是活久见哪

旅游要闻

外滩光影里的石库门:上海把百年文脉织进了新春夜色!

房产要闻

寰岛学校卖楼,二次流拍!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版