网易首页 > 网易号 > 正文 申请入驻

融资30亿后,曦望发布推理GPU芯片S3 并推进推理云生态共建

0
分享至


在大模型产业从“训练驱动”走向“推理驱动”的关键拐点上,国产 GPU 厂商正重新审视算力的商业价值与交付方式。

1 月 27 日,专注于推理 GPU 的曦望(Sunrise)在杭州举办首届 Sunrise GPU Summit,发布新一代推理 GPU 芯片启望S3,并披露其围绕推理场景构建的算力产品体系及共建推理云生态计划。

这也是曦望在近一年累计完成约 30 亿元战略融资后的首次集中公开亮相。

在国产GPU 行业逐步从“拼性能参数”转向“拼单位经济性”的背景下,曦望选择将战略重心明确锚定在推理算力这一更具长期确定性的赛道。

从“拼参数”到“算清账”,S3 聚焦推理效率与成本

与强调峰值算力和通用能力的训推一体GPU 路线不同,曦望在启望S3 芯片上继续强化其“All-in 推理”的定位。

曦望联席CEO王勇在发布会上表示,AI 行业正在进入以应用落地为核心的下半场,推理逐步超越训练,成为主要算力消耗场景。相比训练阶段的一次性高投入,推理更强调长期交付能力、单位成本和系统稳定性,这也正在改变 GPU 的竞争逻辑。

据介绍,启望S3 是一款面向大模型推理深度定制的 GPGPU 芯片,围绕真实推理负载,对芯片架构、存储体系与互联方式进行了系统级设计。相比上一代产品,S3 在典型推理场景下的整体性价比提升超过 10 倍。

在算力与存储设计上,S3 支持从 FP16 到 FP4 的精度自由切换,在保证模型效果的前提下显著提升低精度推理效率;同时率先在国内 GPGPU 产品中采用 LPDDR6 显存方案,显存容量较上一代提升 4 倍,缓解了大模型推理中常见的显存瓶颈问题。

在DeepSeek V3/R1满血版等主流大模型推理场景中,S3 的单位 Token 推理成本较上一代降低约 90%。王勇表示,这使“百万 Token 一分钱”从概念走向可规模化部署的工程能力。

王勇表示,曦望的推理GPU 并非单点硬件创新,而是通过芯片架构、软件体系与算力交付方式的一体化设计,将硬件能力稳定转化为可交付、可计价的推理算力。目前,曦望已构建与CUDA兼容的基础软件体系,支持推理应用低成本迁移与持续优化,相关能力已覆盖 ModelScope 平台 90% 以上主流大模型形态。

围绕启望S3,曦望同步发布了面向大模型推理的寰望 SC3-256 超节点方案,可高效支撑 PD 分离架构与大规模专家并行(EP)部署,适配千亿、万亿级参数的多模态 MoE 推理场景。

在交付形态上,寰望SC3 采用全液冷设计,核心能效指标PUE表现极致。曦望方面表示,在同等算力规模下,该方案的整体交付成本控制在千万元级别,相较行业内同类亿元级方案降低一个数量级。

同时,曦望还推出覆盖PCIe、OAM 模组、一体机及 AI 计算集群在内的 S3 产品矩阵,覆盖从单机推理到大规模集群部署的多样化需求。

不只卖芯片,重构算力交付的推理“云模式”

如果说S3 回答的是“推理算力如何更便宜”,那么曦望共建的推理云计划,则进一步指向“算力如何更好用”。

随着推理逐渐成为大模型算力消耗的主要来源,推理算力在实际落地中普遍存在资源碎片化、运维复杂、成本不可预测等挑战。相比训练阶段的一次性投入,推理更强调持续交付能力与长期单位成本,这也对算力交付方式提出了新的要求。


在此背景下,曦望通过生态共建推理云视为其推理算力体系中的关键一环。依托自研推理GPU,曦望实现从底层芯片到上层平台的全栈优化,将硬件能力以平台化方式稳定释放,从而降低模型适配和系统部署复杂度,形成面向应用落地的完整算力交付路径。

曦望联席CEO王湛表示,新一代的AI算力平台,应具备软硬件深度协同、资源利用高度弹性、技术门槛低且运行稳定可靠等特征。基于这一判断,曦望通过云化方式对算力交付模式进行重构,使推理算力从“设备能力”转化为可标准化、可规模化的服务能力。

据介绍,共建推理云以启望S3 为底座,通过 GPU 池化与弹性调度,将分散的算力资源整合为统一的推理算力池,并以 MaaS(Model as a Service)作为核心入口,向企业提供开箱即用的大模型推理服务。企业无需关注底层硬件配置和集群运维,即可按需调用模型能力,并根据业务负载灵活扩展算力规模。

在稳定性与运维层面,共建推理云在千卡级集群场景下可用性达到99.95%,横向扩展效率超过95%。

在这一目标之下,曦望联合商汤科技、第四范式等生态伙伴,共同发起“百万 Token 一分钱”推理成本计划。曦望方面表示,该计划并非单一产品能力的展示,而是多方围绕推理算力成本形成的协同共识,标志着大模型推理正在从“技术可行”走向“经济可行”,为 AI 应用规模化落地提供清晰的成本锚点。

推理算力走向“系统工程”,生态协同成关键变量

随着推理算力竞争从单点技术走向系统工程能力比拼,产业协同的重要性日益凸显。

中国工程院院士、浙江大学信息学部主任吴汉明在发布会上表示,推理时代的算力竞争,已演进为涵盖芯片、系统架构、软件平台和应用场景的综合能力竞争,需要构建从芯片到系统、从技术到应用的完整创新链条。

发布会现场,曦望与浙江大学签署战略合作协议,联合成立“智能计算联合研发中心”,围绕光互连 GPU 超节点架构、半导体虚拟制造(计算光刻)以及 AI 高精度气象预测等前沿方向展开协同研究。

此外,曦望还与中交信科集团、杭钢数字科技、浙江算力科技、三一集团、协鑫科技等企业达成战略合作,推动推理算力在交通、制造、医疗等行业的落地应用。

曦望董事长徐冰表示,随着大模型进入规模化应用阶段,AI 产业正从“训练驱动”转向“推理驱动”。相比一次性投入巨大的训练,推理更强调长期交付能力、单位成本和系统稳定性。

他指出,曦望并不希望只做一家卖芯片的公司,而是围绕推理场景,构建“芯片+系统+生态”的整体布局,让推理算力真正成为可规模化、可持续的基础设施。2025年,曦望芯片交付量已突破万片。

“谁能持续降低推理成本,谁就掌握了 AI 产业的成本曲线。”徐冰表示,曦望希望通过推理算力体系的系统性创新,助力 AI 应用实现规模化落地与可持续增长。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
一根700亿公里长的铁棍被发现,重如地球的1/10,咋形成的?

一根700亿公里长的铁棍被发现,重如地球的1/10,咋形成的?

心中的麦田
2026-02-04 21:31:30
现役的13个集团军,皆是解放战争时期的哪支王牌军沿革而来?

现役的13个集团军,皆是解放战争时期的哪支王牌军沿革而来?

文史明鉴
2026-02-07 16:01:04
你有勇气说出内心的秘密吗?网友:我和前女友有一个12岁的女儿

你有勇气说出内心的秘密吗?网友:我和前女友有一个12岁的女儿

夜深爱杂谈
2026-01-16 18:30:54
2月8号泰国总理大选!佩通坦能否卷土重来

2月8号泰国总理大选!佩通坦能否卷土重来

王朝风云
2026-02-07 09:25:13
男子参加公司年会抽中苹果17ProMax,回家给老婆惊喜,打开发现是瓷砖:手机可以不要,策划人必须向我道歉

男子参加公司年会抽中苹果17ProMax,回家给老婆惊喜,打开发现是瓷砖:手机可以不要,策划人必须向我道歉

极目新闻
2026-02-07 10:04:57
真当中国不敢动手?中方向全世界宣布一件大事:退出1900亿大项目

真当中国不敢动手?中方向全世界宣布一件大事:退出1900亿大项目

科普100克克
2025-12-30 00:14:37
海口小区惨案:男子入室盗窃被撞破,致母女3死1伤后自杀

海口小区惨案:男子入室盗窃被撞破,致母女3死1伤后自杀

冷月侃娱乐
2026-02-07 21:48:34
意外!上港新外援仅仅用一场热身赛就征服球迷,发挥不比茹萨差

意外!上港新外援仅仅用一场热身赛就征服球迷,发挥不比茹萨差

张丽说足球
2026-02-07 08:33:58
白应苍被判死刑哭着忏悔,缅北女魔头白应兰,落网倒计时

白应苍被判死刑哭着忏悔,缅北女魔头白应兰,落网倒计时

一盅情怀
2026-02-07 15:48:22
陈幸同1-4输日本,王曼昱战张本美和,孙颖莎战蒯曼

陈幸同1-4输日本,王曼昱战张本美和,孙颖莎战蒯曼

乒乓乐园
2026-02-08 00:04:41
徐露标签真伪:245万彩礼、嫌丈夫丑、不生育、断崖衰老

徐露标签真伪:245万彩礼、嫌丈夫丑、不生育、断崖衰老

暖心萌阿菇凉
2026-02-08 01:16:40
提醒大家:洗衣机里,不管有几件衣服,千万要记得放几个塑料袋!

提醒大家:洗衣机里,不管有几件衣服,千万要记得放几个塑料袋!

美食格物
2026-02-04 22:51:09
西大街夜店名重现:苏荷崛起改写舞厅格局,老西安青春与新欢碰撞

西大街夜店名重现:苏荷崛起改写舞厅格局,老西安青春与新欢碰撞

成都人的故事
2026-02-06 17:45:04
我喜欢的人为什么不喜欢我呢

我喜欢的人为什么不喜欢我呢

疾跑的小蜗牛
2026-02-07 19:37:05
武汉新娘给黑人DJ留言事件,把我人都看麻了

武汉新娘给黑人DJ留言事件,把我人都看麻了

听风听你
2026-02-03 21:37:44
林诗栋3-4遭大逆转,引发连锁3大反应:王楚钦复出及时,国乒难了

林诗栋3-4遭大逆转,引发连锁3大反应:王楚钦复出及时,国乒难了

大秦壁虎白话体育
2026-02-08 00:02:36
苏轼见到友人妻子漂亮,羡慕之余写下一首词,感动世人近千年

苏轼见到友人妻子漂亮,羡慕之余写下一首词,感动世人近千年

掠影后有感
2026-02-06 12:01:30
35岁科斯蒂亚2-0送蛋击败拉杜卡努,夺得WTA250罗马尼亚冠军

35岁科斯蒂亚2-0送蛋击败拉杜卡努,夺得WTA250罗马尼亚冠军

懂球帝
2026-02-08 00:01:26
原拆原建!上海这些小区,传出新消息…

原拆原建!上海这些小区,传出新消息…

新浪财经
2026-02-07 19:08:59
有他还要啥外援?山东泰山热身赛3球大胜,德尔加多独造两球

有他还要啥外援?山东泰山热身赛3球大胜,德尔加多独造两球

凡人说体育
2026-02-08 02:52:25
2026-02-08 04:59:00
猎云网
猎云网
聚焦科技创业创新,钻研产业趋势,用心服务创业者。
58448文章数 327110关注度
往期回顾 全部

科技要闻

小米千匹马力新车亮相!问界M6双动力齐报

头条要闻

网购椅子多出15公斤银砖 男子紧急报警

头条要闻

网购椅子多出15公斤银砖 男子紧急报警

体育要闻

主队球迷唯一爱将,说自己不该在NBA打球

娱乐要闻

金晨处罚结果曝光!肇事逃逸被罚款

财经要闻

金价高波动时代来了

汽车要闻

工信部公告落地 全新腾势Z9GT焕新升级

态度原创

手机
健康
家居
时尚
数码

手机要闻

华为苹果领衔 TOP5厂商入场,阔折叠方向对了吗?

转头就晕的耳石症,能开车上班吗?

家居要闻

现代轻奢 温馨治愈系

今日热点:《惊蛰无声》终极预告;韩国翻拍《解忧杂货店》……

数码要闻

冠捷推出26.5英寸AOC G4白色显示器:LGD四代WOLED,2919元

无障碍浏览 进入关怀版