网易首页 > 网易号 > 正文 申请入驻

推理红利时代,曦望押注“极致性价比”GPU与算力新范式

0
分享至

在大模型产业从“训练驱动”走向“推理驱动”的关键拐点上,国产 GPU 厂商正重新审视算力的商业价值与交付方式。

1 月 27 日,专注于推理 GPU 的曦望(Sunrise)在杭州举办首届 Sunrise GPU Summit,发布新一代推理 GPU 芯片启望S3,并披露其围绕推理场景构建的算力产品体系及共建推理云生态计划。这也是曦望在近一年累计完成约 30 亿元战略融资后的首次集中公开亮相。


在国产 GPU 行业逐步从“拼性能参数”转向“拼单位经济性”的背景下,曦望选择将战略重心明确锚定在推理算力这一更具长期确定性的赛道。

从“拼参数”到“算清账”,S3 聚焦推理效率与成本

与强调峰值算力和通用能力的训推一体 GPU 路线不同,曦望在启望S3 芯片上继续强化其“All-in 推理”的定位。

曦望联席 CEO 王勇在发布会上表示,AI 行业正在进入以应用落地为核心的下半场,推理逐步超越训练,成为主要算力消耗场景。相比训练阶段的一次性高投入,推理更强调长期交付能力、单位成本和系统稳定性,这也正在改变 GPU 的竞争逻辑。

据介绍,启望 S3 是一款面向大模型推理深度定制的 GPGPU 芯片,围绕真实推理负载,对芯片架构、存储体系与互联方式进行了系统级设计。相比上一代产品,S3 在典型推理场景下的整体性价比提升超过 10 倍。

在算力与存储设计上,S3 支持从 FP16 到 FP4 的精度自由切换,在保证模型效果的前提下显著提升低精度推理效率;同时率先在国内 GPGPU 产品中采用 LPDDR6 显存方案,显存容量较上一代提升 4 倍,缓解了大模型推理中常见的显存瓶颈问题。

在DeepSeek V3/R1满血版等主流大模型推理场景中,S3 的单位 Token 推理成本较上一代降低约 90%。王勇表示,这使“百万 Token 一分钱”从概念走向可规模化部署的工程能力。

王勇表示,曦望的推理 GPU 并非单点硬件创新,而是通过芯片架构、软件体系与算力交付方式的一体化设计,将硬件能力稳定转化为可交付、可计价的推理算力。目前,曦望已构建与CUDA兼容的基础软件体系,支持推理应用低成本迁移与持续优化,相关能力已覆盖 ModelScope 平台 90% 以上主流大模型形态。

围绕启望 S3,曦望同步发布了面向大模型推理的寰望 SC3-256 超节点方案,可高效支撑 PD 分离架构与大规模专家并行(EP)部署,适配千亿、万亿级参数的多模态 MoE 推理场景。

在交付形态上,寰望 SC3 采用全液冷设计,核心能效指标PUE表现极致。曦望方面表示,在同等算力规模下,该方案的整体交付成本控制在千万元级别,相较行业内同类亿元级方案降低一个数量级。

同时,曦望还推出覆盖 PCIe、OAM 模组、一体机及 AI 计算集群在内的 S3 产品矩阵,覆盖从单机推理到大规模集群部署的多样化需求。

不只卖芯片,重构算力交付的推理“云模式”

如果说 S3 回答的是“推理算力如何更便宜”,那么曦望共建的推理云计划,则进一步指向“算力如何更好用”。

随着推理逐渐成为大模型算力消耗的主要来源,推理算力在实际落地中普遍存在资源碎片化、运维复杂、成本不可预测等挑战。相比训练阶段的一次性投入,推理更强调持续交付能力与长期单位成本,这也对算力交付方式提出了新的要求。


在此背景下,曦望通过生态共建推理云视为其推理算力体系中的关键一环。依托自研推理 GPU,曦望实现从底层芯片到上层平台的全栈优化,将硬件能力以平台化方式稳定释放,从而降低模型适配和系统部署复杂度,形成面向应用落地的完整算力交付路径。

曦望联席 CEO 王湛表示,新一代的AI算力平台,应具备软硬件深度协同、资源利用高度弹性、技术门槛低且运行稳定可靠等特征。基于这一判断,曦望通过云化方式对算力交付模式进行重构,使推理算力从“设备能力”转化为可标准化、可规模化的服务能力。

据介绍,共建推理云以启望 S3 为底座,通过 GPU 池化与弹性调度,将分散的算力资源整合为统一的推理算力池,并以 MaaS(Model as a Service)作为核心入口,向企业提供开箱即用的大模型推理服务。企业无需关注底层硬件配置和集群运维,即可按需调用模型能力,并根据业务负载灵活扩展算力规模。

在稳定性与运维层面,共建推理云在千卡级集群场景下可用性达到 99.95%,横向扩展效率超过 95%。

在这一目标之下,曦望联合商汤科技、第四范式等生态伙伴,共同发起“百万 Token 一分钱”推理成本计划。曦望方面表示,该计划并非单一产品能力的展示,而是多方围绕推理算力成本形成的协同共识,标志着大模型推理正在从“技术可行”走向“经济可行”,为 AI 应用规模化落地提供清晰的成本锚点。

推理算力走向“系统工程”,生态协同成关键变量

随着推理算力竞争从单点技术走向系统工程能力比拼,产业协同的重要性日益凸显。

中国工程院院士、浙江大学信息学部主任吴汉明在发布会上表示,推理时代的算力竞争,已演进为涵盖芯片、系统架构、软件平台和应用场景的综合能力竞争,需要构建从芯片到系统、从技术到应用的完整创新链条。

发布会现场,曦望与浙江大学签署战略合作协议,联合成立“智能计算联合研发中心”,围绕光互连 GPU 超节点架构、半导体虚拟制造(计算光刻)以及 AI 高精度气象预测等前沿方向展开协同研究。

此外,曦望还与中交信科集团、杭钢数字科技、浙江算力科技、三一集团、协鑫科技等企业达成战略合作,推动推理算力在交通、制造、医疗等行业的落地应用。

曦望董事长徐冰表示,随着大模型进入规模化应用阶段,AI 产业正从“训练驱动”转向“推理驱动”。相比一次性投入巨大的训练,推理更强调长期交付能力、单位成本和系统稳定性。

他指出,曦望并不希望只做一家卖芯片的公司,而是围绕推理场景,构建“芯片+系统+生态”的整体布局,让推理算力真正成为可规模化、可持续的基础设施。2025年,曦望芯片交付量已突破万片。

“谁能持续降低推理成本,谁就掌握了 AI 产业的成本曲线。”徐冰表示,曦望希望通过推理算力体系的系统性创新,助力 AI 应用实现规模化落地与可持续增长。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
江苏即将下湿雪!最新升温时间定了!

江苏即将下湿雪!最新升温时间定了!

江南晚报
2026-01-29 04:24:21
回顾“91女神”琪琪:五官出众,却因天真让自己“受伤”

回顾“91女神”琪琪:五官出众,却因天真让自己“受伤”

就一点
2025-11-22 10:36:39
NBA传闻:若勒布朗·詹姆斯离开湖人,骑士将张开双臂欢迎他回归

NBA传闻:若勒布朗·詹姆斯离开湖人,骑士将张开双臂欢迎他回归

好火子
2026-01-29 02:05:10
我70岁才明白:孩子不尊重你,无需翻脸,用“乌鸦定律”就行

我70岁才明白:孩子不尊重你,无需翻脸,用“乌鸦定律”就行

兰姐说故事
2026-01-03 17:40:03
iOS 26.3 突然更新,限制跟踪!

iOS 26.3 突然更新,限制跟踪!

黑猫科技迷
2026-01-28 23:17:06
这么地摊的扯谎,为什么那么多人都愿意信

这么地摊的扯谎,为什么那么多人都愿意信

报人刘亚东
2026-01-28 09:46:31
汪东兴提反对意见,邓公起身质问:为什么你每次开会都唱反调?

汪东兴提反对意见,邓公起身质问:为什么你每次开会都唱反调?

瀚霖学史
2025-10-24 09:04:10
“每周休2.5天引热议”!多地曾发文鼓励

“每周休2.5天引热议”!多地曾发文鼓励

环球网资讯
2026-01-28 16:32:42
格拉西莫夫再次宣布俄罗斯占领库皮扬斯克,这已经是第三次了

格拉西莫夫再次宣布俄罗斯占领库皮扬斯克,这已经是第三次了

山河路口
2026-01-27 18:39:14
国外留学生的生活有多炸裂?网友:给我这个农村人看笑了

国外留学生的生活有多炸裂?网友:给我这个农村人看笑了

带你感受人间冷暖
2026-01-25 00:20:06
澳网第12日看点:张帅冲击女双决赛,萨巴伦卡大战斯维托丽娜

澳网第12日看点:张帅冲击女双决赛,萨巴伦卡大战斯维托丽娜

全景体育V
2026-01-29 06:31:49
字母哥离队概率升至55%!三大心仪下家曝光:专家解析交易难度

字母哥离队概率升至55%!三大心仪下家曝光:专家解析交易难度

罗说NBA
2026-01-29 01:45:33
美伊都要军演,紧张局势拉满,沙特、阿联酋却对美国“亮红灯”

美伊都要军演,紧张局势拉满,沙特、阿联酋却对美国“亮红灯”

上观新闻
2026-01-28 15:29:08
尹锡悦就首案被判5年上诉

尹锡悦就首案被判5年上诉

界面新闻
2026-01-19 15:36:37
关系藏不住了?华晨宇殷秀梅手挽手下班引发热议,恶心的一幕出现

关系藏不住了?华晨宇殷秀梅手挽手下班引发热议,恶心的一幕出现

娱说瑜悦
2026-01-28 15:50:27
大溃败!中国网贷公司,在印度全军覆没

大溃败!中国网贷公司,在印度全军覆没

首席品牌评论
2026-01-07 18:20:00
在盒马app买鲜百合被误送成水仙球,北京祖孙二人误食中毒后进医院,盒马回应

在盒马app买鲜百合被误送成水仙球,北京祖孙二人误食中毒后进医院,盒马回应

潇湘晨报
2026-01-27 18:01:05
甘肃电投集团原董事长勾结商人受贿1008万元:一人落马,一人身故

甘肃电投集团原董事长勾结商人受贿1008万元:一人落马,一人身故

黄桷树财经
2026-01-28 23:33:41
美媒:民主党众议员在明尼阿波利斯演讲要求废除移民海关执法局时遭袭击

美媒:民主党众议员在明尼阿波利斯演讲要求废除移民海关执法局时遭袭击

环球网资讯
2026-01-28 11:48:05
俄上万亿高铁项目,不用中国高铁技术,采用锡纳拉集团,现在怎样

俄上万亿高铁项目,不用中国高铁技术,采用锡纳拉集团,现在怎样

地球记
2026-01-29 01:59:03
2026-01-29 07:08:49
硅星Breaknews incentive-icons
硅星Breaknews
Break news
6707文章数 67关注度
往期回顾 全部

科技要闻

它是神也是毒!Clawdbot改名卷入千万诈骗

头条要闻

中国代表:支持伊朗国家稳定 武力解决不了问题

头条要闻

中国代表:支持伊朗国家稳定 武力解决不了问题

体育要闻

没天赋的CBA第一小前锋,秘诀只有一个字

娱乐要闻

金子涵拉黑蔡徐坤,蔡徐坤工作室回应

财经要闻

从万科退休20天后,郁亮疑似失联

汽车要闻

新手必看!冰雪路面不敢开?记住这4点 关键时刻真能保命

态度原创

家居
游戏
亲子
本地
公开课

家居要闻

跃式别墅 包络石木为生

《怪猎荒野》PC性能大提升!Steam掌机也终于能玩了

亲子要闻

好聪明的宝宝,这样的家庭一定能教出很好的孩子

本地新闻

云游中国|拨开云雾,巫山每帧都是航拍大片

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版