网易首页 > 网易号 > 正文 申请入驻

推理算力占AI应用70%成本权重,需求爆发下国产芯片如何定义性价比新基准?

0
分享至

雷峰网消息,1月27日,国产GPU厂商曦望(Sunrise)正式发布新一代推理芯片“启望S3”,并同步推出面向大模型推理的“寰望 SC3”超节点方案及推理云计划。


这一系列动作直指行业痛点。

此前AI芯片厂商普遍陷入“拼峰值性能”的竞争怪圈,但不少行业人士指出,以超节点为例,产品存在明显“规模甜点”效应:一旦超过性能阈值,提升幅度便会边际递减,盲目追求超大算力规模反而会造成GPU闲置率攀升、单位Token成本高企的问题。

推理场景下,用户需要的是“成本可控、性能适配、稳定可靠” 的算力。如何走出差异化的路线?

“我们抛弃了传统的训推一体GPU为训练准备的冗余设计,不追求峰值TFLOPS性能,而是把真实业务场景中的单个Token成本、能耗,以及SLA的稳定性,作为所有设计决策的根本出发点。”曦望董事长徐冰在发布会现场阐述到。

为了达到这个标准,启望S3作为面向大模型推理深度定制的GPGPU芯片,如何围绕真实推理负载完成对算力结构、存储体系与互联方式的系统级重构?

从“性能峰值”到“单位成本”,推理正在重新定义GPU设计目标

推理算力的爆发式增长,已成为行业当下最核心的关注焦点。对此,曦望在发布会上,给出两组数据:

到2026年,推理算力在整体AI算力中的占比将达到66%,这并非遥远的趋势预判,而是正在发生的行业结构性变化,推理已从AI产业链的“配角”跃升为“主力”;

当前推理成本在AI应用总支出中的占比已高达70%,直接决定着AI企业的盈利空间与商业化成败。只有将推理成本从现有量级大幅压低,实现阶梯式下降,AI才能真正摆脱高成本束缚。

“当推理成为主要算力消耗场景后,GPU的商业价值不再取决于参数指标,而是单位Token的真实成本。”曦望联席CEO王勇表示。

这一判断,决定了启望S3的设计方向。


在算力层面,S3支持从FP16到FP4的多精度灵活切换,使模型在保证效果的前提下,最大化提升低精度推理效率。这种设计更贴合当前MoE和长上下文模型在推理阶段的实际需求。

在存储层面,S3采用LPDDR6显存方案,成为国内首款采用该方案的芯片。相比HBM路线,LPDDR6更强调容量与能效比。官方数据显示,S3的显存容量较上一代产品提升4倍,有效缓解了大模型推理中普遍存在的显存驻留与访存瓶颈。

在DeepSeek V3 / R1满血版等主流大模型推理场景中,S3单位Token推理成本较上一代产品下降约90%。曦望方面称,这一指标已具备工程可复现性,而非单点实验室数据。


此外,曦望同步发布了面向大模型推理的寰望SC3超节点解决方案,该方案支持单域256卡一级互联,可高效支撑PD分离架构与大EP规模化部署,显著提升推理阶段的系统利用率与稳定性,适配长上下文、多并发、多专家并行等复杂推理场景。

在交付形态上,寰望SC3采用全液冷设计,具备极致PUE表现,并支持模块化交付与快速部署。在同等推理能力量级下,该方案可将整体系统交付成本从行业常见的亿元级,降低至千万元级,实现一个数量级的下降。


在软件层面,曦望构建了与CUDA兼容的基础软件体系,覆盖驱动、运行时API、开发工具链、算子库和通信库,降低推理应用的迁移门槛。目前,该体系已适配ModelScope平台 90% 以上主流大模型形态,包括DeepSeek、通义千问等。


推理算力如何更好用?云平台打通落地的“最后一公里”

S3回答了推理性价比的命题,但对于大部分用户而言,其对算力需求的产品形态应为云上算力资源,而非裸金属资源。

让推理算力更好用,不应止步于造出芯片。为此,曦望与商汤科技、第四范式等生态伙伴探索的推理云平台。


通过GPU池化与弹性调度,曦望将底层算力整合为统一的推理算力池,并以MaaS作为核心入口,使企业无需关注底层硬件配置与集群运维,即可按需调用大模型推理能力。

这一体系也成为“百万Token 一分钱”推理成本的重要技术基础。

“推理时代的核心不是把芯片卖出去,而是能否持续、稳定地把算力转化为可交付的生产力。谁能持续降低推理成本,谁就掌握了AI产业的成本曲线。”曦望董事长徐冰表示。

据披露,曦望2025年推理GPU芯片交付量已突破1万片,标志着其推理GPU路线完成从工程验证到规模化交付的关键跨越。

中国工程院院士、浙江大学信息学部主任吴汉明也指出,推理算力价值的实现离不开协同,需要芯片设计、系统集成、软件开发到产业应用的全链条协作。

在国产GPU行业从“拼参数”走向“拼单位经济成本”的拐点上,曦望选择以推理为切口,尝试重构 GPU 的产品形态与算力交付方式。All-in推理的实践,正在成为观察中国推理算力商业化进程的重要样本。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
沙特王储突然站队,中国三年前留下的后手,关键时刻拉了伊朗一把

沙特王储突然站队,中国三年前留下的后手,关键时刻拉了伊朗一把

辉辉历史记
2026-01-28 17:30:23
赵露思直播卖货动作幅度太大露出内裤,遭质疑博流量,太败好感!

赵露思直播卖货动作幅度太大露出内裤,遭质疑博流量,太败好感!

桑葚爱动画
2026-01-02 19:46:41
值得珍藏:固态电池+核聚变链+AI芯片+商业航天+光刻机+量子信息

值得珍藏:固态电池+核聚变链+AI芯片+商业航天+光刻机+量子信息

Thurman在昆明
2026-01-27 11:29:18
2年前,我朋友非得说黄金涨价,当时400一克,他买了60万黄金

2年前,我朋友非得说黄金涨价,当时400一克,他买了60万黄金

千秋文化
2026-01-21 21:08:57
国台办果然没看错,郑丽文真面目被彻底揭露!小算盘到此为止了

国台办果然没看错,郑丽文真面目被彻底揭露!小算盘到此为止了

比利
2026-01-23 12:41:53
工龄40年1个月,2025年在江苏事业单位退休,养老金能领到多少?

工龄40年1个月,2025年在江苏事业单位退休,养老金能领到多少?

童童聊娱乐啊
2026-01-29 17:20:04
美国军方大胆预测:曝光解放军武统的时间,大幅度提前,随时动手

美国军方大胆预测:曝光解放军武统的时间,大幅度提前,随时动手

听风行天涯
2026-01-28 21:08:56
特朗普重兵包围伊朗,金价突破3万5,一旦开打,美国将加速衰败

特朗普重兵包围伊朗,金价突破3万5,一旦开打,美国将加速衰败

小噎论事
2026-01-29 15:31:33
澳网最大抓马诞生!萨巴因叫声遭罚分,赛后坦言太荒谬

澳网最大抓马诞生!萨巴因叫声遭罚分,赛后坦言太荒谬

网球之家
2026-01-29 22:57:59
中日开战可能性增大,但收场太难,若真动手,中方估计半步都不退

中日开战可能性增大,但收场太难,若真动手,中方估计半步都不退

百态人间
2026-01-03 16:42:15
案例:复旦博士姜文华判处死刑,女学生曝光其习惯,有一点很奇怪

案例:复旦博士姜文华判处死刑,女学生曝光其习惯,有一点很奇怪

清茶浅谈
2025-01-18 15:14:28
科学家找到癌细胞的生死开关?6个有效的抗癌方法,能防很多癌!

科学家找到癌细胞的生死开关?6个有效的抗癌方法,能防很多癌!

医学原创故事会
2026-01-11 20:30:03
深夜黄金白银急速跳水,微软重挫10%,油价飙涨4%,比特币超18万人爆仓

深夜黄金白银急速跳水,微软重挫10%,油价飙涨4%,比特币超18万人爆仓

21世纪经济报道
2026-01-29 23:47:18
宁波警方突袭!9人当场被带走!写字楼一房间内藏着不可告人的秘密……

宁波警方突袭!9人当场被带走!写字楼一房间内藏着不可告人的秘密……

环球网资讯
2026-01-29 07:33:06
中美俄罕见立场一致!佩斯科夫:只要她不下台,就没什么好谈的

中美俄罕见立场一致!佩斯科夫:只要她不下台,就没什么好谈的

肖兹探秘说
2026-01-29 15:27:44
新华社消息|伊朗最高领袖顾问:美若动武 伊朗将打击“特拉维夫的心脏”

新华社消息|伊朗最高领袖顾问:美若动武 伊朗将打击“特拉维夫的心脏”

新华社
2026-01-29 09:24:27
60岁蒋雯丽心酸现状,定居英国,又瘦又老,一代女神成了"笑话"

60岁蒋雯丽心酸现状,定居英国,又瘦又老,一代女神成了"笑话"

小熊侃史
2025-11-27 18:59:29
南华寺百岁高僧:人死后基本都投身畜生道,活人进入轮回永不超生

南华寺百岁高僧:人死后基本都投身畜生道,活人进入轮回永不超生

纸鸢奇谭
2025-01-17 14:30:03
输球又输人!张本智和公开炮轰松岛辉空!日媒打脸:刘国梁就这么用过

输球又输人!张本智和公开炮轰松岛辉空!日媒打脸:刘国梁就这么用过

好乒乓
2026-01-29 20:06:53
乌克兰:悔到肠子青,当年卖给中国三架“废铁”,今成大国重器?

乌克兰:悔到肠子青,当年卖给中国三架“废铁”,今成大国重器?

素衣读史
2026-01-26 18:51:48
2026-01-30 03:55:00
雷峰网 incentive-icons
雷峰网
关注智能与未来!
68446文章数 656061关注度
往期回顾 全部

科技要闻

周亚辉的AI新赌局:国内太卷 出海另起炉灶

头条要闻

金晨被指肇事逃逸让助理顶包 律师:顶包者或被判刑

头条要闻

金晨被指肇事逃逸让助理顶包 律师:顶包者或被判刑

体育要闻

詹姆斯哭了!骑士视频致敬41岁超巨

娱乐要闻

曝金晨涉嫌交通肇事逃逸 本人尚未回应

财经要闻

崔东树:中国汽车未来年销或达5000万辆

汽车要闻

车长超5米还带后轮转向 比亚迪海豹08/海狮08将亮相

态度原创

旅游
本地
健康
房产
军事航空

旅游要闻

外滩光影里的石库门:上海把百年文脉织进了新春夜色!

本地新闻

云游中国|拨开云雾,巫山每帧都是航拍大片

耳石症分类型,症状大不同

房产要闻

寰岛学校卖楼,二次流拍!

军事要闻

中方被指支持俄生产武器 外交部回应

无障碍浏览 进入关怀版