杭州GPU独角兽曦望获超10亿元融资，推进算力成本降九成|推理|gpu|新模型

杭州GPU独角兽曦望获超10亿元融资，推进算力成本降九成

2026-04-20 17:36:10　来源: 南方都市报

广东举报

分享至

4月20日，南都N视频了解获悉，国内全栈自研AI推理GPU企业曦望（Sunrise）完成了新一轮超10亿元融资，由多家产业方战投、地方国资及头部财务机构共同参与。这也是2026年AI产业全面迈入“推理落地、智能体普及”时代后，国内GPU赛道诞生的最大单笔融资之一。

据曦望方面介绍，本轮融资资金将主要用于新一代S3推理GPU的规模化量产交付、全栈软件生态建设，以及S4/S5后续芯片的研发迭代。公开资料介绍，曦望成立于2020年，前身为商汤科技大芯片部门，于2024年底完成分拆。如今，分拆独立仅一年多，其已累计完成七轮融资，总融资额约40亿元，成为国内首家估值超百亿的纯推理GPU独角兽。

从技术路径来看，据介绍，不同于行业主流的“训推一体”路线，曦望从成立第一天起就坚定All-in推理赛道，以用户真实的Token成本、单位能耗和服务稳定性为芯片设计核心。目前，其已推进三代推理GPU迭代、数万颗GPU量产落地，实现了从芯片研发、产品量产到解决方案交付的完整闭环。

2026年1月，曦望正式发布新一代旗舰产品启望S3推理GPU，作为国内首款搭载LPDDR6且兼容LPDDR5X内存的推理GPU，没有盲目照搬高端训练GPU的HBM显存路线，而是基于Agent推理的本质需求，从AI Core计算架构到内存IO系统进行了全链路重构。

2026年被业内称为“AI智能体元年”。随着大模型从“会聊天”进化为“会思考、会执行”的数字员工，推理需求迎来爆发式增长。英伟达GTC 2026大会正式宣告AI产业全面迈入“推理落地、智能体普及”的新时代，将“每瓦Token吞吐量”定义为AI时代的核心竞争力，这与曦望的核心战场相契合。

从产业周期看，训练侧格局已相对固化，而推理侧正随Agentic AI放量进入指数级增长通道，多家机构预测，未来五年推理算力市场规模将超越训练侧数倍，其中Agent类负载将贡献最主要的增量。“AI算力基建的重心已彻底切换。”曦望董事长徐冰表示，“2026年AI推理计算需求将达到训练需求的4-5倍，推理算力租赁价格半年涨幅近40%。”

近期，OpenClaw的爆火也掀起全民“养龙虾”热潮，对此，曦望方面认为，以OpenClaw为代表的智能体推理，“感知—规划—执行—反馈”高频循环，带来了对KV-cache密集访问的全新计算负载，通用GPU面向训练优化，推理实际算力利用率往往远低于峰值——推理侧的效率瓶颈已不再是“算力不够”，而是“算力用不满”。

据悉，S3通过计算层的深度定制，解决了通用GPU“算力用不满”的核心痛点，推理性能较上一代S2提升5倍，目标实现Token成本下降90%。“S3不是简单的性能升级，而是一次对AI推理成本曲线的重构。”徐冰表示，“我们的目标是将推理成本降至‘百万Token一分钱’，让AI像水电一样成为普惠基础设施。”

采写：南都N视频记者朱可轩

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.