![]()
4月20日,南都N视频了解获悉,国内全栈自研AI推理GPU企业曦望(Sunrise)完成了新一轮超10亿元融资,由多家产业方战投、地方国资及头部财务机构共同参与。这也是2026年AI产业全面迈入“推理落地、智能体普及”时代后,国内GPU赛道诞生的最大单笔融资之一。
![]()
据曦望方面介绍,本轮融资资金将主要用于新一代S3推理GPU的规模化量产交付、全栈软件生态建设,以及S4/S5后续芯片的研发迭代。公开资料介绍,曦望成立于2020年,前身为商汤科技大芯片部门,于2024年底完成分拆。如今,分拆独立仅一年多,其已累计完成七轮融资,总融资额约40亿元,成为国内首家估值超百亿的纯推理GPU独角兽。
从技术路径来看,据介绍,不同于行业主流的“训推一体”路线,曦望从成立第一天起就坚定All-in推理赛道,以用户真实的Token成本、单位能耗和服务稳定性为芯片设计核心。目前,其已推进三代推理GPU迭代、数万颗GPU量产落地,实现了从芯片研发、产品量产到解决方案交付的完整闭环。
2026年1月,曦望正式发布新一代旗舰产品启望S3推理GPU,作为国内首款搭载LPDDR6且兼容LPDDR5X内存的推理GPU,没有盲目照搬高端训练GPU的HBM显存路线,而是基于Agent推理的本质需求,从AI Core计算架构到内存IO系统进行了全链路重构。
![]()
2026年被业内称为“AI智能体元年”。随着大模型从“会聊天”进化为“会思考、会执行”的数字员工,推理需求迎来爆发式增长。英伟达GTC 2026大会正式宣告AI产业全面迈入“推理落地、智能体普及”的新时代,将“每瓦Token吞吐量”定义为AI时代的核心竞争力,这与曦望的核心战场相契合。
从产业周期看,训练侧格局已相对固化,而推理侧正随Agentic AI放量进入指数级增长通道,多家机构预测,未来五年推理算力市场规模将超越训练侧数倍,其中Agent类负载将贡献最主要的增量。“AI算力基建的重心已彻底切换。”曦望董事长徐冰表示,“2026年AI推理计算需求将达到训练需求的4-5倍,推理算力租赁价格半年涨幅近40%。”
近期,OpenClaw的爆火也掀起全民“养龙虾”热潮,对此,曦望方面认为,以OpenClaw为代表的智能体推理,“感知—规划—执行—反馈”高频循环,带来了对KV-cache密集访问的全新计算负载,通用GPU面向训练优化,推理实际算力利用率往往远低于峰值——推理侧的效率瓶颈已不再是“算力不够”,而是“算力用不满”。
据悉,S3通过计算层的深度定制,解决了通用GPU“算力用不满”的核心痛点,推理性能较上一代S2提升5倍,目标实现Token成本下降90%。“S3不是简单的性能升级,而是一次对AI推理成本曲线的重构。”徐冰表示,“我们的目标是将推理成本降至‘百万Token一分钱’,让AI像水电一样成为普惠基础设施。”
采写:南都N视频记者 朱可轩
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.