![]()
![]()
作者 | 铅笔道 松格
作者 | 铅笔道 黄小贵
封面图丨曦望官网
国产GPU公司曦望,刚刚融了超10亿元。
曦望是国内第一家只做推理的GPU企业,也是第一批实现推理GPU万卡级交付的芯片公司。这笔融资,也是今年国产GPU赛道里金额最大的一笔。
完成本轮融资后,曦望估值突破百亿元。
曦望前身是商汤(最新市值857亿)内部的大芯片部门,分拆独立仅一年多,但已经累计完成七轮融资,总融资额约40亿元。
曦望被资本市场看好,背后在于AI行业正在发生剧变:模型成本从训练慢慢转移到推理,AI成本增长,不再来自“训练一轮模型”,而来自持续运行模型。
商汤系老将二次创业
曦望2024年底才从商汤分拆出来独立运营。
曦望的发起人兼董事长徐冰,是商汤的联合创始人;联席CEO王勇是前AMD、昆仑芯的核心架构师,有20年芯片研发经验,2020年加入商汤后,带着团队主导了曦望两代芯片的研发和量产;另一位联席CEO王湛是百度创始团队成员,2000年就加入了百度,曾主导搭建百度搜索推广系统“凤巢”。
曦望选择全栈自研AI推理GPU,踩中了三波红利。
![]()
第一重红利,是赛道错位。
前几年国内GPU行业极度内卷,几乎所有公司都一窝蜂扎堆训练GPU。结果呢?性能追不上英伟达,同质化严重,客户订单稀少,大量公司烧钱多年无法商业化。
曦望创始团队做了反行业决策:不碰训练,All-in推理。芯片架构从零开始专为推理设计,不追求全能,只把速度、能效、成本做到极致。
第二重红利,是踩中了智能体风口。
2026年被公认为AI智能体元年。大模型不再只是聊天对话,开始进化成能自主完成任务的数字员工、服务机器人。
算力需求随之大转向:推理算力暴涨至训练的4到5倍,占AI总算力的70%以上。云厂商、互联网公司、智算中心,全都急需低成本推理算力,市场供不应求。
第三重红利,是国产替代。
曦望实现了芯片架构、指令集、驱动、软件生态的全栈自研。S1、S2、S3三代芯片全部量产落地,已完成数万颗交付。最新的S3芯片,是国内第一款搭载LPDDR6内存的推理GPU,跑百万Token只要1分钱。
独特的赛道选择和量产能力,曦望融资速度很快:2025年首轮近10亿,本轮再超10亿,累计7轮约40亿,成为国内首家估值超百亿的纯推理GPU独角兽。曦望的股东国资和产业基金占据主导。
推理算力全面爆发
为什么推理GPU突然变得这么值钱?
首先是AI对GPU的需求结构已经彻底反转。推理算力需求总量是训练算力的4到5倍,已经成为AI算力的绝对核心增量。
在这个背景夏,2026年全球推理芯片市场规模将达到1450亿至1620亿美元。国内到2028年,推理芯片市场规模预计突破7000亿元。
推理需求到底有多旺?
互联网云厂商这边,百度、阿里、腾讯、字节的主流大模型,日均全网调用量突破420亿次,原有芯片产能完全跟不上。
智算中心这边,国内“东数西算”二期工程全面启动,2026年全国新建智算中心超86个,单个智算中心平均采购GPU超12万张。
各行各业也在铺开——企业私有大模型、金融风控、医疗AI、工业智能体,到处都缺低成本算力。
需求暴涨直接带动价格上涨。国内推理算力资源半年内租赁价格涨幅接近40%。
而供给端呢?国内绝大多数GPU企业依旧扎堆做训推一体通用芯片,两头都不突出,产品高度同质化。2025年国产GPU整体市占率仅41%,且大部分都是低端产品。真正从底层架构专为推理设计、全栈自研、已经实现量产落地的纯推理GPU厂商,少之又少。
最赚钱的是上游芯片厂
AI推理算力赛道早已形成完整的盈利闭环。
最赚钱的一层,是上游芯片原厂。
这就是曦望所处的赛道。赚钱模式很简单:硬件批量出货,靠规模化盈利。
曦望的S1、S2两代芯片已经实现规模化量产出货,客户覆盖多家互联网大厂,深度适配DeepSeek、Kimi等主流大模型。新一代S3芯片已经锁定多家云厂商的长期集采订单。
海光信息,国产GPU老牌龙头,2025年全年营收143.77亿元,同比增长56.92%。旗下DCU推理芯片大规模进入国内云厂商、智算中心供应链。
寒武纪,2025年营收64.97亿元,同比暴涨453%,并且首次实现全年盈利,净利润20.59亿元。芯片毛利率约55%。
中间一层,是算力服务商。
他们批量采购国产推理GPU,搭建算力集群,对外提供算力租赁、大模型API调用服务,赚取运营差价。
百度智能云、阿里云、腾讯云都在大量采购国产推理GPU搭建推理集群;各地国资智算中心采购国产芯片,面向本地企业出租算力,叠加政策补贴,现金流非常稳定。
下游的应用企业,用算力降本。
他们不做芯片、不卖算力,而是用低成本推理算力来省钱。采用国产推理GPU后,单千次Token推理成本下降60%以上,每日算力开支大幅缩减。
那后来者还有机会吗?
有,但不用硬拼头部正面战场。
比如边缘端专用推理芯片。曦望主攻云端数据中心,而边缘设备、物联网终端的低功耗推理芯片,还有大量市场空白。
比如软件生态适配服务。国产GPU最大的短板是软件适配,芯片原厂顾不上,第三方做模型迁移、算子优化,轻资产、高毛利。
比如垂直行业算力。公有云通用算力已经内卷严重,但金融、医疗、工业专属推理算力几乎空白,聚焦一个行业,客户粘性更强、服务溢价更高。
曦望本轮超10亿元融资,算是2026年AI算力行业的一个信号。
加上现在整条推理产业链也已经跑通了:做芯片的赚钱,做算力服务的赚钱,用算力降本的也赚钱。
接下来拼的不是谁训练更强,而是谁能把推理成本打下来。谁更便宜、谁更好用,谁就能抢到市场。
本文不构成任何投资建议。
你是热爱股权投资的人士吗?铅笔道发起【独角兽投资俱乐部】。我们希望:搭建一个公共的独角兽投资者俱乐部,聚集一群以成就独角兽为使命的投资者,一起发现+培育独角兽。点击图片了解详情。
欢|迎|联|系
想获得调研,请联系:qianbidao01
想加入创业社群,请联系:qianbidao01
想进行市场合作,请联系:qianbidao01
文章转载,请联系:qianbidao01
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.