网易首页 > 网易号 > 正文 申请入驻

第四大Token工厂冲刺IPO!毛利率-24%,AI Infra被卷成"流量生意"

0
分享至


又一家AI公司要在港股上市了。

昨天,港交所官网显示,硅基流动正式披露招股书,冲刺港股“AI Token工厂第一股”。

作为AI基础设施公司,硅基流动身上几乎浓缩了这一轮AI浪潮最火热的一面。

2024年12月,硅基流动平台上的平均日均token消耗只有478亿。而到了今年4月,公有云平均日均token消耗增长到5785亿,翻了10倍还不止。

从收入来看,硅基流动的增长很快。2024年,公司收入只有 734.6 万元,2025年已经增长到了5533 万元,同比增长 653.2%。

但热闹的数据背后,也藏着AI推理市场最残酷的一面。

去年,硅基流动亏了1.87亿,几乎是收入三倍还多,毛利率只有-24%。

除了研发费用外,亏损主要来自公有云和用户补贴。2025年,占公司过半收入的公有云业务,毛利率只有-119%。也就是说,每产生一块钱的收入,公司还要亏1块钱。

同时,为了抢用户,去年硅基流动就投入了5421万元免费算力,相当于几乎把全年收入又补贴了一遍。

即便如此,今年前四个月,这个数字只有145万,相当于只有去年全年的四分之一。按比例来说,不仅没有增长,还出现了下降。

一家原本靠效率取胜的AI基础设施公司,在国内竞争激烈环境下,似乎也终究免不了被卷入到流量和价格漩涡里。


国内第四大Token工厂

硅基流动的创始人袁进辉曾用一个极其通俗的比喻,来形容他们的业务:

"算力就像白菜、土豆等原材料,既可以直接卖给客户,也可以将这些原材料加工成宫保鸡丁之类的成品菜,再'端'给客户。我们提供的是成品模型,而不是原始的算力资源。"

在这个被称为「Token工厂」的模式中,硅基流动的核心能力是,通过「管道」,将复杂的算力资源和多元模型打包,统一输出成便宜、好用的标准化Token。

这种模式的价值,主要体现在两个方面:

第一,是提升算力利用效率,尤其是国产芯片的适配能力

中国AI Infra最大的特点,是底层算力非常分散。美国市场几乎围绕英伟达CUDA生态展开,而国内除了英伟达,还有华为昇腾、沐曦、摩尔线程、壁仞等大量国产AI芯片。不同芯片的软件栈并不统一,一家企业如果想同时使用多种芯片,往往需要投入大量研发成本做适配。

这就是硅基流动试图解决的问题,解决各类国产芯片(如昇腾、摩尔线程、沐曦等)的适配问题,通过高性能推理引擎让国产芯片能产出更多Token。

目前,硅基流动已经能够在大规模生产环境下,同时支持英伟达GPU以及昇腾、摩尔线程、沐曦等多种国产AI芯片。

第二点是模型中立

今天的大模型市场,大多数云厂商既提供基础设施,又拥有自己的模型和AI应用,既是平台,也是参与者。

而硅基流动只做基础设施,既不研发模型,也不做AI应用。这种纯粹的中立性,对于担心数据安全、业务依赖或被平台绑定的头部客户(尤其是金融、政务、大型企业)来说,有很大的吸引力。

截至目前,硅基流动已经服务了超过1.3万家企业客户,平台累计支持超过170个模型。

按2025年Token年吞吐量计算,硅基流动已是中国第四大Token供应平台,排在它前面的,是火山引擎、阿里云和百度智能云这三座大山。

对于一家成立仅三年的AI Infra公司来说,这样的成绩绝对算不上差。

卖Token,成了流量生意

相比Token的快速增长,硅基流动的商业化表现就比较尴尬了。

从收入来看,硅基流动的增长很快。2024年,公司收入只有 734.6 万元,2025年已经增长到了5533 万元,同比增长653.2%

不过与大模型公司类似,硅基流动也亏了不少。2025年,公司的经调整亏损为1.87亿,几乎是收入三倍还多。

除了研发费用外,亏损主要来自公有云和用户补贴。

从交付方式来说,硅基流动主要分别两种:公有云和本地部署,收入基本各占一半。其中,公有云又分为无服务器词元服务、专属实例,前者是共享算力资源,后者相当于独家算力资源。

不过公有云毛利率很低。2025年,公有云的毛利率只有-119%。也就是说,每产生一块钱的收入,公司还要亏1块钱。

与此同时,为了吸引更多用户进去公有云平台。去年,硅基流动还花了5421万的算力推广成本。这些钱,全用来给用户发免费算力了。

硅基流动这么做的原因也很简单,用很低的价格把更多用户吸引进来,然后让他们去购买更多的独家算力。

理想很美好,不过现实很骨感。

去年全年,使用公有云共享算力资源的用户为545万。而今年前四个月,这个数字只有145万,相当于只有去年全年的四分之一。按比例来说,不仅没有增长,还出现了下降。

一个很重要的原因是,注册用户增长放缓。2025年,公有云注册用户为919.7万。而截至今年4月3日,这个数字为1028万,增长11.78%。

虽然公有云共享算力的付费用户渗透率从去年年底的13.13%增长到44.18%。但截至今年前4月,购买独家算力的客户仍然只有20个,而去年全年是49个。

公有云的商业化窘境背后,一个更残酷的真相是:公有云API正在不可逆地变成“流量批发”,最终只能靠极端的规模效应来微利生存

更可怕的是,连运营商都下场抢食了。

今年5月中旬,中国移动、中国联通、中国电信相继面向C端用户推出Token套餐。上海移动联合腾讯推出“1元可购40万Tokens”;北京移动甚至推出了最低5.99元的次包。

当算力Token被运营商打包成普通用户能买的“流量包”时,硅基流动这种的中间商,又还能有多少空间?

越来越卷的AI Infra

公有云竞争激烈,但本地化部署也没好到哪去。过去两年,虽然本地部署的平均客单价从22万元提升至130.3万元,但客户数量却从28家减少到20家。

按理说,本地部署对AI Infra能力要求更高,硅基流动的效率优势应该更容易转化为商业价值。但问题在于,几乎所有玩家都盯上了这块市场。

回过头来看,在行业早期,硅基流动的效率优势确实非常明显。

由于更早押注开源生态,它成为DeepSeek爆发最大的受益者。在很长一段时间里,它几乎是唯一支持DeepSeek的第三方MaaS平台。

而当所有人都看到了AI推理算力和异构算力infra需求,这个市场也正在变得越来越卷。尤其当效率成为整个中国AI产业的共识时,硅基流动的优势也在被产业各方快速追赶。

一方面,无论是阿里、腾讯、百度、字节等大厂,还是摩尔、沐曦、壁仞等芯片公司,都在疯狂补齐Infra算力技术和模型适配能力。

去年年底,腾讯云甚至专门拆分成立AI Infra部门。而字节跳动的AI Infra团队规模,据业内估计已经超过千人。

另一方面,模型厂商和芯片厂商之间,也开始绕过第三方Infra平台,直接合作。比如,华为昇腾与DeepSeek、摩尔线程与智谱、壁仞与阶跃等合作,都在缩短模型到芯片之间的距离。

换句话说,原本属于AI Infra公司的工作,正在被上下游逐步消化

壁仞科技创始人张文去年也谈过这一点。他认为,国产GPU从设计到量产往往需要两年,而模型几乎每周都在迭代,因此模型公司与芯片公司的协同只会越来越紧密。

当然,这并不意味着独立AI Infra没有机会。毕竟,中国的AI基础设施不是一个统一的英伟达世界,同时开源生态的发展,也在不断提升MaaS平台的价值。

真正的问题在于,这个市场的空间能有多大。

过去,云计算和SaaS的发展已经证明,中国to B生意从来不是一个可以靠技术或者效率取胜的事情。从这一点来说,硅基流动的故事并不好讲。

文/阿奇


特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
莫言:一个人最大的愚蠢,是习惯性反驳|不涉及利益,闭嘴是修养

莫言:一个人最大的愚蠢,是习惯性反驳|不涉及利益,闭嘴是修养

杏花烟雨江南的碧园
2026-06-30 11:15:03
本想逼退樊振东?总局一纸文件下去,自己先陷入了信任危机

本想逼退樊振东?总局一纸文件下去,自己先陷入了信任危机

酷侃体坛
2026-05-27 21:23:15
“别让女儿学舞蹈了”,荷花奖得主在酒馆兼职舞女,家长看蒙了

“别让女儿学舞蹈了”,荷花奖得主在酒馆兼职舞女,家长看蒙了

泽泽先生
2026-06-30 19:47:39
国内首家!中国东航宣布宽体机航班上网全免费

国内首家!中国东航宣布宽体机航班上网全免费

澎湃新闻
2026-07-02 10:34:09
小米智能存储1小时售罄:万人抢60TB,AI相册成亮点

小米智能存储1小时售罄:万人抢60TB,AI相册成亮点

碳基打工人
2026-07-02 03:44:46
死亡人数破千!欧洲正式摊牌,宁可社会崩溃也不让中国办成一件事

死亡人数破千!欧洲正式摊牌,宁可社会崩溃也不让中国办成一件事

标体
2026-07-01 13:47:51
养路费大变天!油车加油更便宜,电车上路要缴费,算账才知亏赚

养路费大变天!油车加油更便宜,电车上路要缴费,算账才知亏赚

华庭讲美食
2026-07-01 08:53:34
勇士向詹姆斯提出硬性招募条件:先加盟,才会全力交易戴维斯

勇士向詹姆斯提出硬性招募条件:先加盟,才会全力交易戴维斯

夜白侃球
2026-07-01 12:11:24
如何判断一个人是不是性工作者?网友说看倒精方法是否老练!

如何判断一个人是不是性工作者?网友说看倒精方法是否老练!

灯锦年
2026-07-01 17:38:16
弃600万顶薪留广东,徐杰70万坚守揭示CBA真谛

弃600万顶薪留广东,徐杰70万坚守揭示CBA真谛

寒律
2026-07-02 14:20:15
扎心了!“我生君未富”,一博主举出大厂大量现实案例,评论沸腾

扎心了!“我生君未富”,一博主举出大厂大量现实案例,评论沸腾

火山詩话
2026-06-30 05:52:05
专家:一旦台岛发生大地震,解放军必刻不容缓在美日前采取行动!

专家:一旦台岛发生大地震,解放军必刻不容缓在美日前采取行动!

阿龙聊军事
2026-07-02 11:39:13
心理学上说:永远要记住,和周围人搞好关系的秘诀就是,不分享喜悦,不炫耀成功,不说三道四,不假装聪明

心理学上说:永远要记住,和周围人搞好关系的秘诀就是,不分享喜悦,不炫耀成功,不说三道四,不假装聪明

心理观察局
2026-07-02 06:26:09
1943 年主将拒交兵权,拒不赴延安进修,还加害接任将领

1943 年主将拒交兵权,拒不赴延安进修,还加害接任将领

唠叨说历史
2026-05-25 11:46:11
全市场:马拉多纳2018年预言美加墨世界杯,为广告搞出4节

全市场:马拉多纳2018年预言美加墨世界杯,为广告搞出4节

懂球帝
2026-07-01 15:28:07
人一生自有四大定数:生死、姻缘、富贵、子女,皆有天意安排

人一生自有四大定数:生死、姻缘、富贵、子女,皆有天意安排

娱乐洞察点点
2026-07-02 12:28:37
乌克兰天塌了!最铁杆盟友,彻底翻脸了!

乌克兰天塌了!最铁杆盟友,彻底翻脸了!

大嘴说天下
2026-07-01 19:28:40
波尔不再隐瞒!回应樊振东未回归国乒缘由,直言旁人无权妄加揣测

波尔不再隐瞒!回应樊振东未回归国乒缘由,直言旁人无权妄加揣测

十点街球体育
2026-05-27 12:21:01
菲律宾凌晨生变,民众要换总统,马科斯对华改口,不救菲防长了?

菲律宾凌晨生变,民众要换总统,马科斯对华改口,不救菲防长了?

奥利奥变薄了的
2026-07-02 08:36:58
昆汀《杀死比尔:血色全传》定档8月7日内地上映

昆汀《杀死比尔:血色全传》定档8月7日内地上映

界面新闻
2026-07-02 11:26:48
2026-07-02 15:16:49
硅基观察Pro incentive-icons
硅基观察Pro
人工智能新时代的商业智库和价值灯塔
925文章数 66关注度
往期回顾 全部

财经要闻

千亿茶市场无赢家:澜沧巨亏 八马停"蹄"

头条要闻

中国超级计算机时隔9年重回世界第一 中方亮出底牌

头条要闻

中国超级计算机时隔9年重回世界第一 中方亮出底牌

体育要闻

世界杯硬核球迷,把自己变成了雕像

娱乐要闻

霍震霆回应霍启山娜然结婚传闻

科技要闻

奥特曼的新算盘:给白宫5%股权 换政策绿灯

汽车要闻

小鹏MONA L03 智能化水平拉满 还有玩法多样的巧思大空间

态度原创

教育
时尚
数码
艺术
公开课

教育要闻

两大名校集团联手,朝阳北部教育大变脸

月入3万,时代红利砸向文科生

数码要闻

红魔游戏平板5 PRO评测:RGB水冷灯效 把旗舰游戏体验揣进口袋

艺术要闻

光辉历程 时代丹青——庆祝中国共产党成立105周年美展 油画选

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版