声网这份财报,有点像一家公司重新找座位。
![]()
过去大家看声网,关键词很简单:实时音视频、RTC、低延迟、通信PaaS。说白了,它是做“连线”的公司。直播、社交、在线教育、语音房、视频通话,只要你需要稳定、低延迟的实时互动,声网就在后面做底座。
但到了2026年一季度,声网给市场讲了一个新故事:它不只是RTC公司了,它要切进语音Agent基础设施
这个变化不是一句口号。
一季度,声网收入3770万美元,同比增长13.5%;活跃客户3946个,同比增长3.8%;DBNER回到99%;GAAP净利润110万美元,连续第六个季度实现GAAP盈利。更重要的是,公司二季度收入指引达到3900万至4000万美元,对应同比增长13.7%到16.6%,增速还在往上走。
表面看,这是一份小而稳的财报。
但财报里真正有价值的地方,是声网把自己定位成了“Conversational AI和实时互动技术平台”,还重点推了Agent Studio。这个产品可以让企业用无代码方式创建、部署和规模化语音AI Agent,内置客服、外呼营销等模板。
换句话说,声网想做的不是一个会聊天的机器人。
它想做的是:让AI开口说话,并且说得稳、说得快、说得像一个真正能干活的系统。
这事听起来没有大模型参数那么性感,但更接近商业落地。
语音Agent不是玩具,它需要一套“不会掉线”的底层系统
很多人一听语音Agent,第一反应是:这不就是AI客服吗?
不完全是。
普通聊天机器人可以慢一点。你问一句,它想两秒,问题不大。
语音Agent不行。
你打电话给客服,对面AI卡住三秒,你会立刻觉得它像坏了。它听不清、插不上话、打断不自然、延迟太高,体验都会崩。
所以语音Agent真正难的不是“会不会说话”,而是能不能在真实对话里跑起来。
它要处理语音识别、降噪、语义理解、大模型推理、语音合成、多语言、打断、情绪、业务流程,还要保证网络稳定。你在客服中心、汽车销售、在线教育、金融催收、IoT陪伴设备里用,要求还都不一样。
这就是声网的机会。
声网原来的核心能力,是实时音视频和低延迟网络。以前它帮人和人连起来,现在它想帮人和AI连起来。
这个迁移很自然。
从视频会议到语音Agent,底层都是实时互动。区别在于,过去对面是人,现在对面是AI。过去拼的是通话质量,现在拼的是“通话质量+AI理解+行业流程”。
声网的Agent Studio,就是要把这些东西打包起来。企业不需要自己从零接ASR、大模型、TTS、降噪、实时网络和对话流程,而是在一个平台里搭出自己的语音Agent。
所以我觉得,声网的AI业务不能简单理解成一个工具。
它更像一个平台型产品。
不是“给企业加一个AI按钮”,而是把实时互动、大模型调用和语音工作流揉在一起,变成一套可以部署的系统。
这也是它和OpenAI、Anthropic这些公司的差别。声网不做最强大脑,它做“让大脑开口说话的通道”。
这个位置不在聚光灯最中间,但很实用。
尤其到了Agent时代,AI不能只在文本框里回答问题。它要打电话、接电话、陪练、推销、提醒、复盘、处理任务。AI从屏幕走向声音,声网就有了重新被看见的理由。
AI带来了新增长,也先把毛利率压了一下
不过,这份财报不能只写兴奋点。
声网的AI故事,已经进入了成本端。
一季度,公司收入成本同比增长29.9%,原因包括带宽、服务器成本上升,以及Conversational AI产品相关成本增加。毛利率从去年同期的68.0%降到63.4%。
这个变化很关键。
很多公司讲AI,都喜欢说“AI带来效率提升”。但声网这份财报告诉我们,AI也会先带来成本。
尤其是语音Agent这种产品。客户前期要测试、试点、接入、调流程,很多项目还在POC阶段,收入贡献不大,但服务器、带宽、工程投入已经开始发生。
这就有点像开一家新店。
门店装修、设备、试营业、人员培训都要先花钱,至于客流什么时候稳定,还得等一段时间。
声网现在就是这个状态。
管理层也讲得比较直接:Conversational AI目前还处在sub-scale阶段,很多POC客户和实验性项目会产生成本,但收入还不够多。公司预计到夏季前后,AI相关业务能达到约5%的收入贡献。长期看,如果客户从测试转向部署,毛利率有机会转正,并接近甚至高于原来的RTE业务。
这个说法很重要。
因为它把声网的AI战略拆成了两个阶段:
第一阶段,AI压毛利。
第二阶段,AI拉客单价。
现在声网还在第一阶段和第二阶段之间。
如果AI业务只是试点很多、收入很少、成本不断上升,那市场会很快失去耐心。小公司最怕这个:故事不错,但利润表先被打穿。
但如果接下来POC客户开始转化为正式部署,尤其是在呼叫中心、外呼营销、IoT陪伴设备这些场景里跑出稳定收入,声网的估值框架就会变。
它不再只是一个低成长RTC公司,而是语音Agent时代的底层连接层。
这就是这份财报最值得盯的地方。
不是收入增长13.5%本身,也不是GAAP盈利本身,而是AI到底能不能从成本项,变成收入项。
说得更直白一点:
声网现在的问题不是有没有AI,而是AI什么时候开始赚钱。
声网能不能被重新估值,关键看它是不是“语音Agent的底层网络”
资本市场怎么重新看声网?
如果还按传统RTC看,它的估值空间不大。
RTC是成熟市场。客户增长不会无限快,价格也有竞争压力。直播、社交娱乐、在线互动这些场景,已经不像前几年那么容易讲高增长故事。
但如果按语音Agent基础设施看,声网就有新的想象空间。
因为语音Agent不是一个单一应用,而是一类新交互方式。
客服要用。
销售要用。
教育陪练要用。
车载助手要用。
IoT陪伴设备也要用。
以后我们和AI交互,不可能永远只打字。尤其在车里、家里、门店、客服中心,语音会是最自然的入口。
这里有一个很现实的体验判断:
如果一个AI能写得很好,但说话卡顿、听不清、反应慢,它在真实世界里就很难用。
所以语音Agent的底层能力,不只是“有没有模型”,还包括实时网络、音频处理、低延迟交互、多语言、业务流程编排。
这正是声网擅长的部分。
当然,声网也不是没有对手。
美国有Twilio这样的通信平台,有LiveKit这类实时音视频基础设施公司,还有一堆语音Agent创业公司。大模型公司自己也在往语音交互走。这个赛道不会便宜。
声网的差异点在于,它不是从模型出发,也不是从单一应用出发,而是从实时互动基础设施出发。它更像中间层:上接大模型,下接企业和用户。
这个位置好不好?
好处是,不需要和OpenAI拼模型。
坏处是,必须证明企业真的愿意为这层能力付费。
所以未来两个季度,投资者真正该看的,不是声网又发布了多少AI功能,而是几个硬指标。
第一,Conversational AI收入占比能不能接近管理层说的5%。
第二,POC客户能不能转成正式付费部署。
第三,毛利率能不能止跌。
第四,DBNER能不能从99%继续回升。
第五,AI客户有没有更清晰的行业案例,比如客服中心、车载、IoT、教育陪练。
第六,收入指引能不能持续上修,而不是只靠一两个季度恢复。
如果这些指标兑现,声网有机会从“RTC恢复股”切到“语音Agent基础设施股”。
这个估值切换很重要。
前者看的是通话量和客户数量。
后者看的是AI Agent使用量、行业渗透、部署转化率和单位经济模型。
差别不小。
结语:声网不是AI利润故事,但已经不是普通RTC故事了
声网这份财报,我觉得最有意思的地方,是它没有把AI讲得特别宏大。
它没有说自己要做通用大模型,也没有说自己要颠覆所有行业。
它讲的是一件更具体的事:让企业更容易部署语音AI Agent。
这个方向不华丽,但商业味很浓。
AI客服、AI销售、AI陪练、AI车载助手、AI玩具,这些场景都不一定需要最强模型,但都需要稳定、低延迟、能说会听的交互能力。
声网正好在这里有老本行。
所以,我对声网的判断是:
它的AI战略已经进入财务兑现早期,但还没有完成估值重构。
不是纯故事。因为AI已经进了产品、客户需求、成本结构和收入预期。
也不是成熟利润故事。因为AI收入占比还低,毛利率还在承压,POC转化还需要验证。
它现在更像一个左侧资产。
左侧的意思是:逻辑已经开始变,但财报还没完全证明。
如果接下来语音Agent收入开始放量,毛利率止跌,客户从试点走向规模化部署,声网就有机会重新被市场定价。它不再只是那个做RTC的公司,而是AI和真实用户之间的实时连接层。
但如果AI业务迟迟不能转化,成本继续上来,毛利率继续下去,那市场也会很快翻脸。
AI时代不缺故事。
缺的是能把故事跑进收入表、毛利率和现金流的公司。
声网现在站在门口。
一只脚已经迈进语音Agent,另一只脚还踩在RTC时代。
接下来两个季度,才是真正的验证期。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.