网易首页 > 网易号 > 正文 申请入驻

教AI听懂人话,声网在AI淘金热中“卖铲子”

0
分享至

文| 趣解商业,作者 | 张语格,编辑 | 趣解商业·AI力场

语音对话,是用户与AI交互最常见的方式之一,大模型的语音对话能力已成为AI应用和硬件的关键能力。Deepgram 和 Opus Research 的调研显示,2025年,67% 的企业已将对话式AI 智能体置于战略核心位置,84% 的企业计划在未来一年增加相关投入

此外,“趣解商业”注意到,AI语音赛道正在密集地获得融资,OpenAI、Google等科技巨头也在密集发布自己的语音模型或语音产品。

在这个日渐火热的赛道里,一些为 AI 产品提供底层语音交互技术的平台型公司,正在AI产业中扮演越来越重要的角色。

AI对话的“硬伤”

在生成式 AI 的浪潮下,基于实时互动技术的对话式 AI 正加速在各行各业落地实践。

对话式AI整合了大语言模型(LLM)、自动语音识别(ASR)、文字转语音(TTS)、实时互动(RTE)等技术,当前已在情感陪伴、智能硬件、在线教育等场景中实现规模化落地,陪伴类玩具、智能眼镜、AI耳机等产品纷纷成为消费者争抢的对象。

然而,伴随消费热潮而来的还有居高不下的退货率。此前有媒体报道,AI毛绒玩具电商退货率高达30%-40%,有些品牌的AI眼镜退货率甚至在40%-50%。

究其原因,仍然当前 AI 硬件普遍面临交互生硬、情感连接弱、同质化严重等问题。有不少消费者表示,AI对话的体验像是机器人一样毫无感情“念稿”,没有真实感且不流畅。有网友在社媒平台上发帖表示,买的陪伴机器人到手体验后感觉“好笨、会答错、交互比较呆”,就退货了。


图源:小红书截图

“IT桔子”发布的“AIGC产品降速榜”显示,今年9月聊天机器人、写作工具等通用类AI产品的增速集体下降。“趣解商业”注意到,很多情况下AI产品被吐槽都是源于未能准确理解用户的需求。

行业数据显示,仅 21% 的用户对现有 AI 对话体验满意,部分服务的用户流失率高到“不可接受”。

声智科技副总裁黄赟贺表示,真正的语音交互不止于语言交流,在语言之外,AI还要分析用户声音的频率、振幅、波形,提取出情绪特征、识别不同的声源、声源距离、甚至预测用户的意图,“语调、音色、节奏、情绪,以及背景音乐、环境噪音(风声、雨声、车声)、物体发出的声音(开门声、打字声)这些环境中的各种非语音信息,也都是AI理解用户的重要方式。”

但是,想要AI在复杂的环境中理解用户意图,并且通过端到端准确传递给用户,还要克服不少技术瓶颈。在近期举办的Convo AI&RTE 2025第十一届实时互联网大会上,声网创始人兼CEO赵斌对话式AI的技术挑战概括为几点:低延迟响应、自然打断、上下文管理、情感理解与表达等

人类对话的延迟一般在400毫秒左右;有研究表明,当语音AI的响应延迟超过 500 毫秒时,用户体验会显著下降,导致对话中断或用户放弃使用。然而,传统的语音合成链路,从语音识别、大语言模型到语音合成,延迟能达到 2-3 秒,高延迟成了人机交互一大痛点。

AI产品的防干扰能力也很关键,如何识别哪些打断的指令来自用户,哪些是嘈杂的环境音,被用户打断补充后仍能流畅地给出回应,这既需要语音识别有声学基础,也要有足够的上下文记忆和理解能力。

对于用户来说,期待的不仅仅是一个能提供正确回答的机器,还是一个有“人味”的AI;如何解决这些挑战,则是对话式AI产品具备拟人感的关键。

AI浪潮中的“卖铲人”

声网联合 RTE 开发者社区发布的《2025 对话式 AI 应用场景热力榜单》显示,AI 语音助手、AI 社交与陪伴、AI 潮玩位列前三,充分说明对话式 AI 在个人助理与情感陪伴领域的强劲需求。而AI语音交互的需求,也带动了一批平台型语音技术公司迅速增长。

随着对话式 AI 技术的快速发展,VoiceAgent 是目前市场上极具代表性的产品形态;当前Voice Agent主要有两种主流架构方式——传统的级联模式和端到端模式。级联模式是将三个独立组件(语音识别、大模型推理、语音合成)串联起来的流水线,开发者可以自由选择不同公司的组件组装产品;端到端模式则是由模型内部处理,直接输出语音回复。

不同模式各有优劣,但无论哪种模式,都离不开稳定低延迟的实时传输技术作为底层支持。在此基础上,一批提供稳定传输网络的实时通信服务商开始迅速增长,例如即构科技、融云、科大讯飞、声网等。


图源:声网

有行业人士表示,相比大厂的泛用型云服务,这些垂类公司胜在音视频领域传输更稳定。例如声网,就是在全球搭建了自己的网络,全球任意两点之间都能保证传输效率,但大厂很难为单一的音频业务优化得这么细致。

作为“全球实时互动云第一股”,声网在过去多年持续攻坚“听到、听懂、理解”三大难题;据“趣解商业”了解,声网对话式 AI 相关用量在 2025 年第三季度实现 151% 的环比增长,展现出强劲的市场需求。

声网近期还推出了对话式 AI 引擎 2.0,对话式 AI 开发套件、对话式 AI 模型评测平台和对话式 AI Studio,加速对话式 AI 在实时互动行业的应用创新。声网创始人兼CEO赵斌表示,截至目前,声网年度服务分钟数首次突破1万亿分钟,标志着 RTE 技术已成为数字社会不可或缺的基础设施

据“趣解商业”了解,声网对话式 AI 引擎落地案例丰富,例如为豆神 AI 的互动课提供实时语音交互支撑,实现 AI 教师与学生自然流畅对话;为赋之家庭陪伴机器人打造情感化语音交互,增强陪伴体验;为珞博智能的 AI 宠物 Fuzozo 优化 AI 交互的实时性和稳定性,带来个性化情感陪伴体验。此外,MiniMax Chat、星野的语音对话功能,智谱清言的视频通话功能、商汤商量的实时音视频交互,背后都有声网的技术支撑。


图源:微博截图

声网推出对话式AI引擎后,将其视作新的增长曲线;然而从声网母公司Agora, Inc.( NASDAQ:API )发布的财报来看,目前这项业务的收入对公司业绩增长的贡献尚不明显

Agora, Inc.是Agora和声网两家独立企业的控股公司,它们的业务通过各自的子公司和可变利益实体进行管理。Agora, Inc.从今年一季度扭亏为盈,今年一季度和二季度分别收入3327万美元和3425.9万美元,同比增长0.8%和0.1%。

“趣解商业”注意到,今年上半年,面向中国市场的“声网中国”和面向海外市场的“Agora”业绩显露出不同的趋势,公司增长全部由面向海外市场的Agora贡献,而声网中国的收入则是连续两季度同比下降。

财报数据显示,Agora在2025年第二季度收入为1820万美元,同比增长16.7%,而声网中国收入为1.155亿元人民币(约合1610万美元),同比下降12.4%。Agora, Inc.在财报中解释,Agora的增长主要得益于业务拓展以及直播购物等领域使用量增长,具体来源于API调用增加还是对话式AI引擎产品的销售,无法确定;声网中国的收入减少则源于某些终端销售产品的停售,如果加上这部分则收入与去年同期基本持平。

“趣解商业”注意到,Agora, Inc.在电话会议中披露了声网中国的客户数量,截至3月末和6月末,其活跃客户数量分别为1994和1997,几乎没有增长。

另外值得注意的是,今年二季度,Agora, Inc.的研发费用为1400万美元,占总收入的40.9%,这对一家刚刚扭亏的公司而言仍是一笔不菲的支出;但相比去年同期的1810万美元研发费用,同比下降23.0%,主要原因是公司优化全球员工队伍,导致人员成本下降,其中包括股权激励费用从2024年第二季度的210万美元降至2025年第二季度的100万美元。



图源:声网财报截图

值得一提的是,今年Agora的核心高管也出现了人事变动。今年8月,Agora宣布公司董事、首席技术官和首席科学家钟声(Shawn)离职,其运营职责被移交给公司创始人、董事长兼首席执行官赵斌;现任公司声网(Agora)首席营收官、联合创始人Tony Wang和现任公司首席财务官的王静波已被任命为公司董事。

在AI浪潮中“卖铲子”是门好生意,但赚到钱的前提是“铲子”足够好用。为了拿出更多定制化、差异化的语音技术服务,声网这类垂直服务商需要持续的研发投入保持竞争优势。可以预见的是,随着多模态AI应用的普及,那些能够提供低延迟、高稳定性、自然交互体验的技术平台,将在下一轮竞争中占据更加有利的位置。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
停火期限即将到来,美伊都做两手准备,霍尔木兹海峡“开了又关”

停火期限即将到来,美伊都做两手准备,霍尔木兹海峡“开了又关”

环球网资讯
2026-04-20 06:40:55
天齐锂业Q1业绩“炸裂”!净利预增15至18倍,锂价回暖与投资收益双重共振|财报见闻

天齐锂业Q1业绩“炸裂”!净利预增15至18倍,锂价回暖与投资收益双重共振|财报见闻

华尔街见闻官方
2026-04-20 18:49:14
终其一生,满是遗憾

终其一生,满是遗憾

青苹果sht
2026-04-08 05:13:36
左小青这状态,鲨疯了!明媚动人,若隐若现

左小青这状态,鲨疯了!明媚动人,若隐若现

只要高兴就好
2025-12-10 19:09:26
看哭了!张雪车队64号频频摔车排名垫底原来他的作用根本不是拿奖

看哭了!张雪车队64号频频摔车排名垫底原来他的作用根本不是拿奖

刘哥谈体育
2026-04-21 00:06:55
河南平顶山动物园的狼见人就“作揖”讨吃的,游客质疑狼被饿着;园方:“作揖”属正常习性,每天喂一次,一只狼4斤肉

河南平顶山动物园的狼见人就“作揖”讨吃的,游客质疑狼被饿着;园方:“作揖”属正常习性,每天喂一次,一只狼4斤肉

大风新闻
2026-04-20 12:44:10
倒计时1天,赖清德将离台!郑丽文已见不到他,国防部下最后通牒

倒计时1天,赖清德将离台!郑丽文已见不到他,国防部下最后通牒

易昂杨
2026-04-20 21:11:29
化疗康复期女店主遭多名城管围阻,店招改造引发执法争议;多方回应

化疗康复期女店主遭多名城管围阻,店招改造引发执法争议;多方回应

大风新闻
2026-04-20 20:25:06
以牙还牙!解放军过航日本横当水道,前锋朝着日本本土九州!

以牙还牙!解放军过航日本横当水道,前锋朝着日本本土九州!

荆楚寰宇文枢
2026-04-20 23:09:20
世锦赛战报:中国1领先2落后,00后小将4-5大满贯!8位种子进16强

世锦赛战报:中国1领先2落后,00后小将4-5大满贯!8位种子进16强

小火箭爱体育
2026-04-21 06:13:24
万斯及美国代表团将在数小时内抵达巴基斯坦

万斯及美国代表团将在数小时内抵达巴基斯坦

财联社
2026-04-20 21:33:03
77枚金牌不是万能,国家队不再原谅王濛,狂妄自大只会被抛弃

77枚金牌不是万能,国家队不再原谅王濛,狂妄自大只会被抛弃

牛牛叨史
2024-07-09 16:59:07
马蹄露自荐做团长后续!张敬轩粉丝不忍了,开始发文攻击了

马蹄露自荐做团长后续!张敬轩粉丝不忍了,开始发文攻击了

小徐讲八卦
2026-04-19 11:27:40
花27万元拍下周口太昊陵庙会摊位的“标王”摊主已盈利,当事人:每天工作十多个小时卖猪蹄数千只,明年会继续竞拍

花27万元拍下周口太昊陵庙会摊位的“标王”摊主已盈利,当事人:每天工作十多个小时卖猪蹄数千只,明年会继续竞拍

极目新闻
2026-04-19 22:39:27
被记者问能否留任本菲卡,穆帅:你能保证明年还在这家电视台吗

被记者问能否留任本菲卡,穆帅:你能保证明年还在这家电视台吗

懂球帝
2026-04-20 10:40:11
浙江震元副总经理被立案调查,年薪43万元,兼任母公司董事

浙江震元副总经理被立案调查,年薪43万元,兼任母公司董事

红星资本局
2026-04-19 15:06:04
牡丹花下死!送走马蓉又迎冯清,43岁王宝强,终究栽进“女人坑”

牡丹花下死!送走马蓉又迎冯清,43岁王宝强,终究栽进“女人坑”

小兰聊历史
2026-04-13 02:09:34
查到问题根源上 改到群众心坎里(树立和践行正确政绩观)

查到问题根源上 改到群众心坎里(树立和践行正确政绩观)

人民网
2026-04-20 08:45:09
黄圣依17年终错付,杨子带23岁新女友见91岁母亲,铜钱盆抢镜

黄圣依17年终错付,杨子带23岁新女友见91岁母亲,铜钱盆抢镜

卷史
2026-04-18 13:54:59
宇树机器人打破人类1500米世界纪录:1.9公里4分13秒自主跑完

宇树机器人打破人类1500米世界纪录:1.9公里4分13秒自主跑完

快科技
2026-04-19 07:47:05
2026-04-21 06:52:49
钛媒体APP incentive-icons
钛媒体APP
独立财经科技媒体
132528文章数 862109关注度
往期回顾 全部

科技要闻

重磅官宣:库克卸任,特努斯接任苹果CEO

头条要闻

19岁女孩挪用自家1700万当"榜一大姐" 亲爹带女儿自首

头条要闻

19岁女孩挪用自家1700万当"榜一大姐" 亲爹带女儿自首

体育要闻

阿森纳已拼尽全力,但你早干嘛去了...

娱乐要闻

《八千里路云和月》田家泰暗杀

财经要闻

利润暴跌7成,字节到底在做什么

汽车要闻

把天门山搬进厂?开仰望U8冲上45度坡的那刻 我腿软了

态度原创

游戏
艺术
本地
房产
公开课

大司马回归两个月,某音人气稳居顶流行列,道出风光背后心酸现状

艺术要闻

春天最适合小住三五天的地方

本地新闻

12吨巧克力有难,全网化身超级侦探添乱

房产要闻

大规模商改住!海口西海岸,这波项目要赢麻了!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版