网易首页 > 网易号 > 正文 申请入驻

教AI听懂人话,声网在AI淘金热中“卖铲子”

0
分享至

文| 趣解商业,作者 | 张语格,编辑 | 趣解商业·AI力场

语音对话,是用户与AI交互最常见的方式之一,大模型的语音对话能力已成为AI应用和硬件的关键能力。Deepgram 和 Opus Research 的调研显示,2025年,67% 的企业已将对话式AI 智能体置于战略核心位置,84% 的企业计划在未来一年增加相关投入

此外,“趣解商业”注意到,AI语音赛道正在密集地获得融资,OpenAI、Google等科技巨头也在密集发布自己的语音模型或语音产品。

在这个日渐火热的赛道里,一些为 AI 产品提供底层语音交互技术的平台型公司,正在AI产业中扮演越来越重要的角色。

AI对话的“硬伤”

在生成式 AI 的浪潮下,基于实时互动技术的对话式 AI 正加速在各行各业落地实践。

对话式AI整合了大语言模型(LLM)、自动语音识别(ASR)、文字转语音(TTS)、实时互动(RTE)等技术,当前已在情感陪伴、智能硬件、在线教育等场景中实现规模化落地,陪伴类玩具、智能眼镜、AI耳机等产品纷纷成为消费者争抢的对象。

然而,伴随消费热潮而来的还有居高不下的退货率。此前有媒体报道,AI毛绒玩具电商退货率高达30%-40%,有些品牌的AI眼镜退货率甚至在40%-50%。

究其原因,仍然当前 AI 硬件普遍面临交互生硬、情感连接弱、同质化严重等问题。有不少消费者表示,AI对话的体验像是机器人一样毫无感情“念稿”,没有真实感且不流畅。有网友在社媒平台上发帖表示,买的陪伴机器人到手体验后感觉“好笨、会答错、交互比较呆”,就退货了。


图源:小红书截图

“IT桔子”发布的“AIGC产品降速榜”显示,今年9月聊天机器人、写作工具等通用类AI产品的增速集体下降。“趣解商业”注意到,很多情况下AI产品被吐槽都是源于未能准确理解用户的需求。

行业数据显示,仅 21% 的用户对现有 AI 对话体验满意,部分服务的用户流失率高到“不可接受”。

声智科技副总裁黄赟贺表示,真正的语音交互不止于语言交流,在语言之外,AI还要分析用户声音的频率、振幅、波形,提取出情绪特征、识别不同的声源、声源距离、甚至预测用户的意图,“语调、音色、节奏、情绪,以及背景音乐、环境噪音(风声、雨声、车声)、物体发出的声音(开门声、打字声)这些环境中的各种非语音信息,也都是AI理解用户的重要方式。”

但是,想要AI在复杂的环境中理解用户意图,并且通过端到端准确传递给用户,还要克服不少技术瓶颈。在近期举办的Convo AI&RTE 2025第十一届实时互联网大会上,声网创始人兼CEO赵斌对话式AI的技术挑战概括为几点:低延迟响应、自然打断、上下文管理、情感理解与表达等

人类对话的延迟一般在400毫秒左右;有研究表明,当语音AI的响应延迟超过 500 毫秒时,用户体验会显著下降,导致对话中断或用户放弃使用。然而,传统的语音合成链路,从语音识别、大语言模型到语音合成,延迟能达到 2-3 秒,高延迟成了人机交互一大痛点。

AI产品的防干扰能力也很关键,如何识别哪些打断的指令来自用户,哪些是嘈杂的环境音,被用户打断补充后仍能流畅地给出回应,这既需要语音识别有声学基础,也要有足够的上下文记忆和理解能力。

对于用户来说,期待的不仅仅是一个能提供正确回答的机器,还是一个有“人味”的AI;如何解决这些挑战,则是对话式AI产品具备拟人感的关键。

AI浪潮中的“卖铲人”

声网联合 RTE 开发者社区发布的《2025 对话式 AI 应用场景热力榜单》显示,AI 语音助手、AI 社交与陪伴、AI 潮玩位列前三,充分说明对话式 AI 在个人助理与情感陪伴领域的强劲需求。而AI语音交互的需求,也带动了一批平台型语音技术公司迅速增长。

随着对话式 AI 技术的快速发展,VoiceAgent 是目前市场上极具代表性的产品形态;当前Voice Agent主要有两种主流架构方式——传统的级联模式和端到端模式。级联模式是将三个独立组件(语音识别、大模型推理、语音合成)串联起来的流水线,开发者可以自由选择不同公司的组件组装产品;端到端模式则是由模型内部处理,直接输出语音回复。

不同模式各有优劣,但无论哪种模式,都离不开稳定低延迟的实时传输技术作为底层支持。在此基础上,一批提供稳定传输网络的实时通信服务商开始迅速增长,例如即构科技、融云、科大讯飞、声网等。


图源:声网

有行业人士表示,相比大厂的泛用型云服务,这些垂类公司胜在音视频领域传输更稳定。例如声网,就是在全球搭建了自己的网络,全球任意两点之间都能保证传输效率,但大厂很难为单一的音频业务优化得这么细致。

作为“全球实时互动云第一股”,声网在过去多年持续攻坚“听到、听懂、理解”三大难题;据“趣解商业”了解,声网对话式 AI 相关用量在 2025 年第三季度实现 151% 的环比增长,展现出强劲的市场需求。

声网近期还推出了对话式 AI 引擎 2.0,对话式 AI 开发套件、对话式 AI 模型评测平台和对话式 AI Studio,加速对话式 AI 在实时互动行业的应用创新。声网创始人兼CEO赵斌表示,截至目前,声网年度服务分钟数首次突破1万亿分钟,标志着 RTE 技术已成为数字社会不可或缺的基础设施

据“趣解商业”了解,声网对话式 AI 引擎落地案例丰富,例如为豆神 AI 的互动课提供实时语音交互支撑,实现 AI 教师与学生自然流畅对话;为赋之家庭陪伴机器人打造情感化语音交互,增强陪伴体验;为珞博智能的 AI 宠物 Fuzozo 优化 AI 交互的实时性和稳定性,带来个性化情感陪伴体验。此外,MiniMax Chat、星野的语音对话功能,智谱清言的视频通话功能、商汤商量的实时音视频交互,背后都有声网的技术支撑。


图源:微博截图

声网推出对话式AI引擎后,将其视作新的增长曲线;然而从声网母公司Agora, Inc.( NASDAQ:API )发布的财报来看,目前这项业务的收入对公司业绩增长的贡献尚不明显

Agora, Inc.是Agora和声网两家独立企业的控股公司,它们的业务通过各自的子公司和可变利益实体进行管理。Agora, Inc.从今年一季度扭亏为盈,今年一季度和二季度分别收入3327万美元和3425.9万美元,同比增长0.8%和0.1%。

“趣解商业”注意到,今年上半年,面向中国市场的“声网中国”和面向海外市场的“Agora”业绩显露出不同的趋势,公司增长全部由面向海外市场的Agora贡献,而声网中国的收入则是连续两季度同比下降。

财报数据显示,Agora在2025年第二季度收入为1820万美元,同比增长16.7%,而声网中国收入为1.155亿元人民币(约合1610万美元),同比下降12.4%。Agora, Inc.在财报中解释,Agora的增长主要得益于业务拓展以及直播购物等领域使用量增长,具体来源于API调用增加还是对话式AI引擎产品的销售,无法确定;声网中国的收入减少则源于某些终端销售产品的停售,如果加上这部分则收入与去年同期基本持平。

“趣解商业”注意到,Agora, Inc.在电话会议中披露了声网中国的客户数量,截至3月末和6月末,其活跃客户数量分别为1994和1997,几乎没有增长。

另外值得注意的是,今年二季度,Agora, Inc.的研发费用为1400万美元,占总收入的40.9%,这对一家刚刚扭亏的公司而言仍是一笔不菲的支出;但相比去年同期的1810万美元研发费用,同比下降23.0%,主要原因是公司优化全球员工队伍,导致人员成本下降,其中包括股权激励费用从2024年第二季度的210万美元降至2025年第二季度的100万美元。



图源:声网财报截图

值得一提的是,今年Agora的核心高管也出现了人事变动。今年8月,Agora宣布公司董事、首席技术官和首席科学家钟声(Shawn)离职,其运营职责被移交给公司创始人、董事长兼首席执行官赵斌;现任公司声网(Agora)首席营收官、联合创始人Tony Wang和现任公司首席财务官的王静波已被任命为公司董事。

在AI浪潮中“卖铲子”是门好生意,但赚到钱的前提是“铲子”足够好用。为了拿出更多定制化、差异化的语音技术服务,声网这类垂直服务商需要持续的研发投入保持竞争优势。可以预见的是,随着多模态AI应用的普及,那些能够提供低延迟、高稳定性、自然交互体验的技术平台,将在下一轮竞争中占据更加有利的位置。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
瞒不住了?日本偷挖466具琉球人遗骨,还怪中方不该替琉球人说话

瞒不住了?日本偷挖466具琉球人遗骨,还怪中方不该替琉球人说话

文史微鉴
2025-11-17 15:52:59
李湘一家人现身机场,穿黑色也遮不住肉肉,这得有200斤了吧

李湘一家人现身机场,穿黑色也遮不住肉肉,这得有200斤了吧

阿笎评论哥
2025-11-17 10:54:21
一个时代的尽头:当澳门的灯光开始熄灭

一个时代的尽头:当澳门的灯光开始熄灭

七分日记
2025-11-18 00:09:38
勇士“水花兄弟”已经落幕,火箭“火花兄弟”冉冉升起

勇士“水花兄弟”已经落幕,火箭“火花兄弟”冉冉升起

mvpmade
2025-11-17 07:50:06
其实很多人没有发现,今天的中国崛起速度,其实是很反常的

其实很多人没有发现,今天的中国崛起速度,其实是很反常的

扶苏聊历史
2025-11-17 14:58:36
拜合拉木?城市足球集团高管:希望有中国球员加入曼城一线队!

拜合拉木?城市足球集团高管:希望有中国球员加入曼城一线队!

邱泽云
2025-11-17 15:25:27
混音队主帅:杨瀚森安排还未定,把简单事情做得更好也是进步

混音队主帅:杨瀚森安排还未定,把简单事情做得更好也是进步

懂球帝
2025-11-17 14:02:11
他们把我当疯子折磨,爷爷的千亿家产早已全数转到我一人名下

他们把我当疯子折磨,爷爷的千亿家产早已全数转到我一人名下

深夜列车故事集
2025-11-17 12:41:13
比亚迪“大唐”登场?延续IP还是新创不是问题,关键在于市场定位

比亚迪“大唐”登场?延续IP还是新创不是问题,关键在于市场定位

光电科技君
2025-11-17 14:42:57
蒋介石私生活有多混乱?贴身秘书晚年才敢说破,宋美龄的做法绝了

蒋介石私生活有多混乱?贴身秘书晚年才敢说破,宋美龄的做法绝了

百态人间
2025-11-17 16:43:41
直到看到陈思诚在金鸡奖的获奖感言,才明白佟丽娅离婚是明智之举

直到看到陈思诚在金鸡奖的获奖感言,才明白佟丽娅离婚是明智之举

冷紫葉
2025-11-17 22:16:51
2026年最享福有钱的生肖女,原来真有她们!看完你就懂了!

2026年最享福有钱的生肖女,原来真有她们!看完你就懂了!

毅谈生肖
2025-11-17 12:52:46
枪手遭重创!曝加布兽伤停3-6周 两大新援将竞争上岗

枪手遭重创!曝加布兽伤停3-6周 两大新援将竞争上岗

球事百科吖
2025-11-17 16:45:41
赖斯:图赫尔让我们变得更自信;世界杯时替补和首发同样重要

赖斯:图赫尔让我们变得更自信;世界杯时替补和首发同样重要

懂球帝
2025-11-18 03:29:21
全运女排四强决出一席!让赵勇笑不出来,张常宁龚翔宇吐气扬眉

全运女排四强决出一席!让赵勇笑不出来,张常宁龚翔宇吐气扬眉

小彭美识
2025-11-17 11:51:05
奥迪新车曝光:11月21日,正式发布!

奥迪新车曝光:11月21日,正式发布!

高科技爱好者
2025-11-17 23:14:01
45岁董洁在北京定居,住豪宅不请保姆不通暖气,还要自己洗衣做饭

45岁董洁在北京定居,住豪宅不请保姆不通暖气,还要自己洗衣做饭

娱圈小愚
2025-11-16 11:04:29
长治反杀案反转!通话记录铁证揭示,三大破绽确认正当防卫

长治反杀案反转!通话记录铁证揭示,三大破绽确认正当防卫

行走的知识库
2025-11-17 06:10:53
攻又攻不进守又守不住,开拓者竟然还敢让他留在轮换阵容中?

攻又攻不进守又守不住,开拓者竟然还敢让他留在轮换阵容中?

稻谷与小麦
2025-11-17 23:01:12
为啥美国马桶有缺口,我国的马桶没有,缺口设计有啥特殊用意吗?

为啥美国马桶有缺口,我国的马桶没有,缺口设计有啥特殊用意吗?

诗意世界
2025-11-12 20:20:39
2025-11-18 03:51:00
钛媒体APP incentive-icons
钛媒体APP
独立财经科技媒体
126362文章数 861409关注度
往期回顾 全部

科技要闻

京东外卖要“独立” 刘强东还宣战“点评”

头条要闻

该聊聊琉球问题了 日本国内集体破大防

头条要闻

该聊聊琉球问题了 日本国内集体破大防

体育要闻

当家球星受伤后,球迷乐翻了天?

娱乐要闻

金鸡奖是“照妖镜”,揭露人情冷暖?

财经要闻

高市早苗的算计,将让日本割肉5000亿

汽车要闻

新增CDC后变化大吗? 试驾特斯拉model Y L

态度原创

数码
健康
房产
本地
公开课

数码要闻

铭瑄AMD B850 / X870主板新品确认对未来处理器支持

血液科专家揭秘白血病七大误区

房产要闻

首开狂卖6.68亿!海口这个顶级教育红盘,引爆海口楼市!

本地新闻

这档古早综艺,怎么就成了年轻人的哆啦A梦?

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版