越来越多的家电品牌选择在产品上增加语音交互功能,提升产品附加值。然而,智能家电语音交互功能仍普遍存在“听不懂人话”“响应不及时”“交互不顺畅”等使用痛点。破局的关键在于:一是进一步提升语音交互的使用体验,二是降低语音算法、芯片等软硬件的成本。从目前的发展情况来看,语音交互技术在智能家电市场加速渗透,即将迎来大规模普及。
![]()
从试水到成熟,家电语音交互技术需求加速增长
语音技术应用于家电产品历经两个过程,即试水、成熟。
某业内人士表示:“从2012年开始,一些家电企业看到语音交互技术应用于家电的可能性。于是,在2012~2022年10年的时间里,越来越多的家电企业开始试水语音交互技术。随着语音算法加快演进,2023~2025年,新芯片成本逐渐下降。当使用体验变好、成本下降时,语音交互技术在家电行业的市场渗透率也随之提升。因此,从2023年开始,尤其是今年,语音交互技术在家电产品上的应用愈发成熟。”
语音交互技术改进产品使用体验,使得布局这一市场的品牌销售数据也非常亮眼。
据《电器》记者了解,目前布局家电语音技术的企业主要有聆思科技、思必驰、云知声、启英泰伦等。其中,聆思科技和启英泰伦在芯片和算法方面都有布局,不同的是,聆思科技聚焦在线语音和离线语音两条技术路线,启英泰伦则着力布局离线语音技术。思必驰和云知声侧重于语音算法,一般会与其他芯片厂合作,比如瑞昱半导体,共同输出语音控制解决方案。
通过采访得知,聆思科技自2020年创办以来,家电语音业务始终保持远超行业的增长速度。启英泰伦方面表示,2024年,公司家电语音业务较2023年增长超过100%,今年预估也会快速增长。思必驰有关负责人也坦言,近两年,思必驰的智能家电语音业务营收保持强劲的增长势头。
![]()
在线、离线语音技术双线发展
从技术层面来看,家电语音交互技术的发展历程还有另一个版本。某业内人士告诉《电器》记者,企业的选择经历了从最初的在线语音技术,到离线语音技术,再到离线+在线复合语音方式的转变。在GhatGPT等AI大模型问世后,企业又看好在线语音技术。如今的趋势是,由于离线语音技术成本低于在线语音技术,但在线语音技术具有无法取代的优势,基于成本、产品需求等考虑,家电企业双向推进离线语音和在线语音技术。
就当下的发展情况,成都启英泰伦科技有限公司创始人、董事长何云鹏也认为,在线语音和离线语音是相辅相成、互相补充的,不同的使用场景和用户需求会有不同的语音交互方式。比如,电视机需要搜索节目名称、电视频道,运用在线语音是最合适的。而电风扇只需要进行一些简单功能的控制,比如开关风扇,不需要从云端获取其他在线内容,离线语音再合适不过。又比如,吸油烟机进行开关机、调节风量操作时用离线语音响应最快速,若查询菜谱,则需要用到在线语音技术。
具身机器人是离线语音和在线语音都会用到的新兴领域。据介绍,具身机器人需要跨场景服务,日常生活中不仅需要帮助用户解答很多问题,还需要执行诸如炒菜、叠衣服、拖地等纷繁复杂的操作。若想使用体验够“丝滑”,具身机器人内置的在线语音和离线语音技术的能力都需要足够强。
综合来看,离线语音更注重保护用户隐私、低延迟、不依赖网络,在控制类家电中更具普适性。在线语音依托云端强大的计算能力,能够实现更复杂的语义理解和更丰富的服务内容,支持不断学习和升级,更适合内容服务类设备。
![]()
创新解决方案相继推出,家电行业普及应用指日可待
尽管市场热度很高,但是智能家电语音交互技术本身还存在很多问题。具体来看,语音交互技术在黑电、白电和小家电品类应用更为成熟。这类产品功能相对明确,指令标准化程度高,但是语音交互的唤醒率、识别率、误触发率还需改进。另外,家用机器人(如扫地机器人)、智能厨电及全屋智能系统正成为语音交互技术创新应用的前沿阵地。其中,家用机器人面临移动噪声与位置变化的双重挑战,为了确保设备在移动中依然“听得清、听得准”,语音交互技术的强抗噪与动态声源追踪能力需提高;智能厨电面临厨房环境噪声复杂且用户双手常被占用的挑战,对语音交互技术需求的重点在于强噪声下的高识别率与“一语多意”的高效理解;全屋智能系统最大的挑战是多设备协同,多个智能家电在同一空间,对语音技术的要求是避免出现“一次唤醒多个响应”的问题。
为了解决这些核心述求,思必驰以“听得清、听得懂、会响应”为路径,构建了全链路的语音交互方案。据思必驰有关负责人介绍,在“听得清”层面,思必驰创新性地融合多项智能感知技术,智慧聆听技术集成声源定位、波束成形与回声消除,能够在强噪声环境中精准捕获目标人声,即使在厨房炒菜、卫生间用水等强噪声场景下,也能准确捕捉用户指令。在“听得懂”层面,思必驰实现了从传统模型到生成式大模型的自然融合,既保障控制指令的确定性,又实现开放域的泛化理解。在“会响应”层面,思必驰采用快慢相结合的“思考模式”,通过小模型实现快思考,简单问题秒回,通过大模型实现深思考,复杂问题深度分析后给出回应。
启英泰伦是离线语音技术的重要供应商,对于离线语音技术目前存在的问题了然于胸。何云鹏指出,受限于语音芯片的存储空间,目前市面上离线语音家电内置的词条从几十条到几百条不等,但是家电的功能越来越丰富,导致家电的每个功能只能设置一个词或者几个词,用户必须严格按照这些固定的词条来操控,从而面临用户记不住词,“家电听不懂人话”的窘境。针对这一痛点,启英泰伦推出“离线自然说”(轻量级离线语义理解NLP)技术,支持几十万级别的日常口语说法,为用户提供更自然、更灵活、更智能的语音交互体验。他强调,这个技术推出后很受客户青睐,市场反馈很好。
与Wi-Fi模块在家电行业的发展轨迹类似,语音交互技术在家电行业的推广也即将进入普及阶段。
某业内人士预计,2027~2028年,单个语音芯片的价格有望低于10元。在他看来,届时,随着家电语音交互从“单一指令执行”向“自然多轮对话”和“主动服务”演进,不断满足用户对品质生活的追求,语音交互技术在家电行业的应用将加速推进,有望迎来高峰,全行业普及也将指日可待。(本刊记者 邓雅静)
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.