网易首页 > 网易号 > 正文 申请入驻

不用唤醒词就能对话,苹果的AI要先为Siri赋能

0
分享至

在放弃造车后,AI无疑就成为了空间计算之外,苹果未来持续增长的另一个引擎。毫无意外的是,继Android阵营友商开始造势“AI手机”后,有传言称苹果即将在今年秋季登场的iPhone 16系列和iOS 18上,AI就会占据不小的比重。就在苹果方面3月22日刚刚发表的一篇论文中,就透露了他们的研究人员正在尝试利用人工智能消除智能语音助手Siri的唤醒词。


这篇出现在预印本网站Arxiv的论文中显示,苹果的研究人员使用捕获的语音以及来自背景噪音等总计超过129小时的声学数据,训练了一个大型语言模型,该模型部分基于OpenAI的GPT-2构建,因为它相对轻量级,可以在智能手机等设备上运行。并且相关研究人员声称,该模型能够比纯音频或纯文本模型做出更准确的预测,并且会随着模型规模的扩大而进一步改进。

借助AI让用户不需要使用特定的“Hey Siri”唤醒词,随时随地与Siri展开对话,尽管可能不如“AI手机”那样看似高大上,但也更符合苹果一贯审慎地在iPhone上增加新功能的策略。必须要承认的是,Siri等智能语音助理是手机完成AI化的最佳切入点,而AI手机的理想形态,当然是将AI技术与操作系统整合,将AI的能力播洒在手机系统的每一个角落,最终达到润物细无声的效果。


只可惜,目前的端侧大模型也仅仅只是做到了在手机上运行大模型而已,用AI赋能操作系统,并通过API来支撑不同场景、不同任务还是镜花水月。由于现阶段端侧大模型与用户下载大模型App获得的体验没有质的区别,这也是为什么现在有不少人认为“AI手机”是伪命题。所以借助智能语音助手将AI大模型的能力提供给用户,并成为AI触达用户的入口,也是当下许多手机厂商最简单、且有效的解决方案。

五六年前,手机圈曾有过一轮智能语音助手热潮,诸如小爱同学、Jovi、小布、小艺等,也都曾作为新品发布会上的主角。得益于此,用语音助手来实现AI的认知早已埋藏在消费者的脑海中,所以用户用语音来作为媒介与AI进行自然语言对话,或许就是最符合当下普通用户对于AI的想象。


那么问题就来了,苹果利用人工智能来消除Siri的唤醒词到底有什么意义呢?

为什么智能语音助手会过气,使用体验不佳无疑是核心。借助Siri等语音助手用声音来操控手机,其实是一件很有未来感的事情,此前各大厂商在发布会上展示的效果,就已经有了科幻片中展现的未来生活范式味道。可当大家实际使用的时候却发现,“Hey Siri,打开抖音”、“小爱同学,打电话给张三”等操作与人类之间的对话有着明显区别,甚至可以说唤醒词的存在将用户从科幻拉回了现实。

实际上,为什么语音助手一定需要一个唤醒词呢?从某种程度上来说,唤醒词也成为了各厂商的招牌,是品牌形象的一个组成部分,通过每次激活语音助手时所说出的唤醒词,用户关于品牌的记忆也会在这日复一日的重复中被强化。除此之外,让语音助手一直处于激活状态会增加手机的功耗,进而导致用户感知到续航下降。


为了节能,手机厂商想出了语音唤醒(keyword spotting),并通过低功耗协处理器来实时监听麦克风,一旦监听到类似“Hey Siri”、“小爱同学”等提前设置的唤醒词时,就会将语音助手从休眠状态激活到工作状态。就像人类用姓名来区分个体一样,“Hey Siri”、“小爱同学”其实就是语音助手的名字。

其实语音唤醒技术的原理并不复杂,即利用声纹识别技术实现定向人声分离,将人声从复杂的环境噪声中挑选出来,再搭配声纹识别编码器,来准确分辨用户提前录制好的唤醒词声纹特征。说出唤醒词,就和人类发起与他人谈话时会叫出名字是一回事,但是人类之间的对话属于“一次唤醒、多轮交互”,我们还可以用视线、手势等其他感官辅助,让他人知道有人在和我对话。


但一边思考一边说话,就会造成用户在使用语音助手时需要重复唤醒,而这就成为了语音助手的命门。但如果想要做到无感化,让用户无需说出“Hey Siri”这类唤醒词、而语音助手知道用户准备和自己对话,这背后的差别可就大了。就好比我们不用说出对方的名字、对方却知道我们要与TA说话,就需要在庞杂的对话中精准分析出哪句话是对TA说的。用成语来形容,就是苹果希望做到Siri与用户之间达到“心有灵犀”的状态。

让Siri能听懂用户说话时的语境,通过收集海量的用户语音信息,预训练出一个专精于“察言观色”的大模型,就是这次苹果研发人员的核心工作。经过海量语料训练出的多模态大模型具有共情能力、会“读空气”,这是经过了实践检验的。可是免唤醒词激活语音助手是有风险的,因为这就意味着iPhone会全天候保持录音状态,以响应用户的对话需要,这背后蕴含着巨大的隐私安全风险。

要知道,时刻保持录音状态就意味着iPhone变成了一个用户身边的监听设备,在经过了此前大批智能音箱未经用户允许主动监听的风波,苹果方面显然知晓其中的风险。Siri则是目前智能语音助手中可以不向厂商分享数据,甚至能够只在设备端运行,而其被许多用户吐槽“智障”的原因,就是因为它不能使用云端算力。


隐私无疑是苹果如今为旗下设备主动营造的一张王牌,所以不可能为了AI、而让用户有其主动监听自己的感受。这也是为什么苹果会选择GPT-2,而非Mate Llama 2、谷歌Gemimi,乃至自家MM1等参数更大大模型的原因。能够实现端侧部署的大模型,才是苹果做到免唤醒词激活Siri的前提条件。不过如今小尺寸模型真的能做到在复杂声学条件下,准确识别用户语境的能力吗?

【本文图片来自网络】

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
太惨了!全线腰斩,中国消费者为啥不愿意为外资品牌汽车买单了?

太惨了!全线腰斩,中国消费者为啥不愿意为外资品牌汽车买单了?

看看娱乐与体育
2024-06-15 17:52:13
长得“歪瓜裂枣”,整得“美若天仙”,这7位女星都靠脸逆天改命

长得“歪瓜裂枣”,整得“美若天仙”,这7位女星都靠脸逆天改命

梦录的西方史话V
2024-06-08 08:42:43
突发!东莞东部快速横沥段高压线倒塌,现场照片流出,可谓惨烈…

突发!东莞东部快速横沥段高压线倒塌,现场照片流出,可谓惨烈…

火山诗话
2024-06-16 08:28:01
太逗!张常宁助中国女排逆转世界第一 被老公晒丑照 两人相爱相杀

太逗!张常宁助中国女排逆转世界第一 被老公晒丑照 两人相爱相杀

林小湜体育频道
2024-06-16 15:53:29
意大利大美妞总理毫不含糊,若俄不同意和平条件,就迫使其投降

意大利大美妞总理毫不含糊,若俄不同意和平条件,就迫使其投降

刀刀说事
2024-06-16 21:49:34
明天下定决心全部清仓!转融通,量化一日不取消,一日不交易

明天下定决心全部清仓!转融通,量化一日不取消,一日不交易

股海风云大作手
2024-06-16 19:00:54
复旦大学教授:基因检测证实成吉思汗很可能是汉高祖刘邦的后人

复旦大学教授:基因检测证实成吉思汗很可能是汉高祖刘邦的后人

黄丽搞笑小能手
2024-06-15 10:12:37
美国调转枪口还来得及吗?中国若能顶住,中美攻守互换在台海

美国调转枪口还来得及吗?中国若能顶住,中美攻守互换在台海

兵国大事
2024-06-16 00:06:24
6月14日俄乌:33年来最强有力的协议签署,乌克兰艰难时期已过

6月14日俄乌:33年来最强有力的协议签署,乌克兰艰难时期已过

山河路口
2024-06-14 14:05:47
6月13日俄乌最新:俄罗斯海军最强战队杀入美国后院

6月13日俄乌最新:俄罗斯海军最强战队杀入美国后院

西楼饮月
2024-06-13 15:12:33
中纪委周末再打“虎”:正部级吴英杰被查

中纪委周末再打“虎”:正部级吴英杰被查

澎湃新闻
2024-06-16 11:26:26
她曾是安徽省省长,后出任全国政协副主席,如今70岁仍在奋斗!

她曾是安徽省省长,后出任全国政协副主席,如今70岁仍在奋斗!

历史龙元阁
2024-06-16 15:35:31
数学老师说姜萍属于勤奋型选手,中考数学没答完卷,数学天赋在中专才逐渐显现出来

数学老师说姜萍属于勤奋型选手,中考数学没答完卷,数学天赋在中专才逐渐显现出来

封面新闻
2024-06-15 15:40:29
倪妮被偶遇造型惨不忍睹,小腹隆起像怀孕,皮肤很黄显老仪态变差

倪妮被偶遇造型惨不忍睹,小腹隆起像怀孕,皮肤很黄显老仪态变差

娱乐白名单
2024-06-16 13:36:32
31岁河南禹州市医保局局长任小龙,拟遴选进入省政府办公厅

31岁河南禹州市医保局局长任小龙,拟遴选进入省政府办公厅

澎湃新闻
2024-06-15 21:58:28
甘肃一女博士刚生完孩子,丈夫就冲进房间将其割喉:大快人心

甘肃一女博士刚生完孩子,丈夫就冲进房间将其割喉:大快人心

青丝人生
2024-05-24 20:04:21
嫦娥六号即将返回地球,欧空局发声明终止合作:不会参与嫦六嫦七

嫦娥六号即将返回地球,欧空局发声明终止合作:不会参与嫦六嫦七

科学黑洞v
2024-06-14 18:50:32
莫文蔚属于“诈骗”级别了吧

莫文蔚属于“诈骗”级别了吧

悠闲葡萄
2024-06-16 09:25:18
安徽中考谢谢你,墙都不扶,就服安徽出卷人

安徽中考谢谢你,墙都不扶,就服安徽出卷人

书中自有颜如玉
2024-06-16 21:16:42
喜当爹!王思聪父亲节最新回应,豪门最不缺的就是孩子

喜当爹!王思聪父亲节最新回应,豪门最不缺的就是孩子

布丁树洞
2024-06-16 21:36:01
2024-06-17 00:16:49
三易生活
三易生活
专注IT,最快最专业资讯!
53659文章数 12636关注度
往期回顾 全部

科技要闻

iPhone 16会杀死大模型APP吗?

头条要闻

欧洲猪肉业界:中国若限制进口将是梦魇

头条要闻

欧洲猪肉业界:中国若限制进口将是梦魇

体育要闻

没人永远年轻 但青春如此无敌还是离谱了些

娱乐要闻

上影节红毯:倪妮好松弛,娜扎吸睛

财经要闻

打断妻子多根肋骨 上市公司创始人被公诉

汽车要闻

售17.68万-21.68万元 极狐阿尔法S5正式上市

态度原创

本地
数码
时尚
公开课
军事航空

本地新闻

粽情一夏|海河龙舟赛,竟然成了外国人的大party!

数码要闻

酷似首饰盒,三星 Galaxy Ring 智能指环充电盒曝光

伊姐周日热推:电影《沙漏》;动漫《眷思量2》......

公开课

近视只是视力差?小心并发症

军事要闻

以军宣布在加沙南部实行"战术暂停"

无障碍浏览 进入关怀版