网红机器人是骗局？语音助手的水平究竟怎样

2018-03-23 08:36:33 举报

分享至

3月21日，猎豹CEO傅盛一口气发布了多款机器人产品，但值得注意的是，在发布自家产品之前，傅盛拆穿了交通银行的机器人娇娇和机器人索菲亚的人工智能对话都是假象。难道，网络中那些带有人工智能语音的机器人都是假的？

网红机器人

2015年的时候，交通银行的智能机器人“娇娇”刷爆了网络，这款萌萌哒的机器人出现在交行的很多分行中，它可以通过语言识别、人脸识别、触摸交互、肢体语言等方式，开展迎宾、业务引导、业务查询等多种服务类型，而且还会唱歌、讲笑话、跳圈圈舞。面对用户的提问时，其超高的智能和机智的回答仿佛人类已经步入人工智能时代。

但是据傅盛透露，娇娇是一个真人的视频系统，它的声音是通过变音软件把客服的声音变出来的，是客服通过摄像头坐在远程的监控室里，然后装扮成机器人。

相比娇娇而言，机器人索菲亚拥有更多的鲜花和掌声，作为历史上首个获得公民身份的机器人她红遍了全球，它的连珠妙语令人津津乐道，甚至还说过要毁灭人类的言论。就在同一天，索菲亚还出席了3月21日的某次联合国会议，与主持人侃侃而谈。

但是傅盛爆料，索菲亚的有些言论是提前录制好的，满满的都是套路啊。

智能语音的真实水平

如果娇娇和索菲亚都不能算是真正的人工智能话，那么如今人工智能的水平究竟如何呢？

这让帮尼想起了前不久亚马逊举办的“亚马逊AI大赛”，打造一个真正能够闲聊的机器人，要求比赛中采用的人工智能系统需要与主持人闲聊20分钟。这次比赛吸引了全球22个国家的100多个大学团队申请参赛，结果仅有一支队伍成功达成了目标，绝大多数的团队成果都不足10分钟。

亚马逊的AI比赛证明了会话式的人工智能还处于早期阶段，面对生活中常见的口头禅、脏话、俚语，或是含糊不清的语句时，人工智能机器人立刻就会原形毕露，语言的结构使得它们智能应对那些更为精准的内容，而且生活中的任何干扰项都会影响到人工智能语音的准确性。

就像傅盛所说，现在全世界范围内没有一家公司可能做到类似于机器人娇娇那样的对话水平，随时被打断、无论距离有多远，声音中是否有噪音，而且多人一起说话，每句的语义能理解的那么清晰，这一定做不到。

语言识别的困境

语言是一种主观性较强的表达方式，不同的人所采用的说话规则是千变万化的。这与计算机程序有明显的不同，而人们通过语言表达并不会完全受制于规则，能够自由的遣词造句，并以此来传递信息，更何况我们常用的汉语有着非常复杂的语法，而且有些时候，不同的语言顺序并不会影响语义，再加上大量的地方方言以及那些心照不宣的“暗语”和“梗”。想要通过一套人工智能语音体系来应对不同的用户，其难度可想而知。

目前人工智能深度学习能够做到的事情，主要还是字符识别、语音识别、人脸识别这些，而且这些问题难以变通，这些语音助手在面对用户时，简单的语言识别难以真正为提供较为复杂的辅助工作，而复杂一点的识别方式也难以适用于更开放的应用场景。

语音分析和人工智能软件就像一个黑匣子，这些软件只有开发人员才能真正理解，所以面对苹果的Siri时，调戏这个语音助手成为唯一的乐趣，因为很难与它进行复杂的聊天与沟通。至于精准度方面，2016年时微软也仅仅将错误率控制在5.8%左右。可是在金融、医疗等领域，1%的错误率导致的可能就是财产的损失和生命的安全，听错一个数字就有可能毁掉整个人工智能系统。

帮尼有话说

人工智能机器人存在的目的是为人们提供便利，生活中我们也会看到越来越多的机器客服代替人工客服，各种智能机器人也越来越多的出现在公共场所中，但语音识别技术依旧任重而道远，无论是技术的延伸，还是应用场景的扩展都大有可为。不过就现在的技术而言，帮尼更愿意用“人工智障”来称呼它们，希望在语音和语义识别领域，可以早日有所突破。

点击下方链接，查看更多精彩内容

新零售是商品物流的竞赛？这是硬件与技术的较量！

图解突发事件应急管理

奥巴马陷入银行卡盗刷风波？原来是骗子的“障眼法”

巡航失灵生死时速的背后，网络安全惹人心忧

还记得去年的海豚攻击吗？如今它能搞掉监控

觉得这文章怎么样？是不是应该点个赞呢？

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.