在人工智能快速发展的今天,语音识别技术取得了一系列突破性的进展,苹果、微软、谷歌、百度、科大讯飞等各大科技巨头纷纷涉足语音识别领域,布局大量人力、物力进行技术研发,以语音识别技术为基础的人机交互产品渐渐走入大众生活,人与机器用自然语言进行无障碍交流对话的梦想逐渐成为现实。
语音识别 拐点已至?
语音识别技术,也被称为自动语音识别(Automatic Speech Recognition),它以语音为研究对象,目标是将人类的声音信号转化为文字或者指令,让机器自动识别和理解人类语言,以此实现语音对机器的智能操控。
语音识别研究涉及人工智能、信号处理、模式识别、声学、语言学和认知科学等诸多学科领域,具有多学科综合性的研究属性。
自上世纪五十年代开始兴起后,语音识别依托云计算、存储资源和大数据获得了越来越广泛的应用,智能家居、智能可穿戴设备、无人车、移动医疗……看似高大上的实验室技术正逐步应用于市场,改变着我们的生产和生活。
有着“互联网女皇”之称的摩根斯坦利分析师玛丽·米克尔在2017年度《互联网趋势报告》中谈及“语音”的次数极高,并且玛丽·米克尔极为看好语音市场。她以Amazon的Echo为例,指出“语音正在被重塑,成为人机交互的新范式,在过去75年里,每10年就有一次人机交互的重大革新,人类对机器的操作,从物理手柄按键,到物理键盘鼠标,再到触摸屏,而现在语音成为了重要的交互方式。”
米克尔表示,人们越来越多地使用亚马逊Alexa、苹果Siri和谷歌助手等语音助手。并且她摆出一组数据:2016年20%的移动搜索是通过语音完成的!
中科院自动化所研究员、博士生导师刘文举老师认为,语音识别的最大技术难点是远场语音识别。远场语音识别是近场语音识别技术难以解决的,因为在远场会出现噪音、混响、回声等多种复杂的情况,必须要有一个特定的算法来解决。如果这个难点获得解决,那么语音识别的应用的场景就会更多。
语音识别在市场中还处于初期阶段,目前还没有培养出用户的依赖习惯,所以语音识别还有巨大的发展潜力。语音识别技术,或成为人工智能领域下一个风口。
扒一扒智能语音识别产品有哪些?
苹果Siri
提到语音识别,大家首先想到的应该就是苹果的Siri了。2010年,苹果收购Siri Inc.并将该其技术应用于iPhone 4S,正式推出Siri语音助手。然而Siri问世后受到了诸多吐槽,交互感太差。随后苹果收购语音识别公司Novauris Technologies,Novauris基于超过2.45亿个短语数据库可识别整个短语、辅助理解上下文,使得Siri功能进一步完善。近几年,苹果又收购了美国圣地牙哥AI技术公司Emotient,开发脸部表情分析与情绪识别技术,希望Siri可通过读取人们的面部表情预测其情绪状态,这一技术值得期待。当然,Siri现有的功能要满足人们实际的应用需求还有很长的路要走。
微软Skype、Cortana、小冰
2015年,微软发布Skype Translator中文版,可实现英语、西班牙语、汉语、意大利语实时互译。
“嗨,我是微软小娜。从电脑到手机,你随时随地的个人助理。”
Cortana小娜是微软在人工智能领域的新尝试,基于机器深度学习读取大量数据,小娜可实时记录用户习惯和行为轨迹,识别用户信息,获得理解自然语言的能力,从而实现人机交互。并且,小娜的声音十分逼真似真人。
今年八月份,微软发布第五代小冰,较前几代增加了情感识别功能,微软希望小冰不仅有智商,更要有情商。除了基本的智能对话、百科、天气、交通、餐饮等实用功能外,第五代小冰增加了主动拨打用户电话功能,可以主动与人类进行语音交互。目前小冰已经可以拨通电信、移动和联通运营商的电话,9月6日起开放人工智能电话的预约,平台包括微博、京东、Windows10、优酷、微信等。微软全球执行副总裁沈向洋在发布会上表示,人工智能会颠覆一切。
科大讯飞
在国内,提到语音识别必定绕不过科大讯飞。科大讯飞成立于1999年,虽然它是一家企业,但其背靠中国科学院大学,又有国家大力扶持,2008年便在中小企业板上市,并且占据一半以上的市场份额。科大讯飞标榜其为以语音交互为核心的人工智能开放平台,其最具前瞻性的是收购了多家语音评测公司,进而垄断教育市场,独霸口语测评考试鳌头。除此之外,它还有一款办公神器——讯飞听见,语音识别与转写高效、准确。
百度语音
百度在语音识别技术方面引入注目的是,在2014年请来人工智能领域泰斗级人物吴恩达坐镇,依靠庞大的资金支持组建团队,大力研发语音识别相关技术。其实在2010年百度就以部署团队进行研发,并且与中科院声学所合作,但是效果并不理想。幸而14年转型,虽然比不上科大讯飞,但也逐渐吞并部分市场份额。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.