从键盘鼠标到多点触控,交互越来越便捷自然,可穿戴设备的出现则让人看到了更大的想象空间:原来,交互可以如此智能。专注语音的云知声显然看得更远——除了语音,全智能交互时代还需要图像和人脸。为此,云知声牵头成立“全智能交互联盟”,首批成员包括图像识别技术公司“亮风台”、人脸识别技术公司“Face++”和语义理解技术公司“哦啦”。
天下武功,唯快不破
云知声的“快”有目共睹,18个月6次升级语音识别内核,合作伙伴超过3000家。2014年开年,云知声宣布单月签单额突破千万,打出一次漂亮的“转型”快招。云知声原本是一家实力出众的技术公司,大部分成员是语音识别领域的资深专家,但它只花了一年多的时间,就成功转型为商业化的产品型公司,这背后除了优秀的团队还有市场的推动。
语言的交流,是人类最自然的沟通方式,将语音运用到人机交互上,市场潜力不可限量。如今,语音识别的技术已趋向成熟,接下来就是接受市场的考验。云知声的智能语音服务已经运用在了云、芯片、呼叫中心、智能电视、车载设备及移动设备等方面。CEO 黄伟认为,微信这样的超级 APP 培养了用户使用语音的习惯,但事实证明,在智能电视等特定领域,才是语音应该真正一显身手的地方。云知声已经和乐视 TV 达成合作,在遥控器上加入智能语音服务,来代替繁琐的按键操作,这将拯救遥控器不易使用的致命缺点,让娱乐更简单。
同样,也是出于对市场的敏锐洞悉,云知声牵头成立了“全智能交互联盟”,再次打出一张快牌。
因为市场,因而联盟
伴随着智能交互技术和可穿戴设备的成熟,未来很有可能出现这样的场景:当我们第一次见到一个人,通过人脸识别,能第一时间拉近和对方的距离;通过接收语音,可以判断对方的情绪;通过图像识别,从对方的衣着了解 Ta 的兴趣品位。其实,市场已经提出了这样的需求,这就是“全智能交互联盟”得以成立的根本动因。
硬件设备上的麦克风和摄像头无疑是重要的入口,可穿戴设备特别是智能眼镜的发展,将使语音和图像的运用变得更加自然简便。摆脱了双手的束缚,人们可以更简单地和虚拟世界建立联系,把口、眼、耳、鼻等器官全部纳入人机互动的体系中。
加入联盟的这四家公司,深耕于垂直的专业领域,涵盖了语音和图像等最重要的人机交互模式。这次从独立走向联合,既使各方技术有机会融合互补,同时对于硬件厂商和开发者来说,也能获得更全面的技术解决方案。
智能交互的未来图谱
语音是人类交流的最自然方式,图像则有“一图胜前言”的说法,多种交互手段的融合既满足了便捷的要求,又增加了互动性。语音正处于爆发的零界点,Siri、Google Now 和微软 Cortana 的战略地位显而易见,据称 iOS 8 的听音辨曲功能也即将和 Siri 整合,语音的未来充满想象。恰如黄伟所说,语言识别技术不只是单纯的产品,它能解决人与机器交互的问题。
此次联盟的成立,一来把更多的智能交互手段纳入到生态体系中,二来也展示了语音等技术应用领域的更多可能性。除了互联网行业,智能家居、汽车、广告、健康等行业一样可以利用智能交互打造不一样的产品。