网易科技讯9月15日消息,网易科技主办的第49期五道口沙龙——智能音箱抢滩站,今天下午举行。海知智能创始人兼CEO谢殿侠分享了《ruyi.ai第三方bot/skill开放技术平台》。谢殿侠认为,人人都有机器人的时代马上就要来了。
“去年我们一个企业文化是’人人都有机器人’,今年来看这个愿景已经很近了,加上时间线就是’2020年人人都有机器人’,应该会很快到来了。”谢殿侠表示。
他认为,语音是交互界面,背后是机器人能够用人的语音来呈现的交互形态。能够处理人类知识,理解人类。但用户的痛点在于从演示系统到商业产品,很多产品都不能令人满意。
基于这样的理念,海知智能在帮助若干知识里又有信息又游服务的人,如果通过一个理念把一个领域服务知识让机器掌握,用人的语言和人交互,在一定范围内达到人可容忍的误差率,比传统任何交互方式都会有更好的体验,从语义理解API的层面、从工具层面,还会做一些比较深入好玩的东西,但那可能是偏探索型地解决问题。(静静)
谢殿侠:很高兴今天下午和大家一起交流。
智能音箱产业链开始繁荣,去年五道口沙龙我也来讲了一次,那时候还在讨论方向怎么样,没想到在今年变成了共同认知的事,有太多人来做。
但我们做的是非常新鲜的领域,我们称之为第三方bot/skill平台,说大了是平台,但其实是工具,小米和思必驰都是给大家提供一个服务,帮助大家把产业链做起来,这是一个从信息化到智能化的时代变革,机器人不局限于音箱,任何带电的设备理论上来讲将来都可能具备机器人的属性。
去年我们一个企业文化是“人人都有机器人”,今年来看这个愿景已经很近了,加上时间线就是“2020年人人都有机器人”,应该会很快到来了。
从更小的维度来看,实际上这种语音交互形态是和键盘鼠标、触摸屏差别比较大的,语音为主。但语音只是交互,背后是机器人掌握了某一个领域的知识之后能够用人的语言来和人交互的一个呈现形态,这种情况下语音交互只是一个浮在表面的东西,是件衣服,真正能够掌握处理一个领域的知识,最后能够理解人、理解知识,建立交互。
理想很丰满,现实很骨感。Siri也好,很多产品还不能令人满意,体现到大家说这个机器人傻,音箱傻、电视傻,这是常态。这种情况下我们一直提针对特定用户、特定场景、特定问题做垂直,去深挖,再通过一些数据,功能的方法、产品的方法,最后在场景、用户、问题和领域都建立的情况下应该达到人们可容忍的范围之内,比传统手机和电视遥控器有更好的体验,这块人工智能的想像力空间非常大,但在产品领域我们有相对比较务实的需求。
基于这样的理念,我们在帮助若干知识里又有信息又游服务的人,如果通过一个理念把一个领域服务知识让机器掌握,用人的语言和人交互,在一定范围内达到人可容忍的误差率,比传统任何交互方式都会有更好的体验,从语义理解API的层面、从工具层面,还会做一些比较深入好玩的东西,但那可能是偏探索型地解决问题。
这是一个音乐的例子,我们看机器人能不能理解,右边是真人,左边是Bot,“放一首谭咏麟的歌”,这个很容易识别,我们说“再放一首他的《朋友》”,这里就要理解得稍微多一点了,要知道是谭咏麟而不是张国荣,之后再说“换成周华健的版本”,他要知道是周华健的《朋友》,而不是别的。
“换一首清新的日文歌”。
前面的音乐可能是在睡前场景下,智能家居里有一个场景是厨房,和中国的情况不一样,在厨房情况下会有场景,比如孕妇适合吃的有哪些,这个很容易啊,如果问“羊肉和西瓜适合一起吃吗?”经过计算出来的结果就会千差万别,他会告诉你羊肉和西瓜相克,因为同吃伤元气,这是中医的理念。这里能够给你相对比较准确的答案,并且有一定逻辑。
你可以问他“羊肉的热量高吗?”传统做法是“羊肉的热量是多少?”它会告诉你准确的结果。在这种情况下怎么能够让机器在特定场景面对具体的用户类型解决一些特定的问题,里面需要用户量和数据的迭代,比我用手机和键盘输入好得多。
刚才这些能力我们能做,我相信也欧很多企业可以做,但我们希望把这种能力让在座每一位都可以做,这是我们的核心价值所在,我们通过我们的技术、工具帮助任何能够写微博的人能够去做网站,做博客,相当于我们把一系列的工作(算法、数据等)都整合成了一个API。
API就是下面白色的,它能够理解这句话(“给我放一首周杰伦的稻香”)是音乐这个分类,而不是天气,剩下的要识别歌手是谁、歌名是谁,怎么做意图分类,怎么做更细的意图识别,我们把这些都做了,你只要用就可以了。
这就是bot/skill工具的后台界面,通过一些机制串起来做意图识别流程,连接传统的数据API或企业内网系统。
到目前我们自己大概打造多了50多个置内技能插件,在智能家居这个场景做得相对深入一些,比如音乐,我们跟国内主要音乐渠道(我们是做知识图谱的,没有音乐资源)对接。
这是饮食百科的图谱,后面还有中医,中医这块你就可以查中医,中国所有老中医能治什么病,在里面查各种信息。
还有特别简单的诗词兼容,很多人很好玩,小米电视上也有,你说一句他说一句,大家可以练习一下我们的国文能力,因为我们把古往今来几乎所有的诗词全部装进去了,你可以跟它玩一玩。
更核心的是我们希望大家能做500个智能插件、5万个智能插件,我们把门槛降低到文科生都能使用,大四文科生来实习的经过一个星期就能做出来一个智能插件,他自己都很匪夷所思,可能稍微需要一点点编程基础,但很多人一开始来了之后都说“让我编程我不干”,但最后他们很高兴,都说“哇,原来我也可以编程”。左边接到智能硬件上、WEB上、APP上、电话上,有了语音识别、语音合成,接到任何上面都可以,换句话说未来以网页呈现的未来都可以以语音来呈现,小米的水滴、思必驰的DUI作为开放平台,后面是我们干的活,核心是基于模板的机器学习,便于人机交互。知识图谱是人工和自动化知识图谱并举。
另外是我们的工具,有人说我要针对举家养老老年人的娱乐需求做一个,我说你找我们就对了,我们可以帮你做出最棒的。
通过开放接口我们接了大量数据,数据只是列了一部分,构建数据是构建知识图谱,构建领域里的知识地图,我知道哪儿有,但真的要播放音乐、播放声音你可能要到这些音乐和声音上去,但有了这些作为基础,你在做自己的Skill的时候,机器本身就具备很多能力和知识,你只是调配就可以了。
这是目前我们合作的客户,包括海尔,平台级合作有水滴、DUI等。
这是我们的理念,人人能有机器人,前提是人人会做机器人。
最后一个小广告,我们干了三年半的活,下个礼拜9月20日在北大博雅有一个产品发布会,因为入场券需要99块,如果大家想要可以找我,还有一些。