网易首页 > 网易科技 > 网易科技 > 正文

机器真的已经通过图灵测试了?还有六扔多远

0
分享至

(原标题:图灵测试离我们还有多远?)

注:本文转自微信公众号“计算广告”(ID:Comp_Ad),作者:北冥乘海生。

十年前,我在微软研究院语音组混日子。混,不是我的主观意愿,却是客观事实。当时,我们做的“人机交互”离实用太远,别人都认为我们是编了个故事来骗工资的。有一回,跟同学聊起我们的愿景:“将来,您对着电脑,乐意怎么说怎么说,那边不光嗯啊嗻是,有来言就有去语,回答的还得像话。”正说着,他打断了我:“你说的这不是跳大神,让狐仙附了体了么?”

这当然是戏言,因为建国以后就不许成精了。觉得这事儿挺扯的,要怨您就怨一位前辈的老先生——图灵。是他在人工智能八字还没一撇的时候,提出了这个终极测试方案:将人与机器隔开,前者通过一些装置(如键盘)向后者随意提问。多次问答后,如果有超过30%的人不能确定出被测试者是人还是机器,那么这台机器就通过了测试,并被认为具有人类智能。

于是,通过图灵测试,就成了所有人工智能科学家和伪科学家的最高目标。这两年人工智能大火,号称通过了图灵测试的产品,也如雨后春笋般涌现,甚至可以一抬脚踩死一片。最近的一次,是谷歌在Google I/O大会上演示的Deplux,据说“部分通过图灵测试”,这倒还算中肯。

看起来,图灵的棺材板快压不住了,我们是否已经到了突破图灵测试的奇点了呢?我正在一头雾水之际,突然有天晚上,黑暗暗雾沉沉,图爷托兆给我,对我言道:“这事儿,还离着六扔(见注1)多远呐!现传尔秘籍一部,望尔潜心习学,授众生以三法门!”哪三个法门?且看下文分解。

图灵测试是不是人机“对话”?

理解概念,要把握其内涵和外延。图灵测试的内涵很清楚,就是用机器替代人,进行信息交互。不过其外延有些不清,颇多可变通之处,比如那个“一些装置”。时下的相关产品,交互或用文字,或用语音,对于信息沟通来说,这样的装置够用么?

我们知道,对人类来说,文字仅仅承载着内容的沟通。而人人信息交互,内容沟通大概只占20%,情感沟通要占到80%。计算广告群里的九千岁讲了个生动的例子:当年他给女朋友打电话,信息量最大的,就是对方拿起电话那一声“喂”,这个“喂”就为今天几个钟头的会谈定下了基调。

情感沟通,要理解的就不仅仅是文字,还包括语音、表情、肢体语言等等。所以,两个在知乎上吵得不可开交的人,打个电话没准就成了基友;而真正重要的面试、会议,还是必须面对面进行。没有对这些副语言现象深入研究建模,即使完美地解决了文字和内容沟通的问题,也离真正有效的人机交互相去甚远。

因此,人机“交互”绝非人机“对话”,我认为真正理想的图灵测试,就算不能声情并茂地反馈用户,也至少应该能察言观色,有效解读用户的副语言。将来用上机器女友了,人家“喂”了一声,你还不知道怎么接茬儿,那还不等着回家跪电路板?

显然,这样去限定图灵测试的话,我们现在仍然束手无策。饭要一口口吃,先降低下难度,仅仅考虑利用文本或语音跟机器聊天的场景,我们今天看到的Siri、小冰、Alexa、叮咚音箱等,都是这样的人机对话系统。那么,是否在人机“对话”的情形下,通过图灵测试已经指日可待了呢?

既然不用理解副语言现象,人机对话的关键,当然就是理解自然语言了。自然语言理解和人机对话,是认知智能领域的核心问题,要了解它遇到的困难,要先从目前人工智能的实用方法说起。

人机对话到底难在哪里?

今天所有实用的人工智能产品,都是用的“弱智”(见注2)方法。简单来说,就是凑答案:准备一大坨标注好的数据,然后用大量机器堆上去狂撩,直到把答案凑个八九不离十。至于问题的内在逻辑和简约规律,今天的AI无心顾及,也无力解读。

“弱智”方法在数据充沛的领域,可谓所向披靡:无论是语音识别、人脸识别,还是机器翻译、各种棋类,机器都已经接近乃至碾压真人了。且慢!机器翻译都快解决了么?翻译可比聊天要难吧?不然,机器翻译这个问题,答案是比较好凑的:找到足够多的语言对数据,把词译过去跟麻将牌一样码好了,再调整一下顺序即可。人机对话则不然,我们要找到对方语言里的关键信息,把它转化为动作,再把动作的结果反馈回去。这些关键信息处理的过程,是要经过统计意义上的推理过程。

说到推理,当然离不开句子表达内容以外的背景知识。比如你问机器:“直径为10的球体积是多少?”机器就得会球的体积公式才算得出来。当然,微积分、背古诗、查法典这样的知识,对机器来说总是可以解决,因为有大量书本上的语料可供学习,按照“弱智”方法凑答案即可。难就难在,这世界上还有大量的知识,根本没地方学去。

直觉上,人的知识来自于六岁以后的学习。实际上,绝大部分知识都来自于六岁前神奇的积累过程。只不过,这些知识太普通了,连傻子都知道,所以被大家都选择性地遗忘了。这种人人皆知的事情,姑且把它叫做“常识”,举两个例子您就明白了:

小明面对着你,你瞧不见小明的后脑勺

一瓶矿泉水被我喝完了,瓶子变轻了

就这个呀?这玩意也算知识?您别拿村长不当干部,没有这些常识的支撑,自然语言推理是进行不下去的,不信您看看下面这两句:

爸爸快抱不动儿子了,因为他太胖了

爸爸快抱不动儿子了,因为他太虚弱了

后半句的这个“他”,在上下两句指代的对象是不同的。显然,没有常识的支撑,这两句不好理解。悲催之处在于,这些常识,在所有人类积累的语料当中是不存在的。您想想,有人要编纂一本专著,里面写的全是这样的“深奥”知识:

有孤王坐金殿脊背朝后

头冲上脚冲下脸冲前头

走三步退三步如同没走

两只手伸出来十个指头

那读者还不得骂着街把作者押送到精神病院啊?对此,郭德纲老师和其它曲艺界同仁给了个专业术语,叫“大实话”。

没有了语料、也就是数据的支撑,“弱智”方法是没办法获取这些常识的。所以,甭管谁说他的对话系统通过了图灵测试,你也别问它化学方程,也别让它背诵古文,就找几个这样的真·弱智问题问上一问,它要能答出来我是茄子,那就挺厉害的了。

那么人类的常识在六岁前是怎么获得的呢?对于这样的学术问题,我只能严肃地回答你:“问村长去!”

人机交互要不要模仿人人交互?

看起来,我们离通过图灵测试,还真有六扔多远。那么,从应用的角度看,人机交互这件事真的遥不可及么?这倒也未必。

从开始探索人机交互,我们就想当然地认为,把人人交互的那一端由人变成机器,就是人机交互的理想模式了。于是,我们设计出来的机器人,也都是俩肩膀扛个脑袋,四肢五官齐备,用语言的方式跟对面的人类交流,再加上对常识一窍不通,怎么看怎么像个二傻子。

问题出在哪儿了呢?人类的信息交互,最高效的输出方式是“说”,也就是音频通道;最高效的输入方式是“看”,也就是视频通道。如果你对面是个真人,那没办法,双方都只能靠说输出信息,这就形成了语音为主的交互方式。而靠语音的人机对话,是这样的画风:

我想订一张明天去上海的机票

为您查到:6:35海南航空HU7611,票价480元;6:50吉祥航空HO252,438元;6:50厦门航空MF8178,票价......

我去你大爷的吧!

别乐,就算对面不是机器是个真人客服,这种交互也同样令人抓狂,有过电话订票经历的朋友都有体会,只不过对着活人您不好意思骂街罢了。

既然对面是个机器人,就没必要如此拘泥了。实际上,机器的交互方式,应该跟我们“相反"而不是“相同”:你输出信息靠说,机器人接受信息就得靠听,这没错;你输入信息靠看,那机器人输出就别靠说了,何不在一块屏上展示出来呢?这样不但信息输出效率提高了很多,而且用户只要在展示的信息底板上做选择题,就算用语音输入也大为便捷。

所以,真正适合人机交互的机器人,最好有个视频输出的设备,近了靠手机就可以,远了怎么办还值得探讨。这个概念,就是讯飞的胡郁老师讲的“强视觉呈现的语音交互”吧。这种模式下的交互方式,已经跟人人交互有了质的区别,未知之处很多,需要我们深入探索。当然,可以确定的是,机器人绝对应该抛弃人形,以避免用户用人的眼光和标准来评价它。

人机交互这件事,看起来简单,却是人工智能王冠上最耀眼的一颗明珠。目前看来,严格意义上的图灵测试离我们还相当遥远,不过通过交互方式和产品上的创新,一个在特定领域内可用的合格助手,或许已经在向我们招手了。

另外,由于计算机对海量信息的检索和处理能力远胜人类,或许可以让机器助手辅助人人交互,这样既能大大提高内容沟通效率,又能发挥人的情感沟通优势,这没准是目前更加可行的产品路线。

注:

1.扔:距离单位,捡起一块石头,用力掷出,石头落地后经过的位移为一扔。

2.弱智:弱人工智能的简称。

相关推荐
热点推荐
2025年底前,机关事业改革“大动作”!这7类岗位或将被取消编制

2025年底前,机关事业改革“大动作”!这7类岗位或将被取消编制

猫叔东山再起
2025-12-23 09:00:08
郭德纲也没想到,三位著名相声演员去承德商演,卖19张票不够车费

郭德纲也没想到,三位著名相声演员去承德商演,卖19张票不够车费

小娱乐悠悠
2025-12-22 11:57:15
成都蓉城选帅进入5选2!工资只有徐正源一半,曾考虑邀请郑智

成都蓉城选帅进入5选2!工资只有徐正源一半,曾考虑邀请郑智

振刚说足球
2025-12-23 16:11:20
不到24小时,美国扣第3艘油轮,但碰上刺头,双方爆发海上追逐战

不到24小时,美国扣第3艘油轮,但碰上刺头,双方爆发海上追逐战

书中自有颜如玉
2025-12-23 05:54:43
苏联攻克柏林后,斯大林没有选黄金,用3000列火车运走德国铁疙瘩

苏联攻克柏林后,斯大林没有选黄金,用3000列火车运走德国铁疙瘩

古书记史
2025-12-11 22:22:41
福建女商人林惠荣今日再审宣判无罪,此前被认定职务侵占判刑七年

福建女商人林惠荣今日再审宣判无罪,此前被认定职务侵占判刑七年

澎湃新闻
2025-12-23 11:10:35
“瘦身”成大势所趋,又一家大行关停信用卡App

“瘦身”成大势所趋,又一家大行关停信用卡App

第一财经资讯
2025-12-23 19:01:08
徐正源告别仪式险落泪!凤凰山感人视频,球迷:五年风雨感恩相遇

徐正源告别仪式险落泪!凤凰山感人视频,球迷:五年风雨感恩相遇

奥拜尔
2025-12-23 17:17:16
旧金山全城瘫痪!Waymo断电变「废铁」,马斯克纯视觉赢麻了

旧金山全城瘫痪!Waymo断电变「废铁」,马斯克纯视觉赢麻了

新智元
2025-12-22 17:36:47
越南人吐槽:上学第一天开始,“中国”就占据了我们历史课的80%

越南人吐槽:上学第一天开始,“中国”就占据了我们历史课的80%

娱乐的宅急便
2025-12-21 16:24:00
杨虎城的后人今何在:长子省委书记,俩女儿厅级,孙子移民加拿大

杨虎城的后人今何在:长子省委书记,俩女儿厅级,孙子移民加拿大

抽象派大师
2025-12-14 03:12:02
履新昆明军区政委的刘志坚,上任后当即找到王必成,郑重说道:“邓公交给我的三道密令,我已带到”

履新昆明军区政委的刘志坚,上任后当即找到王必成,郑重说道:“邓公交给我的三道密令,我已带到”

史海残云
2025-12-23 11:33:22
赵睿与王思雨被催婚!符合全部择偶标准?藏着一个体坛“大秘密”

赵睿与王思雨被催婚!符合全部择偶标准?藏着一个体坛“大秘密”

手工制作阿歼
2025-12-23 08:34:33
深圳楼市:房价又破纪录了。。

深圳楼市:房价又破纪录了。。

楼市诸葛
2025-12-23 10:57:01
山东人集体“弃喝”山楂树下饮料?一场发货乌龙,惹怒了半个山东

山东人集体“弃喝”山楂树下饮料?一场发货乌龙,惹怒了半个山东

没有偏旁的常庆
2025-12-23 06:21:00
才播5集,热度破23000,终于有让我熬夜狂追的现偶甜宠剧!

才播5集,热度破23000,终于有让我熬夜狂追的现偶甜宠剧!

糊咖娱乐
2025-12-23 16:44:46
印度反思62年中印战争:实在想不通,为何阻止胜利的中国军队撤军

印度反思62年中印战争:实在想不通,为何阻止胜利的中国军队撤军

小豫讲故事
2025-12-23 06:00:08
佛山南海公示12所民办园停办

佛山南海公示12所民办园停办

南方都市报
2025-12-23 07:08:21
明天注意如下20支股票,今天尾盘资金大量流出,具体信息如下:

明天注意如下20支股票,今天尾盘资金大量流出,具体信息如下:

风风顺
2025-12-23 03:00:03
刘邦兵败正烦闷,听见马夫放狂言:要是我领兵,肯定不会输

刘邦兵败正烦闷,听见马夫放狂言:要是我领兵,肯定不会输

卡西莫多的故事
2025-12-12 10:05:15
2025-12-23 19:51:00

科技要闻

惨烈90分钟!快手惊魂:遭遇最强黑产攻击

头条要闻

被举报打赏网红数百万 国企女职工否认起诉举报者索赔

头条要闻

被举报打赏网红数百万 国企女职工否认起诉举报者索赔

体育要闻

杨瀚森连续5场DNP!开拓者遭活塞双杀

娱乐要闻

朱孝天回应阿信感谢,自曝没再收到邀约

财经要闻

祥源系百亿产品爆雷 浙金中心18人被拘

汽车要闻

四款新车集中发布 星途正式走进3.0时代

态度原创

房产
健康
数码
教育
艺术

房产要闻

独家猛料!16.1亿,浙江老板抢下雅居乐清水湾261亩重磅宅地!

这些新疗法,让化疗不再那么痛苦

数码要闻

泰坦军团P326MV PLUS 31.5英寸4K双模电竞显示器开售 售价2999元起

教育要闻

三阶读童话,趣品《稻草人》!聚焦《稻草人》整本书阅读教学!这场会议,值得关注!

艺术要闻

朱总理的诗句惊艳众人,张家界竟藏有这样的美景!

无障碍浏览 进入关怀版
×