网易首页 > 网易号 > 正文 申请入驻

被喷了这么多年,图灵测试这老东西为啥还没凉?

0
分享至

先问大家一个问题,仅凭聊天,你能判断出对方是个怎样的人吗?

来看看这段聊天记录,你可能会得出结论,对方是个宇宙无敌大懒狗。

但要是我跟你说,对面压根就不是人,你敢信?

这事儿,就跟科学史上的典中典,图灵测试有关。

一直以来,大伙都把这测试当成衡量 AI 智力的标准。咋测呢?就是让人跟 AI 聊天,要是人类分不清对面是 AI 还是人,那这 AI 就算赢了。

不过这图灵老爷子都去世七十多年了,图灵测试似乎依旧是AI圈的一座“指路明灯”。

在 2024 年,GPT-4 就挑战了图灵测试,并以 54% 的胜率成功拿下。

要知道这图灵测试的及格线是30%,这成绩已经算是妥妥的优秀了。

当时加州大学圣地亚哥分校的研究让 500 名参与者和四个 “对话者”(包括真人、某古董机器人 ELIZA、GPT-3.5 和 GPT-4)进行 5 分钟交流,结果近六成的人被 GPT-4 的演技忽悠了,其他AI都没迈过30%的坎儿。

前段时间,又有人拿最新的 GPT4.5 去做了测试。结果表明,它不仅通过了图灵测试,更绝的是,它被当成人类的概率比真人还高!好家伙,这下真有人活得还不如人机了。

所以,这么多年了,这玩意凭啥还在屹立不倒呢?

要知道,在计算机还在用打孔纸带存储的年代,图灵就提出了这个测试。这是因为当时的人们还搞不清人类思维的本质,要研究机器怎么思考,就更无从下手了。

所以图灵就想,我们不纠结本质,直接看它的表现不就行了?就像一个东西,看起来像番茄,吃起来像番茄,那它就是番茄啊!如果机器有智慧,那它就应该表现得像人。

不过谁能想到,直到今天,科学家还没搞清人类大脑的运作方式。。所以这玩意退不了休,也有它的道理。

但江江其实一直有一个疑问,这图灵测试真有那么神吗?跟你对个话就说明AI有思考能力,是不是有点儿太草率了。

我上网搜了一下,不少网友也怀着一样的看法:都5202年了,图灵测试早就过时了

其实吧,这玩意儿自从提出,在业内反对声就一直不少。

早在1980年,加州伯克利的一位教授就提出,图灵测试根本没用。他举的例子是,把一位英语母语的人关在房间中,然后向屋里传递中文写成的问题,而屋里有一本英汉双语的答案书。这样他只需要每次收到问题,去找答案,抄下来,再把答案递出去就行了,根本不用思考问题。

这确实是图灵测试的一个大bug——它只看答案,不需要看过程。

而且,它的bug还不止一个。1966 年,MIT 有个教授整了个聊天机器人 ELIZA,它能用简单又模糊的回复,让你觉得它好像懂你。下面这段对话,乍一看没啥问题,仔细一琢磨,ELIZA 就是个纯纯复读机!但还真能骗过一部分人类。。

2014年,一位程序员宣布,他的程序成功通过了图灵测试。但他的办法让人直呼神人,他让该程序伪装成一个13岁乌克兰男孩儿,而提问者是英语母语者,这就导致提问者觉得,对方是小屁孩而且语言不通,胡言乱语很正常。

很明显,这些机器人把重心放在了“糊弄人类”,而不是“思考答案”上,测试的人直呼被耍了。

这事儿也让好多人开始对图灵测试火力全开。

2014年著名科技杂志IEEE Spectrum的一篇文章就提出,图灵测试真不行,威诺格拉德测试才是未来!

这威诺格拉德测试呢,就是给机器出点常识性填空题,比如:

狮子吃斑马是因为“它们”是捕食者,这里的 “它们” 指的是 “斑马” 还是 “狮子” 呢?

这题人一眼就能答出来, AI 就得犯难了。

2020年,亚马逊的首席科学家 Rohid 也发文称,图灵测试早该淘汰了!

纽约大学教授加里·马库斯甚至直言:这玩意早过时了,我希望人们忘记它,但人们忘不掉它。

这么看,大伙对图灵测试积怨已久啊。

但其实,也不能怪大伙。就连图灵本人,也没有对图灵测试进行严格定义。这就导致,图灵测试像个框,什么都能往里装。

就拿GPT4.5这篇文章来说,实验数据是1023场对话,平均长度8条消息,持续4.2分钟。这么短的对话,让很多人直接开喷,这也算聊天儿?

虽说图灵在 1950 年的文章里提到过,开始对话 5 分钟后,人类认出 AI 的几率不超过 70% 就算通过。但那也是基于当时的技术水平猜的一个标准,现在 AI 发展得这么猛,还这么低的标准,确实有点儿跟不上趟了。

再说了,现在的大模型说话贼像人,一般人根本分辨不出来。但它真的会思考吗?别看它整天整些 “深度思考” 的架势,本质上,它根本不理解自己输出的东西,更别说情感了。

就连不同的人,对不同的AI的分辨能力也不一样。就像打了一百遍的Boss,远不如初见杀的时候有杀伤力。资深AI用户去参加图灵测试,认出AI的概率肯定更高,那么问题来了,要给AI搞个难度分级,一路从人类小兵干到最终人类Boss,才算通关吗?

这样看,图灵测试这玩意bug还真挺多,确实没啥说服力了。

但老实说,人们现在纠结图灵测试过不过时,可能并不是图灵老爷子想看到的事儿。

就像老爷子在他的经典论文《Computing Machinery and Intelligence》里写道:“我们希望机器能在所有智力领域与人类竞争,但最好的起点在哪里?我也不知道。”说到底,他也只是在一个领域,提出了一种可行的解法罢了。被后来的人奉为圭臬,也是他根本没想到的事情。

而现在,ChatGPT能写出比大多数人还好的文章,Claude能指挥你的电脑开始干活,我们却还在嘲笑AI通不过图灵测试,是否有点一叶障目了?

图灵从来没有说过,通过了我的测试,AI才算成功。他真正想看见的,只是人类的无限进步罢了。

撰文:不咕

编辑:江江

美编:焕妍

图片、资料来源:

arXiv、Wiki、X、知乎、百度百科

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
中国将迎人口死亡高峰!22年1041万,23年1100万,去年死亡多少?

中国将迎人口死亡高峰!22年1041万,23年1100万,去年死亡多少?

长歌侃娱
2026-01-16 07:55:03
《别说你后悔了》俞音周京珩陆晚小说:我吐了老板的贵客一身。

《别说你后悔了》俞音周京珩陆晚小说:我吐了老板的贵客一身。

隔壁老王爱生活
2026-01-18 09:03:59
男顶流偷睡人妻被打的瓜

男顶流偷睡人妻被打的瓜

十锤星人
2026-01-24 23:07:17
起风了,黄国昌辞职后去向明确,柯文哲有大动作,郑丽文再获强援

起风了,黄国昌辞职后去向明确,柯文哲有大动作,郑丽文再获强援

观星赏月
2026-01-25 15:13:47
2026名场面:董方卓被打脸、闫学晶偷税、李湘销号、彭十六被查

2026名场面:董方卓被打脸、闫学晶偷税、李湘销号、彭十六被查

未曾青梅
2026-01-25 22:41:50
一堂课卖8万8,“性商”网红周媛被扒了老底,柯蓝的话终有人信了

一堂课卖8万8,“性商”网红周媛被扒了老底,柯蓝的话终有人信了

喜欢历史的阿繁
2026-01-23 07:19:56
夫妇网购娃娃菜食用后中毒,检出鼠药成分,警方已受案 平台:下架商家商品,配合调查

夫妇网购娃娃菜食用后中毒,检出鼠药成分,警方已受案 平台:下架商家商品,配合调查

红星新闻
2026-01-24 19:30:49
有人预测:不出意外,2月开始将呈现5大现象,老百姓需做好准备

有人预测:不出意外,2月开始将呈现5大现象,老百姓需做好准备

近史博览
2026-01-24 21:42:21
李小璐写真生图高清

李小璐写真生图高清

翩翩明星
2025-11-14 09:39:36
仗打了一千多天后,美国才后知后觉发现不对劲:中国三年前的抉择竟早已是正确答案!

仗打了一千多天后,美国才后知后觉发现不对劲:中国三年前的抉择竟早已是正确答案!

源溯历史
2026-01-13 23:29:12
看他打球真痛苦!辽篮顶薪大将只拿3分 正负值-30队内最低

看他打球真痛苦!辽篮顶薪大将只拿3分 正负值-30队内最低

胖子喷球
2026-01-25 22:07:45
一粒速效救心丸可治10多种病,别只用来治疗心梗了,一定要收藏

一粒速效救心丸可治10多种病,别只用来治疗心梗了,一定要收藏

路医生健康科普
2026-01-24 08:30:03
筱梅湾湾办节日家宴!箖箖和玥儿露正脸!玥儿坐在那神态太像大S

筱梅湾湾办节日家宴!箖箖和玥儿露正脸!玥儿坐在那神态太像大S

锋哥与八卦哥
2026-01-06 16:03:26
开始清算!闫学晶再迎噩耗,这一次谁也救不了自掘坟墓的她!

开始清算!闫学晶再迎噩耗,这一次谁也救不了自掘坟墓的她!

有范又有料
2026-01-25 13:16:02
U23亚洲杯结束,下一届分档曝光:越南跻身一档 中国队无缘前二档

U23亚洲杯结束,下一届分档曝光:越南跻身一档 中国队无缘前二档

侃球熊弟
2026-01-26 00:05:03
授予上将与晋升上将,有什么区别?

授予上将与晋升上将,有什么区别?

袁老师说历史
2025-12-13 15:13:17
向中国要1250亿,中方拒绝西方急了,COP30上我们没义务当冤大头

向中国要1250亿,中方拒绝西方急了,COP30上我们没义务当冤大头

爱吃醋的猫咪
2026-01-03 20:24:16
霉霉翻车了?

霉霉翻车了?

新民周刊
2026-01-25 13:04:49
63岁女子确诊外阴癌!她的“坏习惯”为所有人敲响警钟!来了解下

63岁女子确诊外阴癌!她的“坏习惯”为所有人敲响警钟!来了解下

医学科普汇
2026-01-25 07:45:06
红星观察|3比0大胜越南队!创中国足球22年来最高光时刻,U23国足靠什么?

红星观察|3比0大胜越南队!创中国足球22年来最高光时刻,U23国足靠什么?

红星新闻
2026-01-21 08:49:14
2026-01-26 01:55:00
差评XPIN incentive-icons
差评XPIN
用知识和观点Debug the world!
10185文章数 489411关注度
往期回顾 全部

科技要闻

黄仁勋在上海逛菜市场,可能惦记着三件事

头条要闻

男孩打碎电视屏为"还债"在小区创业 不到2个月赚了6千

头条要闻

男孩打碎电视屏为"还债"在小区创业 不到2个月赚了6千

体育要闻

中国足球不会一夜变强,但他们已经创造历史

娱乐要闻

央八开播 杨紫胡歌主演的40集大剧来了

财经要闻

隋广义等80人被公诉 千亿骗局进入末路

汽车要闻

别克至境E7内饰图曝光 新车将于一季度正式发布

态度原创

游戏
亲子
房产
教育
公开课

LCK春季赛:道心没有破碎,KT找回状态,三局战胜BRO

亲子要闻

女子腹痛送医才知道自己怀孕,23分钟后......生了一个男孩

房产要闻

正式官宣!三亚又一所名校要来了!

教育要闻

孩子为何爱电子游戏

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版