网易首页 > 网易号 > 正文 申请入驻

ChatGPT已经通过“图灵测试”?科学家称该人工智能有人类的智力

0
分享至

自1950年首次提出以来,通过“图灵测试”一直被视为人工智能(AI)的最高目标之一。

但现在,研究人员声称ChatGPT成为第一个通过这个著名人类智能测试的AI。

由计算机先驱阿兰·图灵提出的图灵测试认为,如果人类无法分辨他们是在与人类还是机器交谈,那么这个AI应该被认为是具有真正智能的

在一篇预印本论文中,加州大学圣地亚哥分校的认知科学家们论证说,ChatGPT-4在超过一半的时间里可以欺骗测试对象,使他们认为自己在与人类交谈。

然而,研究人员表示,这可能更多地说明了图灵测试本身的问题,而不是现代AI的智能水平。

早在1950年,英国二战密码破译者阿兰·图灵创建了他认为是计算机智能的最终测试。

他设想,一个人类参与者坐在屏幕前,通过纯文本界面与人类或计算机交谈。

如果计算机在广泛的主题中都无法被区分为非人类,图灵推断,我们就不得不承认它和人类一样聪明。

为了重现这个著名的测试,研究人员要求500名参与者与四个不同的代理人交谈:三个AI和一个人类。

这些AI包括ChatGPT-4、ChatGPT-3.5(OpenAI的两个版本)和一个1960年代的聊天程序ELIZA。

参与者被置于一个聊天室中,并被告知他们需要说服对方自己是人类,或者找出他们在与谁交谈。

随后,参与者有五分钟的时间进行聊天,然后被问及他们认为自己是在与计算机还是人类交谈,为什么这么认为,以及他们的自信程度。

尽管过时的ELIZA只能在22%的时间里欺骗参与者,但ChatGPT-3.5在50%的对话中未被察觉。

更先进的ChatGPT-4表现更好,参与者在54%的时间里认为它是人类。

这意味着ChatGPT-4比随机猜测更频繁地被认为是人类。

如果这一比例看起来不高,值得注意的是,参与者在67%的对话中正确识别人类为人类。

研究人员写道,这些结果“提供了第一个有力的实证证明,表明任何人工系统通过了互动的双人图灵测试”。

需要注意的是,这是一篇预印本论文,意味着其目前正在等待同行评审,因此这些结果需要谨慎对待。

然而,如果这些结果得到支持,这将是首次有力证据表明AI通过了阿兰·图灵设想的图灵测试。

电气与电子工程师协会(IEEE)的AI研究员Nell Watson告诉Live Science:“机器可以像人类一样拼凑出事后的合理解释。

“所有这些元素意味着AI系统表现出人类般的弱点和怪癖,使它们比之前仅有固定响应列表的方法更像人类。”

重要的是,ELIZA程序的低表现也有助于支持这些结果的重要性。

尽管在前沿技术测试中包括一个1960年代的程序看起来很奇怪,但这个模型被包括进来是为了测试所谓的“ELIZA效应”。

ELIZA效应的意思是人类可能会将人类特征赋予即使是非常简单的系统。

但事实是,人们被ChatGPT而不是ELIZA所欺骗,这表明这一结果“非同寻常”。

研究人员还指出,公众对AI的看法变化可能改变了我们从图灵测试中应预期的结果。

他们写道:“乍一看,低的人类通过率可能令人惊讶。

“如果测试衡量的是人类特征,人类不应该是100%吗?”

在1950年,这一假设完全合理,因为在一个没有先进AI的世界中,我们会认为任何听起来像人类的东西就是人类。

但随着公众对AI的认知增加,我们对AI的信心增加,我们更可能将人类误认为AI。

这可能意味着人类与ChatGPT-4通过率之间的小差距更能作为计算机智能的证据。

今年2月,斯坦福大学的研究人员发现ChatGPT可以通过一个版本的图灵测试,即AI回答一个广泛使用的人格测试。

尽管那些研究人员发现ChatGPT-4的结果与人类无异,但这篇最新的论文是AI首次通过基于对话的强大双人图灵测试之一。

不过,研究人员也承认,图灵测试有长期存在并且有效的批评。

研究人员指出,“风格和社会情感因素在通过图灵测试中比传统的智力概念起更大的作用”。

审问者更有可能引用风格、个性和语气作为识别其对话伙伴是机器人的原因,而不是与智力相关的任何因素。

同样,识别机器人的最成功策略之一是询问人类体验,这种方法在75%的时间里有效。

这表明图灵测试并不真正证明一个系统是智能的,而是衡量其模仿或欺骗人的能力。

研究人员认为,这最多只能“概率性地”支持ChatGPT具有智能的说法。

但这并不意味着图灵测试毫无价值,研究人员指出,模仿人类的能力将带来巨大的经济和社会后果。

研究人员表示,足够具有说服力的AI可以“在传统上由人类工人担任的客户面对面岗位上发挥经济价值,误导公众或其人类操作员,并侵蚀真实人类互动中的社会信任”。

最终,图灵测试可能只是我们在评估AI系统发展时需要考量的一部分。

沃森女士说:“纯粹的智力只能走到这一步。真正重要的是具有足够的智能来理解情况、他人的技能,并有同理心将这些元素结合在一起。

“能力只是AI价值的一小部分——理解他人的价值观、偏好和界限的能力同样至关重要。”

声明:取材网络,谨慎辨别

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
全网都批绿军血亏!布朗换乔治看似白送,实则是唯一活路!

全网都批绿军血亏!布朗换乔治看似白送,实则是唯一活路!

篮球小布丁
2026-07-03 04:45:49
神龙政变五大功臣结局有多惨,凌迟、杖杀、棒杀,个个不得善终

神龙政变五大功臣结局有多惨,凌迟、杖杀、棒杀,个个不得善终

长风文史
2026-07-02 20:25:11
此前报道为8500万镑,罗马诺:M费加盟热刺转会费为4400万镑

此前报道为8500万镑,罗马诺:M费加盟热刺转会费为4400万镑

懂球帝
2026-07-02 17:26:10
33艘船通过运河引发中巴新争端,中国大使坚决反对撕毁契约

33艘船通过运河引发中巴新争端,中国大使坚决反对撕毁契约

真的好爱你
2026-07-03 01:38:17
外媒称台湾地区检方扩大调查涉嫌向中国大陆走私英伟达芯片一案,已羁押两名美国公司员工,外交部:这不是外交问题

外媒称台湾地区检方扩大调查涉嫌向中国大陆走私英伟达芯片一案,已羁押两名美国公司员工,外交部:这不是外交问题

政知新媒体
2026-07-02 15:39:35
曝韩红退出公益行业仅1天,再迎2大"噩耗",荒唐的一幕发生

曝韩红退出公益行业仅1天,再迎2大"噩耗",荒唐的一幕发生

不似少年游
2026-07-01 14:54:59
太离谱,中国篮协宣布最新决定,CBA被坑了,俱乐部欲哭无泪

太离谱,中国篮协宣布最新决定,CBA被坑了,俱乐部欲哭无泪

宗介说体育
2026-07-02 14:36:36
23.68万起!丰田官宣:新MPV正式上市

23.68万起!丰田官宣:新MPV正式上市

高科技爱好者
2026-07-03 01:50:53
西安警方通报:3人发布涉赛格坠楼事件谣言被处罚

西安警方通报:3人发布涉赛格坠楼事件谣言被处罚

现代快报
2026-07-02 21:37:08
毛主席逝世前的1件怪事与2个巧合,绝非天意,背后是客观真相

毛主席逝世前的1件怪事与2个巧合,绝非天意,背后是客观真相

优趣纪史记
2026-07-02 19:29:35
网坛2026收入榜前十名:阿卡辛纳领跑,中国选手居然有一人入围

网坛2026收入榜前十名:阿卡辛纳领跑,中国选手居然有一人入围

里芃芃体育
2026-07-03 05:00:04
西安身家千万老总坠亡!头部运动品牌代理,曾购几十辆奔驰奖员工

西安身家千万老总坠亡!头部运动品牌代理,曾购几十辆奔驰奖员工

火山詩话
2026-07-02 05:52:19
央视披露:某机关工作人员刘某某,在境外间谍亮明身份的情况下,仍受其指挥实施间谍行为、搜集单位红头涉密文件,被依法采取强制措施

央视披露:某机关工作人员刘某某,在境外间谍亮明身份的情况下,仍受其指挥实施间谍行为、搜集单位红头涉密文件,被依法采取强制措施

政知新媒体
2026-07-02 20:44:17
莫言:你细心观察一下你的身边人,凡是动不动就生气的人,没有一个是智者,生活多半过得一团糟糕

莫言:你细心观察一下你的身边人,凡是动不动就生气的人,没有一个是智者,生活多半过得一团糟糕

每日一首古诗词
2026-06-18 06:32:18
堂妹高考685分嘲笑我考了596分,我上大学,她的结果让人出乎意料

堂妹高考685分嘲笑我考了596分,我上大学,她的结果让人出乎意料

程哥讲堂
2025-06-18 15:46:06
合适吗?清华连续两届毕业生合影,前排出现同一名孩童,校方回应

合适吗?清华连续两届毕业生合影,前排出现同一名孩童,校方回应

东东趣谈
2026-07-02 19:29:37
央媒,集体放弃施琅?

央媒,集体放弃施琅?

人间颂
2026-07-01 12:10:26
要不是世界杯,恐怕没人知道中国在52万人的佛得角投入了多少

要不是世界杯,恐怕没人知道中国在52万人的佛得角投入了多少

莫地方
2026-07-03 00:06:18
为什么航母速度都在30节左右,30节换算成陆地交通工具,是多快?

为什么航母速度都在30节左右,30节换算成陆地交通工具,是多快?

抽象派大师
2026-07-02 03:46:27
摩纳哥王室:两代绝美王妃改善王室基因,王子公主都是高颜值

摩纳哥王室:两代绝美王妃改善王室基因,王子公主都是高颜值

小书生吃瓜
2026-07-02 20:01:52
2026-07-03 05:39:00
Science科学说 incentive-icons
Science科学说
发布最新的科学界信息
2397文章数 20551关注度
往期回顾 全部

科技要闻

马斯克不承认,但SpaceX就该造AI手机

头条要闻

商户在西安赛格商场坠亡 好友:他曾变卖门店发工资

头条要闻

商户在西安赛格商场坠亡 好友:他曾变卖门店发工资

体育要闻

韩国人,为什么恨透了洪明甫?

娱乐要闻

众星祝福祖国,曾沛慈原形毕露?

财经要闻

千亿茶市场无赢家:澜沧巨亏 八马停"蹄"

汽车要闻

有纯电有增程 还有二代VLA支持 小鹏MONA L03预售价14.38万起

态度原创

亲子
房产
本地
旅游
时尚

亲子要闻

费列罗“健达快乐运动”游戏盒子将走进上海150所小学及幼儿园

房产要闻

稀缺预警!海岸线200米+限墅令下,海南「绝版硬通货」来了!

本地新闻

这场穿越酉阳的光影之旅,张张都是壁纸!

旅游要闻

山间砂岩刻下盟约,曾经驿道地标胜景,如今只剩夯土空台一座!

这个夏天,你一定吃过她们的瓜

无障碍浏览 进入关怀版