网易首页 > 网易号 > 正文 申请入驻

还质疑人工智能是噱头?GPT-4.0已通过图灵测试,多数人无法区分

0
分享至

提起“图灵测试”,广大数码科技爱好者朋友肯定都不陌生,在很多与计算机相关的内容中,都经常会提到这个词,但是到底什么是“图灵测试”,很多朋友可能并不清楚。

可能有一部分朋友潜意识里认为“图灵测试”的原理和步骤非常复杂,很难理解,事实并非如此,它的原理和步骤非常简单易懂。

图灵测试是由英国数学家兼计算机科学家艾伦·图灵(图一)在1950年提出的,目的是评估机器是否能够表现出与人类相似的智力行为,被业界公认为是机器、人工智能水平的重要评判指标,深刻影响了后来的人工智能研究与发展。

图灵测试的思路和方法也很简单:有一个裁判、一个人类参与者和一个机器参与者。裁判与二者通过文本交流进行对话,目标是通过他们的回答来判断哪个是人类,哪个是机器,区分二者。

如果机器能以极其接近、类似人类的方式参与交流,以至于裁判无法准确识别其身份,将其和真人正确地区分开来,那么这台机器就可以被视为通过了图灵测试,即具备了“智能”。

尽管图灵测试看似非常简单,但是机器想要能顺利通过这种测试是非常困难的。因为裁判具体会提哪些问题是不确定的,只有机器能够理解复杂的语义和上下文,拥有多方面的知识储备和语言表达能力,才有可能通过这项测试。

综上所述,尽管现阶段图灵测试还存在诸多不完善的地方和争议,但是它目前仍然业界评估人工智能发展水平的重要检测评估方案,一款人工智能类的水平如何,能否通过图灵测试是一项非常关键的评判指标。

毫无疑问,现阶段代表人工智能最高水平的是OpenAI开发的ChatGPT,那么,ChatGPT能否成功通过图灵测试呢?近期美国加州大学圣地亚哥分校的研究人员进行了这一激动人心的测试,图二为论文。

总共有500名志愿者(充当裁判)参加这项测试,与四名包括真人和人工智能在内的对象隔着屏幕聊天。参测的人工智能有多个、且是随机的,其中包括1960年代的人工智能程序ELIZA、GPT-3.5和GPT-4,整个对话聊天测试过程持续五分钟。

测试结束之后,志愿者需要根据自己的认知,来判断、回答与自己聊天的对象到底是真实人类,还是人工智能。

最终测试结果如下:

有22%的志愿者判定ELIZA为真实人类,有50%的志愿者判定GPT-3.5为真实人类,有54%的志愿者判定GPT-4.0为真实人类,有67%的志愿者判定与自己聊天的真实人类是真实人类,请参阅上图。

结果表明,GPT-4.0成功地通过了图灵测试,大部分人无法将它和真实人类区分开来。不过,它和真正的真实人类判定比例67%仍然有较大的差距,还有巨大的提升改进空间,尽管如此,这仍然是一项很了不起的成绩。

GPT-4.0成功通过图灵测试是一个重要的、具有关键性意义的里程碑,这说明人工智能现在真的已经不是噱头,已经越来越接近真实人类,人工智能时代已经真正来临。

另外,业界还有更加乐观、激进的观点:马斯克预言2027年左右人工智能将彻底超过人类。2027年并不遥远,马斯克的预言是否真的能够实现,未来两三年就能看到结果,非常值得期待。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
美军大批F-35将入驻日本三泽基地

美军大批F-35将入驻日本三泽基地

环球网资讯
2026-04-08 18:31:00
“唐僧”妻子陈丽华去世,470亿商业帝国谁来继承?

“唐僧”妻子陈丽华去世,470亿商业帝国谁来继承?

野马财经
2026-04-07 22:27:37
伊朗媒体披露全部10项停战条款

伊朗媒体披露全部10项停战条款

财联社
2026-04-08 11:12:26
欧冠1米95巨无霸杀疯了:14战巴萨轰7球!比肩两大传奇

欧冠1米95巨无霸杀疯了:14战巴萨轰7球!比肩两大传奇

叶青足球世界
2026-04-09 11:12:14
切特30+14+5+2+4无缘今日最佳!对不起,你碰到创纪录的米切尔了

切特30+14+5+2+4无缘今日最佳!对不起,你碰到创纪录的米切尔了

世界体育圈
2026-04-09 12:48:28
洛桑去世真相:博林25年后坦白,他其实没喝多少酒

洛桑去世真相:博林25年后坦白,他其实没喝多少酒

观察者海风
2026-03-26 23:12:53
特朗普:所有美国舰船、飞机和军事人员将继续留在伊朗周围,直到达成的协议得到全面遵守;此前特朗普称10项停战条款是“假新闻”

特朗普:所有美国舰船、飞机和军事人员将继续留在伊朗周围,直到达成的协议得到全面遵守;此前特朗普称10项停战条款是“假新闻”

大象新闻
2026-04-09 12:45:03
语文课不会教的:念奴娇、如梦令,千奇百怪的词牌名是怎么来的?

语文课不会教的:念奴娇、如梦令,千奇百怪的词牌名是怎么来的?

长风文史
2026-03-24 17:09:58
特朗普:美军将“继续驻扎在伊朗境内及其周边”

特朗普:美军将“继续驻扎在伊朗境内及其周边”

新华社
2026-04-09 12:21:10
唯物主义有什么缺陷?

唯物主义有什么缺陷?

小豫讲故事
2026-04-08 06:00:06
回顾:缅北女魔头魏榕嗜好!经常“活剥驴耳”,3个闺蜜喜欢观刑

回顾:缅北女魔头魏榕嗜好!经常“活剥驴耳”,3个闺蜜喜欢观刑

飞云如水
2024-11-13 06:54:13
老伴心梗抢救,给儿子打22个电话被儿媳怼,出院那天他们傻眼了

老伴心梗抢救,给儿子打22个电话被儿媳怼,出院那天他们傻眼了

云端小院
2026-04-09 09:43:05
游泳中心回应全红婵遭网暴:不管涉及任何人,一经查实严肃处理

游泳中心回应全红婵遭网暴:不管涉及任何人,一经查实严肃处理

米修体育
2026-04-08 13:30:24
一晚50分钟就够了!国家卫健委:深睡眠正常占比在13%~23%

一晚50分钟就够了!国家卫健委:深睡眠正常占比在13%~23%

时光派长寿观察
2026-04-07 19:22:44
全红婵被集体霸凌,队友潜伏攻击全红婵内部群,聊天记录被曝光!

全红婵被集体霸凌,队友潜伏攻击全红婵内部群,聊天记录被曝光!

眼光很亮
2026-04-08 12:10:03
《拯救大兵瑞恩2026版》中的那些“百思不得其解”

《拯救大兵瑞恩2026版》中的那些“百思不得其解”

百味朱砂
2026-04-07 10:54:47
山东男篮惜败浙江广厦,邱彪赛后萌生去意,他的确只是二流教练

山东男篮惜败浙江广厦,邱彪赛后萌生去意,他的确只是二流教练

姜大叔侃球
2026-04-09 11:54:23
郑丽文率团来大陆参访,国台办表态

郑丽文率团来大陆参访,国台办表态

参考消息
2026-04-08 11:37:19
曼联告知欲留队二人今夏肯定要出售!想收回5000万,节省30万周薪

曼联告知欲留队二人今夏肯定要出售!想收回5000万,节省30万周薪

罗米的曼联博客
2026-04-09 12:16:33
唐嫣稳站FendiC位,孟子义敬酒被当空气表情失控,娱乐圈太现实

唐嫣稳站FendiC位,孟子义敬酒被当空气表情失控,娱乐圈太现实

手工制作阿歼
2026-04-08 17:10:00
2026-04-09 13:19:00
宗熙先生
宗熙先生
分享科技、数码、互联网信息。
3114文章数 546关注度
往期回顾 全部

科技要闻

Meta凌晨首发闭源大模型 扎克伯格又行了?

头条要闻

达赖深度卷入爱泼斯坦权色网 印媒再披露惊人新证据

头条要闻

达赖深度卷入爱泼斯坦权色网 印媒再披露惊人新证据

体育要闻

40岁,但实力倒退12年

娱乐要闻

具俊晔最新露面,又黑又瘦情绪低迷

财经要闻

谈判基础已被破坏!霍尔木兹海峡关闭

汽车要闻

8155芯片+L2智驾 瑞虎5运动版上市 置换补贴价6.79万元起

态度原创

健康
艺术
数码
公开课
军事航空

干细胞抗衰4大误区,90%的人都中招

艺术要闻

庞茂琨 2026油画写生新作

数码要闻

Krafton 推出全新 AI 品牌“Raon”,首批四款 AI 模型全部开源

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

霍尔木兹海峡已再次关闭

无障碍浏览 进入关怀版