网易首页 > 网易号 > 正文 申请入驻

【人工智能】你以为能看穿AI?研究打脸:人类误判率高达63%

0
分享至

随着人工智能的发展,人工智能生成的图像和文本与人类创作的内容越来越难以区分。无论是逼真的深度伪造视频、艺术作品还是复杂的聊天机器人,这些作品常常让人们怀疑自己是否能分辨出什么是真实的,什么是人工智能制作的。

探索人们检测人工智能生成内容的准确度,并将该准确度与他们对自己能力的感知进行比较。

人类检测人工智能的能力

近年来,人工智能技术发展迅速,创造出视觉艺术、撰写文章、创作音乐并生成高度逼真的人脸。随着用于文本生成的 ChatGPT 和用于图像创建的 DALL-E 等工具的兴起,人工智能内容已成为日常生活的一部分。曾经看似明显像机器的东西现在往往与人类的作品难以区分。

随着人工智能内容变得越来越复杂,检测它的挑战也越来越大。2023 年的一项研究表明,区分人工智能和人类内容是多么困难。研究人员发现,人工智能生成的面孔实际上比真实面孔更像人类,这种现象被称为超现实主义。

在这项研究中,参与者被要求区分人工智能生成的面孔和真人面孔。令人惊讶的是,那些在识别人工智能面孔方面表现较差的人对自己识别人工智能面孔的能力更有信心。这种过度自信放大了他们的错误,因为参与者总是误认为人工智能生成的面孔更像人类,尤其是当面孔是白人时。

研究还发现,人工智能面孔通常被认为比人类面孔更熟悉、更匀称、更有吸引力——这些属性影响了参与者的误判。这些发现凸显了人工智能生成的内容如何利用某些心理偏见,使个人更难准确识别什么是真实的,什么是人工制作的。

在一项涉及 100 名不同年龄段参与者的相关研究中,结果表明,年轻参与者更善于识别人工智能生成的图像,而老年人则更难识别。有趣的是,参与者的信心和准确率之间也存在正相关关系,尽管常见的错误分类与动物皮毛和人类手中不自然的细节等细微的伪影有关。

人工智能为何难以被发现?

人们难以区分人类创造的内容和人工智能生成的内容的原因有很多。其中一个原因是人工智能越来越现实,尤其是所谓的强人工智能和弱人工智能。

弱人工智能是指旨在处理特定任务(如生成文本或图像)的系统,虽然它们模仿人类行为,但它们并不具备真正的理解力或意识。弱人工智能的例子包括聊天机器人和图像生成器。另一方面,强人工智能代表了假设的系统,它们可以在各种任务中像人类一样思考、学习和适应。

目前,大多数人日常使用的工具都属于弱人工智能。然而,它们模拟人类创造力和推理的能力已经非常先进,以至于区分人类和人工智能生成的内容变得越来越困难。

OpenAI 的 GPT 模型等工具已在大量数据集上进行训练,使它们能够生成自然连贯的语言。同样,图像生成器已在数百万个视觉输入上进行训练,使它们能够创建与现实极为相似的逼真图片。

此外,人工智能现在不仅可以复制人类作品的外观,还可以复制其风格和语调。例如,人工智能撰写的文本可以模仿专业写作的细微差别,根据上下文采用适当的语调、结构甚至个性特征。这种适应性使人们更难依靠直觉来判断某篇文章是机器写的还是人写的。

另一个挑战是缺乏明确的迹象。虽然早期的人工智能作品通常可以通过笨拙的语法、奇怪的图像伪像或过于简单的结构来识别,但现代人工智能已经变得更加善于消除这些迹象。因此,即使是熟悉该技术的人也很难依靠以前的模式来检测人工智能作品。

案例研究:人类检测人工智能生成的内容

多项研究已经证实了检测人工智能内容的挑战。

一项研究中,教师正确识别 AI 生成的学生论文的概率仅为 37.8%-45.1%,具体取决于他们的经验水平。同样,另一项研究中的参与者分别只能以58% 和 50% 的概率识别出 GPT-2 和 GPT-3 的内容,这表明在区分 AI 与人类作品时,人类判断力存在局限性。

宾夕法尼亚州立大学进行的实验进一步证实了这些发现,参与者只能在 53% 的时间内区分出人工智能生成的文本,仅比随机猜测好一点点。这凸显了人们检测人工智能内容的难度,即使在人类和人工智能编写的文本之间进行二元选择时也是如此。

在科学摘要和住院医师申请等专业领域,拥有多年经验的专业人士正确识别人工智能生成内容的概率仅为 62%。评估人员以 65.9% 的准确率识别出人工智能编写的住院医师申请,这凸显了人工智能日益复杂化以及依靠人类感知进行检测的挑战。

另一项研究显示,人类有 54%的时间将 GPT-4 误认为是人类,这表明即使是高级用户也难以检测。大学教师正确识别人工智能生成的论文的几率为 70%,而学生的正确率仅为 60%。尽管这些数字较高,但仍然存在相当大的误差幅度,这表明在学术界准确检测人工智能内容的难度很大。

影响人工智能检测准确率的因素

有几个因素会影响人们判断人工智能内容的能力。其中一个因素是所分析内容的复杂性。人工智能生成的文本越短,就越难检测,因为读者没有太多背景信息来识别不寻常的措辞或结构。

相比之下,较长的文本可能会为读者提供更多机会来注意到表明人工智能参与的不一致或模式。同样的原则也适用于图像——简单的图片可能更难与真实图片区分开来,而高度复杂的场景有时可以揭示人工智能生成的微妙迹象。

最后,所使用的 AI 模型类型也会影响检测准确性。例如,OpenAI 的 GPT-3 模型比旧版本生成更令人信服的文本,而 MidJourney 等较新的图像生成工具比其前代产品创建更逼真的视觉效果。

人工智能检测的心理影响

检测人工智能生成内容的难度引发了重要的心理和社会问题。其中之一是人们对所见所闻的信任程度有多高。

人工智能越来越擅长模仿人类的创造力,因此制造和传播虚假信息变得更加容易,因为人们可能会在不知情的情况下消费由机器出于特定目的制作的内容。这在政治言论等领域尤其令人担忧,因为人工智能制作的深度伪造或误导性文章可能会影响公众舆论。

此外,许多人对检测人工智能制作的内容过于自信,这会导致一种虚假的安全感。事实上,即使是人工智能专家也难免会被复杂的机器制作的作品所欺骗。这种现象被称为“解释深度错觉”,即人们仅仅因为熟悉复杂系统的基本原理,就高估了自己对它的理解。

人工智能检测的未来:情况能否改善?

面对这些挑战,我们可以做些什么来提高人类检测人工智能生成内容的能力呢?一个可能的解决方案是开发人工智能检测工具。正如人工智能在生成内容方面变得更好一样,研究人员也在致力于创建能够识别某些东西是否由机器制作的系统。

教育是另一个潜在的解决方案。通过提高对人类判断的局限性和人工智能的复杂性的认识,人们在评估内容时可以变得更加谨慎和批判。教授个人如何识别人工智能制作的内容的课程,例如分析文本中的异常模式或发现图像中的不一致之处,可以帮助提高检测准确性。

人工智能检测的未知复杂性

随着人工智能模糊了人类和机器生成内容之间的界限,人们越来越难以准确识别人工智能创作。

虽然许多人都认为自己有很强的识别人工智能的能力,但事实上,大多数人在区分真实内容和机器制作内容方面的能力只比随机性强一点点。感知与现实之间的差距凸显了现代人工智能的复杂性,以及对基于技术的解决方案和增强意识以驾驭这一新数字环境的需求。

未来几年,随着人工智能的不断进步,人们必须确定自己在检测人工智能方面的能力以及人工智能的重要性。随着机器进一步融入日常生活,人们的关注点可能会从检测转向了解如何与人工智能共存,以保持信任、创造力和人类真实性。

免责声明:

本文所发布的内容和图片旨在传播行业信息,版权归原作者所有,非商业用途。如有侵权,请与我们联系。所有信息仅供参考和分享,不构成任何投资建议。投资者应基于自身判断和谨慎评估做出决策。投资有风险,入市需谨慎。

注我们,一起探索AWM

2025-03-24

2025-03-25

2025-03-22

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
唯一被灭亡的世界级宗教,曾在中国盛极一时,不少人知道它的名字

唯一被灭亡的世界级宗教,曾在中国盛极一时,不少人知道它的名字

凡人侃史
2026-03-31 12:20:37
子女出息,必有信号:家中出现这4个征兆,暗示儿女将来会有出息

子女出息,必有信号:家中出现这4个征兆,暗示儿女将来会有出息

木言观
2026-05-02 06:53:52
东南亚活人坟场:这里没有完整的人,失去手脚的人被叫做“标本” | 边水往事第二季03

东南亚活人坟场:这里没有完整的人,失去手脚的人被叫做“标本” | 边水往事第二季03

天才捕手计划
2026-04-30 21:34:57
陈都灵,瘦的让人心疼

陈都灵,瘦的让人心疼

陈意小可爱
2026-05-01 10:53:54
伊朗足协主席:从未见过如此软弱的国际足联,完全被美国要挟

伊朗足协主席:从未见过如此软弱的国际足联,完全被美国要挟

懂球帝
2026-05-02 12:42:12
北控被忽悠之二:管理层没想到这一点,彪哥或许不会有下一站

北控被忽悠之二:管理层没想到这一点,彪哥或许不会有下一站

生活新鲜市
2026-05-02 09:23:53
王室园丁爆料,查尔斯和卡米拉生活节奏天差地别,戴安娜输在不爱

王室园丁爆料,查尔斯和卡米拉生活节奏天差地别,戴安娜输在不爱

照见古今
2026-04-24 18:25:23
“老师最烦这种现眼包家长”,宝妈穿紧身裙参加运动会,被嘲

“老师最烦这种现眼包家长”,宝妈穿紧身裙参加运动会,被嘲

番外行
2026-04-15 10:03:50
武亮回应转移资产:我恨不得张姩菡现在就来上班,她说她还要读研

武亮回应转移资产:我恨不得张姩菡现在就来上班,她说她还要读研

玖宇维
2026-05-02 09:26:45
花掉三亿人民币,打捞一艘800年沉船,打开船舱后,所有人都懵了

花掉三亿人民币,打捞一艘800年沉船,打开船舱后,所有人都懵了

海佑讲史
2026-04-30 17:15:12
全球独一份!东山精密砍掉oDSP,光通信万亿壁垒炸穿了

全球独一份!东山精密砍掉oDSP,光通信万亿壁垒炸穿了

慧眼看世界哈哈
2026-04-30 17:19:49
陕西11岁男孩失联10天后确认遇难,排除刑事案件,家属回应:孩子父亲情绪崩溃不愿意和人说话,落水原因还在调查中

陕西11岁男孩失联10天后确认遇难,排除刑事案件,家属回应:孩子父亲情绪崩溃不愿意和人说话,落水原因还在调查中

极目新闻
2026-05-01 19:12:44
李湘在长沙小区被路人偶遇,整个人瘦到像换了个人,忒美了

李湘在长沙小区被路人偶遇,整个人瘦到像换了个人,忒美了

动物奇奇怪怪
2026-04-30 17:30:48
新款雷克萨斯LX600曝光 内饰升级 搭混动系统

新款雷克萨斯LX600曝光 内饰升级 搭混动系统

沙雕小琳琳
2026-05-02 09:24:25
啊?雨下午就到!一直持续至……

啊?雨下午就到!一直持续至……

上海静安
2026-05-02 11:14:39
纠结啊!47岁深圳离异男存款170万、社保满20年,想辞职有出路吗

纠结啊!47岁深圳离异男存款170万、社保满20年,想辞职有出路吗

火山詩话
2026-04-30 06:23:09
苏宁陨落:南京不仅是政治的短命王朝,也是商业首富们的短命王朝

苏宁陨落:南京不仅是政治的短命王朝,也是商业首富们的短命王朝

道术意义
2026-05-01 07:32:15
中纪委2026严查新方向,这6类岗位首当其冲

中纪委2026严查新方向,这6类岗位首当其冲

细说职场
2026-05-01 08:18:54
深蹲,被严重低估了!研究提示:每天坚持5分钟,能预防6种疾病

深蹲,被严重低估了!研究提示:每天坚持5分钟,能预防6种疾病

增肌减脂
2026-04-30 19:15:09
陈百祥香港豪宅宴贵客!舍近求远请内地大厨赴港,做一桌吴川美食

陈百祥香港豪宅宴贵客!舍近求远请内地大厨赴港,做一桌吴川美食

童叔不飙车
2026-05-02 09:31:41
2026-05-02 13:52:49
七元宇宙 incentive-icons
七元宇宙
AI、Web3、Meta聚合型精选内容分享。以前沿视角,探索科技未来;让每一个人,都走在时代的前沿
2042文章数 92关注度
往期回顾 全部

科技要闻

AI热潮耗尽库存,Mac Mini起售调高200美元

头条要闻

男子被诊断为疑似肝癌 辗转其他医院检查均无癌症依据

头条要闻

男子被诊断为疑似肝癌 辗转其他医院检查均无癌症依据

体育要闻

休赛期总冠军,轮到休斯顿火箭

娱乐要闻

白百何罕晒大儿子 18岁元宝越来越帅

财经要闻

雷军很努力 小米还是跌破了30港元大关

汽车要闻

新纪录!零跑汽车4月交付达71387台

态度原创

数码
房产
旅游
公开课
军事航空

数码要闻

快睿推出H系列L型热管风冷,至高200W解热能力

房产要闻

所有户型全卖爆!海口TOP级豪宅,景观样板间五一全线开放!

旅游要闻

“五一”美团小团游订单增27%,新疆、云南、北京居热度Top3

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

特朗普:对伊战事结束 无限期延长停火

无障碍浏览 进入关怀版