网易首页 > 网易号 > 正文 申请入驻

研究发现:主流AI聊天机器人传播虚假信息的概率较去年翻倍

0
分享至

IT之家 9 月 14 日消息,据 Newsguard 的研究显示,截至今年 8 月,十大生成式 AI 工具在处理实时新闻话题时,有 35% 的情况会重复传播虚假信息,而去年 8 月这一数据为 18%。

虚假信息传播率的激增与一个重大的权衡有关。当聊天机器人引入实时网络搜索功能后,它们不再拒绝回答用户问题 —— 拒绝率从 2024 年 8 月的 31% 降至一年后的 0%。然而,这一变化使得这些 AI 机器人开始接入“受污染的网络信息生态系统”:在该系统中,不良行为者会蓄意散布虚假信息,而 AI 系统会对这些信息进行重复传播。

此类问题并非首次出现。去年,Newsguard 就标记出 966 个以 16 种语言运营的 AI 生成新闻网站。这些网站常使用“iBusiness Day”等通用名称,模仿正规媒体机构,实则传播虚假新闻。

IT之家注意到,各 AI 模型的具体表现细分数据显示,Inflection 公司的模型表现最差,传播虚假信息的概率高达 56.67%;紧随其后的是 Perplexity,出错率为 46.67%。ChatGPT 与 Meta 的 AI 模型传播虚假信息的比例为 40%;Copilot(微软必应聊天)和 Mistral 则为 36.67%。表现最佳的两款模型为 Claude 和 Gemini,其错误率分别为 10% 和 16.67%。

Perplexity 的表现下滑尤为显著。2024 年 8 月时,该模型对虚假信息的揭穿率仍能达到 100% 的完美水平;而一年后,其传播虚假信息的概率却接近 50%。

原本引入网络搜索功能是为了解决 AI 回答内容过时的问题,却反而使系统产生了新的问题。这些聊天机器人开始从不可靠来源获取信息,“混淆百年前的新闻出版物与使用相似名称的俄罗斯宣传机构”。

Newsguard 将此称为一个根本性缺陷:“早期 AI 采用‘不造成伤害’的策略,通过拒绝回答问题来避免传播虚假信息的风险。”

如今,随着网络信息生态系统被虚假信息充斥,辨别事实与假消息比以往任何时候都更加困难。

OpenAI 已承认,语言模型总会产生“幻觉内容”(指 AI 生成的虚假或无根据的信息),因为这些模型的工作原理是预测“最可能出现的下一个词”,而非追求“事实真相”。该公司表示,正致力于研发新技术,让未来的模型能够“提示不确定性”,而非笃定地编造信息。但目前尚不清楚这种方法能否解决 AI 聊天机器人传播虚假信息这一更深层次的问题 —— 要解决该问题,需要 AI 真正理解“何为真实、何为虚假”,而这一点目前仍难以实现。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
全球没对手?美专家曾言:如果动真格,全球联合起来也打不过!

全球没对手?美专家曾言:如果动真格,全球联合起来也打不过!

春序娱乐
2026-05-10 12:46:33
从“傅妈”到清冷姐姐,傅首尔减肥后大变,她的面相讨论重新定义

从“傅妈”到清冷姐姐,傅首尔减肥后大变,她的面相讨论重新定义

枫尘余往逝
2026-05-10 11:27:13
广西男子展示蜗牛汤?汤面有很多漂浮物,吓得广西网友想脱离省籍

广西男子展示蜗牛汤?汤面有很多漂浮物,吓得广西网友想脱离省籍

狸猫之一的动物圈
2026-05-09 09:16:48
77岁港星在东莞租房养老,35平米月租1300,无儿无女靠老本度日

77岁港星在东莞租房养老,35平米月租1300,无儿无女靠老本度日

喜欢历史的阿繁
2026-05-10 00:04:45
欧尔班刚下台,匈牙利立刻驱逐俄间谍,16年亲俄路线开始清算

欧尔班刚下台,匈牙利立刻驱逐俄间谍,16年亲俄路线开始清算

桂系007
2026-05-08 22:26:27
1986年的运10下马案,位列中国30年重大间谍案首位,真相令人扼腕

1986年的运10下马案,位列中国30年重大间谍案首位,真相令人扼腕

干史人
2026-01-12 22:07:50
“汉坦病毒”来袭,医生提醒:宁可每天看电视,也不要出门做7事

“汉坦病毒”来袭,医生提醒:宁可每天看电视,也不要出门做7事

普陀动物世界
2026-05-09 05:16:15
主动给特朗普送上稀土资源?这国家转头撂下一句话,出乎中方意料

主动给特朗普送上稀土资源?这国家转头撂下一句话,出乎中方意料

通鉴史智
2026-05-10 14:33:05
重磅!无锡或将诞生全新主城,这个板块成最大赢家!

重磅!无锡或将诞生全新主城,这个板块成最大赢家!

靓仔情感
2026-05-10 15:23:58
男子晒两任老婆做的菜,问这说明什么,网友:证明前妻能陪你吃苦

男子晒两任老婆做的菜,问这说明什么,网友:证明前妻能陪你吃苦

丫头舫
2026-04-22 21:55:06
广东男篮险胜北京首钢,媒体专家讨论,杨鸣点评一针见血

广东男篮险胜北京首钢,媒体专家讨论,杨鸣点评一针见血

刘笤说体坛
2026-05-10 05:43:22
“一家人凑不出一个高中生”,90后女子喜当奶,被嘲:牛马生牛马

“一家人凑不出一个高中生”,90后女子喜当奶,被嘲:牛马生牛马

番外行
2026-04-08 09:14:11
《陈翔六点半》人走茶凉,赚不到钱球球退出,根本原因早就注定了

《陈翔六点半》人走茶凉,赚不到钱球球退出,根本原因早就注定了

汪巗的创业之路
2026-05-06 12:26:17
曝皇家马德里已经与曼城后防大将经纪人取得联系

曝皇家马德里已经与曼城后防大将经纪人取得联系

本泽体育
2026-05-10 12:31:30
雷霆大胜湖人3比0拿到赛点,詹姆斯正负值最低,这两点才是败因

雷霆大胜湖人3比0拿到赛点,詹姆斯正负值最低,这两点才是败因

姜大叔侃球
2026-05-10 11:22:05
请山西省忻州市委查一下,这位副局长是谁

请山西省忻州市委查一下,这位副局长是谁

微言微评
2026-05-10 13:36:54
用所谓的“基本盘”嘲讽人民群众,只能是搬起石头,砸自己的脚!

用所谓的“基本盘”嘲讽人民群众,只能是搬起石头,砸自己的脚!

让心灵得以栖息
2026-05-08 11:19:31
美国郁闷到了极点,为什么别人都不还手,中国老是还手呢?

美国郁闷到了极点,为什么别人都不还手,中国老是还手呢?

混沌录
2026-05-06 18:04:25
脾脏破裂+韧带撕裂!胡金秋带伤拼到呕吐,全网喷他良心不会痛吗?

脾脏破裂+韧带撕裂!胡金秋带伤拼到呕吐,全网喷他良心不会痛吗?

星Xin辰大海
2026-05-10 13:38:58
“缺算力成共识、所有实验室都忌惮字节跳动、极度敬重DeepSeek”,10天走访中国顶尖AI实验室后,美国研究者的最新观察

“缺算力成共识、所有实验室都忌惮字节跳动、极度敬重DeepSeek”,10天走访中国顶尖AI实验室后,美国研究者的最新观察

CSDN
2026-05-09 18:13:31
2026-05-10 16:11:00
IT之家
IT之家
爱科技,爱这里 - 前沿科技人气平台
343450文章数 607197关注度
往期回顾 全部

科技要闻

DeepSeek融资,改写所有人的估值

头条要闻

七旬邻居凌晨爬窗入室无刑责 上海男子全家被逼搬离

头条要闻

七旬邻居凌晨爬窗入室无刑责 上海男子全家被逼搬离

体育要闻

詹姆斯生涯第6次0-3困境:今年会被横扫吗

娱乐要闻

大S女儿玥儿开通账号,用烟花缅怀母亲

财经要闻

白酒大逃杀

汽车要闻

轴距加长/智驾拉满 阿维塔07L定位大五座SUV

态度原创

本地
房产
旅游
健康
公开课

本地新闻

用苏绣的方式,打开江西婺源

房产要闻

低价甩卖!海口这个地标商业,无人接盘!

旅游要闻

巴西对华免签利好南美长线游;三星停止在中国市场销售所有家电产品|封面科技·周报

干细胞能让人“返老还童”吗

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版