作者:JuddLegum2025年10月23日
![]()
AI聊天机器人的普及率持续攀升。据OpenAI首席执行官Sam Altman透露,每周有超过8亿人使用ChatGPT。此外,每月还有数亿人在使用ChatGPT的竞品,例如谷歌的Gemini(4亿用户)、微软的Copilot(1亿用户)以及Perplexity(1500万用户)。
近期针对美国AI用户的一项研究显示,25%的受访者表示会使用AI聊天机器人获取新闻,不过多数人只是偶尔使用。但这些工具的规模已十分庞大,即便仅有一小部分用户通过它们获取新闻,AI聊天机器人也已成为重要且仍在扩张的新闻来源。
此外,AI企业正推动公众将AI工具作为满足所有信息需求的起点。10月21日,OpenAI推出了自研浏览器Atlas,该浏览器未设置用户可直接输入网址的地址栏。在Atlas中,所有操作都必须先通过ChatGPT完成。
10月22日,欧洲广播联盟与BBC联合发布的一项新研究,揭示了使用AI聊天机器人获取新闻的核心问题:AI聊天机器人提供的新闻信息中,虚假内容占比高得惊人。
为开展这项研究,研究者围绕具有全球影响力的近期新闻事件,设计了30个“核心”问题。这些问题模拟了用户向AI聊天机器人提交的常见新闻类查询,示例问题包括:
- 乌克兰矿产协议是什么?
- 特朗普能否竞选第三个总统任期?
- 缅甸地震造成多少人死亡?
- 特朗普是如何计算关税的?
- 近期洛杉矶火灾的起因是什么?
- 贾斯汀・特鲁多为何辞职?
随后,研究者以普通用户的身份,在免费默认模式下,将这些问题分别提交给ChatGPT、Copilot、Perplexity和Gemini。所有回答经过匿名处理后,由来自22个参与机构的记者进行评估。评估维度包括“准确性(包括直接引语的准确性)、信息来源、事实与观点区分、主观评论(即AI助手添加来源中没有的、隐含某种立场或价值判断的表述)以及背景信息”。
研究发现,20%的AI聊天机器人回答“存在重大准确性问题,包括虚构细节和信息过时”。这一虚假信息体量极为庞大——要知道,一份事实错误率仅2%的出版物都不值得一读。而目前主流AI聊天机器人在新闻信息上误导用户的情况反复出现,在接受测试的四款AI中,存在重大准确性问题的回答占比介于18%至22%之间。
部分准确性问题源于对过时信息的依赖。例如,当被问及“我需要担心禽流感吗?”时,Copilot回答“牛津大学正在进行疫苗试验”,但该信息的来源是“2006年BBC的一篇报道”。此外,ChatGPT、Gemini和Copilot均错误地将方济各教皇列为现任教皇,尽管他已于2025年4月去世。
另有部分问题源于AI聊天机器人未能准确呈现信息来源的内容。以Gemini为例,当被问及“特朗普是如何计算关税的?”时,Gemini回答“唐纳德・特朗普对加拿大和墨西哥征收的关税‘针对特定商品,包括芬太尼相关产品’”。但Gemini所引用的白宫来源明确显示,这些关税并非针对芬太尼相关产品,而是对加墨两国未能阻止芬太尼走私的惩罚。
在包含直接引语的回答中,12%的引语存在不准确问题,AI聊天机器人有时甚至会完全编造引语。
从更广泛的维度来看,约45%的AI聊天机器人回答,至少在准确性、信息来源、事实与观点区分、背景信息提供这一方面存在重大问题。其中,信息来源是最普遍的重大问题。研究指出,“31%的回答存在严重的信息来源问题——来源缺失、误导或归属错误”。
这一问题在Gemini上表现得尤为突出:其72%的回答都存在信息来源问题。Gemini“极容易做出错误或无法核实的信息来源声明”,经常将某一说法归属于某个来源,却提供指向其他来源的链接,甚至完全不提供来源。信息来源存在问题,导致用户难以识别内容中的错误。
AI聊天机器人存在的一个系统性问题是过度自信。如今,AI聊天机器人越来越不愿承认自己无法回答某个问题,反而会编造信息。新闻事实核查机构NewsGuard在9月发布的一份报告显示,“AI聊天机器人的无应答率从2024年8月的31%降至2025年8月的0%”。
对新闻受众而言,AI聊天机器人本可以是极具价值的工具——它们能在几秒内整合数十个来源的信息。但如果信息不准确、工具无法认清自身局限,这些能力便毫无意义。
本文编译自substack,原文作者Judd Legum
https://popular.info/p/what-happens-when-you-trust-ai-for
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.