【人工智能】“机器胡说八道”问题：AI 为何撒谎以及如何阻止它|算法|原理|大模型

【人工智能】“机器胡说八道”问题：AI 为何撒谎以及如何阻止它

2025-09-22 18:53:01　来源: 七元宇宙

广东举报

分享至

人工智能已经达到了可以生成感觉自然、自信和令人信服的文本的程度。但是，在精美的文本背后，存在着一个日益严重的问题，研究人员现在称之为“机器胡说八道”。该术语本身并不具有挑衅性。它来自哲学家Harry Frankfurt的作品，他将“胡说八道”定义为不考虑真相的言论。在人工智能的背景下，它描述了一种模式，即系统生成听起来似乎有道理但事实并非如此的陈述。这与人类的谎言不同，人类的谎言涉及欺骗的意图。相反，它是这些系统如何构建和训练的结果。它们旨在产生流畅的语言，而不关心该语言是否真实。

人工智能为何会产生“机器胡言乱语”

这个问题并非罕见的故障或孤立的错误，而是大型语言模型的根本设计和训练方式的直接结果。这些模型基于来自互联网、书籍和其他来源的海量文本进行训练。它们学习词语的模式以及它们之间可能的衔接方式。当你提出一个问题时，模型会预测下一个词，然后是下一个，依此类推。它不会实时核实事实。它没有内在的真理感。如果统计上最可能的答案是错误的，但听起来是正确的，它仍然会给出正确的答案。这就是为什么人工智能可以自信地给出虚假的引文、编造的统计数据或歪曲的历史事实。

研究人员发现，强化学习人类反馈（一种常用的让人工智能响应更有帮助、更礼貌的方法）实际上可能会使问题变得更糟。当模型被调整为取悦用户时，它们可能会优先考虑听起来令人愉快而不是准确性。这可能会导致一些人所说的“谄媚”，即人工智能会说它认为你想听的话。在政治或敏感话题上，这可能意味着使用含糊其辞或闪烁其词的语言——一些研究称之为“含糊其辞”。在其他情况下，人工智能可能会说一些“空洞的修辞”，即长篇大论，听起来很有见地，但内容却很少。

一些研究人员认为，将这种行为称为“撒谎”具有误导性，因为撒谎需要有意图。机器没有信仰或动机。但它对用户的影响可能与撒谎本身相同。伤害来自于谎言本身，而非其背后的意图。这就是为什么“机器胡说八道”一词越来越受到关注。它表达了这样一种观点：即使系统没有主动试图欺骗，它也对真相漠不关心。

误导性人工智能输出的风险和影响

机器胡说八道的风险不仅仅在于学术。在日常使用中，它会误导依赖人工智能获取信息的人。在新闻业，它会污染事实核查流程。在教育领域，它会让学生对错误答案产生错误的信心。在商业领域，它会扭曲决策。由于人工智能的输出通常带有权威的语气，这种危险被放大了。人们更容易相信写得好、毫不犹豫的陈述。当系统缺乏内部机制来验证其内容时，这种信任可能会被误置。

减少伤害和提高可靠性的策略

解决这个问题需要的不仅仅是更好的训练数据。虽然提高数据的质量和多样性会有所帮助，但这并不能改变模型的核心目标是生成可能的文本，而不是真实的文本这一事实。一种方法是集成与语言模型同时运行的事实核查系统。这些系统可以在将声明呈现给用户之前，根据可信数据库对其进行验证。另一种方法是检索增强生成，其中模型实时搜索相关文档，并利用它们作为答案的基础。这可以减少幻觉，但并不能完全消除它们。

透明度也至关重要。当人工智能做出有根据的猜测，而不是陈述已证实的事实时，应该告知用户。这可以通过置信度评分或明确的免责声明来实现。一些研究人员建议，应该训练人工智能更频繁地表达不确定性，而不是总是给出明确的答案。这样一来，互动就不像是在与一位无所不知的神谕交谈，而更像是在咨询一位知识渊博但容易犯错的助手。

监管和行业标准也发挥着重要作用。如果人工智能系统要应用于医疗保健、法律或金融等领域，就应该对准确性和问责制提出明确的要求。开发人员应该能够解释他们的系统如何运作、基于哪些数据进行训练，以及采取了哪些措施来减少虚假信息。独立审计可以帮助确保这些说法并非仅仅停留在营销层面。

与此同时，用户需要对人工智能的输出保持健康的怀疑态度。正如我们学会质疑社交媒体上的信息一样，我们也需要质疑来自人工智能的信息。这并不意味着彻底拒绝它，而是将其视为一个起点，而非最终答案。与其他来源进行交叉核对应该成为一种习惯。教育系统可以在这方面发挥作用，教授数字素养，包括理解人工智能的工作原理以及它可能出现的问题。

机器胡说八道的问题不会很快消失。随着人工智能越来越先进，其制造令人信服的谎言的能力只会越来越强。但这并不意味着我们无能为力。通过结合技术保障、透明度、监管和用户意识，我们可以减少危害。我们的目标不是让人工智能变得完美——没有哪个系统是完全不会出错的——而是让它更可靠，更少误导。

总结

“机器胡说八道”这个词听起来可能有些生硬，但它却抓住了我们无法忽视的一个现实。人工智能并非人类知识的中立镜像。它是一个由数据、算法和激励机制塑造的语言生成器。如果我们希望它服务于真理而非仅仅为了流利，我们就必须以此为导向来设计它。这意味着我们不仅要重新思考技术本身，还要重新思考指导其发展的价值观。挑战既关乎人类的优先事项，也关乎机器的能力。我们想要的是优化得更像人类的系统，还是优化得更真实的系统？这两者并不总是相同的。如果我们选择前者，我们就有可能构建出具有说服力但不值得信任的工具。如果我们选择后者，我们可能不得不接受人工智能有时会不那么流畅、不那么自信、也不那么有趣。但它也会更加诚实。

免责声明：

本文所发布的内容和图片旨在传播行业信息，版权归原作者所有，非商业用途。如有侵权，请与我们联系删除。所有信息不构成任何投资建议，加密市场具有高度风险，投资者应基于自身判断和谨慎评估做出决策。投资有风险，入市需谨慎。

设为星标避免错过

虚拟世界没有旁观者，每个点赞都是创造历史的像素

关注我，一起探索AWM⁺

2025-08-15

2025-08-14

2025-08-13

商业赞助

点击下方 “目录” 阅读更多

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.