上海书展 | 你以为在测试AI，殊不知AI也在“反向测试”你|原理|编程|上海市|人工智能|超级智能|大语言模型

上海书展 | 你以为在测试AI，殊不知AI也在“反向测试”你

2025-08-13 18:18:39　来源: 文汇报

上海举报

分享至

大语言模型正以惊人的速度重塑世界，引发一场全新的智能革命。从ChatGPT的横空出世，到各行各业的颠覆式变革，大语言模型不仅仅是技术热点，更是我们理解未来、把握机遇的关键所在。《大语言模型》一书旨在带领读者深入这场变革的核心。你将了解：1.大语言模型的原理与应用：探索Transformer等核心技术原理，揭开大语言模型的神秘面纱。 2.智能革命的影响力：洞悉大语言模型在医疗、法律、教育、编程、艺术等领域的广泛应用和深远影响，看它如何提升效率、催生新职业，又带来哪些挑战。 3.超越技术的思考：引领你探讨智能、思维与意识的本质，以及大语言模型对这些核心概念的冲击和启发。这场由大语言模型驱动的智能革命已经到来，不了解它，你就可能错过未来。这本书不仅为你揭示大语言模型的技术奥秘，更重要的是，它将帮助你在充满不确定性的时代，看清智能发展的浪潮，把握住属于你的机遇。

本书是《深度学习》作者特伦斯·谢诺夫斯基的新作，他与AI教父辛顿同属一个核心圈层，担任AI峰会NeurIPS基金会主席，美国四院院士。他站在生物学与计算机科学的交叉点，以其独特视角，为读者带来兼具科学严谨性与科普易读性的思想盛宴。

>>内文选读：

自从OpenAI于2022年11月推出ChatGPT以来，大语言模型的突飞猛进让世界再次震惊。人们对它的反应可谓喜忧参半：一方面为它能快速生成流畅文本而着迷，另一方面又担忧它对就业前景和未来发展的影响。

语言作为人类最根本的能力，一直是我们判断智力水平的关键标准。如今，人工智能的快速发展引发了一些人对超级智能突破的担忧，认为这可能危及人类的生存。比尔·盖茨、埃隆·马斯克乃至教皇方济各等知名人士都对此发出警示。

一点是毋庸置疑的——尽管ChatGPT不是人类，但大语言模型在处理和提取海量文本数据方面已经超越了人类的能力。这种仿佛来自异世界的“造访”，在学界引发了一场争议：大语言模型是否真正理解它们所产生的内容？我们要如何验证一个系统是否真正具备理解能力？而对人类的理解过程本身，我们又了解多少？

大模型也在反向“试探”你的智能

众所周知，图灵测试是检验人工智能模拟人类反应能力的经典方法，而目前有趣的一点是，在实际人与大语言模型交互过程中，大语言模型似乎在进行一种更为微妙的反向图灵测试，通过映射我们的反应来检验对话者的智能水平和提示质量。这具体表现为：

对话者的思维水平越高，提供的提示越有深度，大语言模型就能展现出越高的智能表现。当对话者表达强烈观点时，模型也会相应地展现出更大的互动热情。

这种映射现象可以理解为启动效应与语言能力的协同作用。这一现象并不能说明大语言模型具备与人类相同的智能或意识，但确实展示了它在模仿人类个性特征方面的卓越能力。

大语言模型在映射用户需求和智慧时，可能就像《哈利·波特》中的厄里斯魔镜。这面魔镜“只能映照出观看者内心最深切、最渴望的愿望，仅此而已。然而，它既不能赋予知识，也不能揭示真相。人们可能会在镜前虚度光阴，或是被镜中景象迷惑，甚至因无法分辨这些景象的真实性与可能性而陷入疯狂。”

通用人工智能一直是人工智能领域追求的终极目标。有趣的是，这种通用能力正在大语言模型中逐步显现，但其实现形式与早期人工智能研究者的设想有所不同。大语言模型不仅展现出在各类语言任务中的多面性，还具备编程等跨领域能力。

特别值得注意的是，这些模型表现出了超乎预期的社交智能。镜像假说为我们提供了一个全新的思考角度：通用智能是否首先源于人类的社交互动能力，而语言能力是在进化过程中发展出来的社交强化工具？这促使我们需要重新审视人类“通用智能”的本质和起源。这种观点可能会对我们理解智能的本质带来革命性的改变。

人类“智能”的标准该重写了吗？

2023年12月1日，加州大学圣迭戈分校认知科学系举办了一场主题为“ChatGPT真的理解语言吗？”的教师辩论会，现场座无虚席。

反方辩手首先提出了“中文屋”的变体：一位哲学家在房间内，有人从门缝递进写有中文的纸条，这位哲学家按照既定算法处理后将回应递回门外。那么，这位哲学家是否真正理解了中文？这个论证引发了诸多质疑。

在辩论中，案例被改编为“匈牙利语屋”，哲学家则被替换为大语言模型，从而推论出大语言模型并不理解匈牙利语。然而，如果我们把“匈牙利语屋”换成“匈牙利大脑”，把哲学家换成物理定律，同样的论证逻辑依然成立。至此，辩论的水平开始走低。

在我看来，这就像一杯水，反方认为它是半空的，正方认为它是半满的，真相应该介于两者之间。在随后的问答环节中，我提出语言学家普遍认为语言的表达能力源于语法，而在语法生成能力方面，大语言模型实际上比多数人更为出色。对此，反方认为语法问题并非核心所在。值得注意的是，随着技术的不断进步，人们对人工智能的评判标准也在不断提高。

关于大语言模型是否具有智能的讨论，最终取决于我们如何定义“智能”。

大语言模型LaMDA通过了阿尔卡斯设计的心智理论测试，而心智理论被认为是自我意识的重要标志之一。不过，也有不少人对此持谨慎怀疑态度。人类往往会低估其他动物的智能，仅仅因为它们无法与我们进行语言交流。这种消极偏见恰好与另一种偏见形成呼应：我们倾向于对能与我们交谈的个体产生积极偏见，即便它们的实际智能水平可能并不高。

这不禁让人思考：我们是否具备足够的智慧来判断智能？大语言模型问世仅有短短数年，现在就推断它们或其后代可能达到怎样的智能水平还为时尚早。就像会说话的狗最令人称奇的是它能说话这一点本身，而非它所说内容的智慧程度或真实性。大语言模型即便在不够准确的情况下也会做出自信满满的回应。如果我们将评判标准从理想化的人类转向普通人，或许能得到更切实的比较结果。

专家们对大语言模型智能的认知分歧，凸显出我们基于自然智能的传统认知框架已难以适应当前形势。大语言模型的出现为我们提供了一个重要契机，促使我们突破固有思维模式，超越19世纪心理学遗留下来的过时概念。我们需要重新审视并深化对“智能”“理解”“伦理”以及“人工”等核心概念的认识。

人类的智能显然不仅限于语言能力；我们可能在某些领域与大语言模型拥有共同的智能特征，但在其他方面则存在本质差异。以创造力为例，它是自然智能的典型特征，而大语言模型也确实展现出了创造性思维的潜质。在实际对话中，如果否认大语言模型具备理解人类意图的能力，那么它生成的许多文本内容就难以得到合理解释。这使我们必须对“意图”这一概念进行更深入的探讨。这一概念源自心智理论，而心智理论本身也值得我们进行更细致的研究和重新思考。

问题的关键在于，对于大脑这样一个复杂系统，存在着无数相互作用的神经元和内部状态，不同的实验探测了不同的大脑区域，实际上每个实验研究的都是不同类型的“注意力”。对于大脑这样的复杂动力系统，很难用“注意力”和“意识”这样的概念来进行准确定义。

语言赋予人类独特能力，但词语本身具有不稳定性，这种不稳定性恰恰是它们力量的源泉。因此，我们需要更坚实的基础来构建新的概念框架。

我们正处在一个前所未有的历史机遇期，这与17世纪物理学变革时期极为相似。当时，“力”“质量”和“能量”等概念经过数学形式化处理，从模糊的术语转变为精确的可测量指标，由此奠定了现代物理学的基础。在研究大语言模型的过程中，我们很可能会发现关于智能本质的新原理，就像20世纪物理学家揭示物理世界的基本原理一样。正如量子力学在首次提出时违背人们的直觉认知一样，当智能的基本原理被揭示时，可能也会呈现出违反常理的特性。

自然是否在高度进化的灵长类大脑中实现了一个类似于大语言模型的系统？通过研究大语言模型展现的语言处理能力，我们可能会发现一些关于语言智能的基本原理，这些原理或许能够推广到社会智能、机械智能等其他智能形式。与生物进化相比，大语言模型的发展速度要快得多。一旦相关技术基础确立，其性能就会在持续改进中不断提升。

这项技术最为突出的特点在于：在探索其发展的过程中，我们可能会深入理解人类智能的本质。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.