网易首页 > 网易号 > 正文 申请入驻

上海书展 | 你以为在测试AI,殊不知AI也在“反向测试”你

0
分享至


大语言模型正以惊人的速度重塑世界,引发一场全新的智能革命。从ChatGPT的横空出世,到各行各业的颠覆式变革,大语言模型不仅仅是技术热点,更是我们理解未来、把握机遇的关键所在。《大语言模型》一书旨在带领读者深入这场变革的核心。你将了解:1.大语言模型的原理与应用:探索Transformer等核心技术原理,揭开大语言模型的神秘面纱。 2.智能革命的影响力:洞悉大语言模型在医疗、法律、教育、编程、艺术等领域的广泛应用和深远影响,看它如何提升效率、催生新职业,又带来哪些挑战。 3.超越技术的思考:引领你探讨智能、思维与意识的本质,以及大语言模型对这些核心概念的冲击和启发。 这场由大语言模型驱动的智能革命已经到来,不了解它,你就可能错过未来。这本书不仅为你揭示大语言模型的技术奥秘,更重要的是,它将帮助你在充满不确定性的时代,看清智能发展的浪潮,把握住属于你的机遇。

本书是《深度学习》作者特伦斯·谢诺夫斯基的新作,他与AI教父辛顿同属一个核心圈层,担任AI峰会NeurIPS基金会主席,美国四院院士。他站在生物学与计算机科学的交叉点,以其独特视角,为读者带来兼具科学严谨性与科普易读性的思想盛宴。


《大语言模型》,[美]特伦斯•谢诺沃斯基 著,李梦佳 译,中信出版集团2025年7月出版

>>内文选读:

自从OpenAI于2022年11月推出ChatGPT以来,大语言模型的突飞猛进让世界再次震惊。人们对它的反应可谓喜忧参半:一方面为它能快速生成流畅文本而着迷,另一方面又担忧它对就业前景和未来发展的影响。

语言作为人类最根本的能力,一直是我们判断智力水平的关键标准。如今,人工智能的快速发展引发了一些人对超级智能突破的担忧,认为这可能危及人类的生存。比尔·盖茨、埃隆·马斯克乃至教皇方济各等知名人士都对此发出警示。

一点是毋庸置疑的——尽管ChatGPT不是人类,但大语言模型在处理和提取海量文本数据方面已经超越了人类的能力。这种仿佛来自异世界的“造访”,在学界引发了一场争议:大语言模型是否真正理解它们所产生的内容?我们要如何验证一个系统是否真正具备理解能力?而对人类的理解过程本身,我们又了解多少?

大模型也在反向“试探”你的智能

众所周知,图灵测试是检验人工智能模拟人类反应能力的经典方法,而目前有趣的一点是,在实际人与大语言模型交互过程中,大语言模型似乎在进行一种更为微妙的反向图灵测试,通过映射我们的反应来检验对话者的智能水平和提示质量。这具体表现为:

对话者的思维水平越高,提供的提示越有深度,大语言模型就能展现出越高的智能表现。当对话者表达强烈观点时,模型也会相应地展现出更大的互动热情。

这种映射现象可以理解为启动效应与语言能力的协同作用。这一现象并不能说明大语言模型具备与人类相同的智能或意识,但确实展示了它在模仿人类个性特征方面的卓越能力。

大语言模型在映射用户需求和智慧时,可能就像《哈利·波特》中的厄里斯魔镜。这面魔镜“只能映照出观看者内心最深切、最渴望的愿望,仅此而已。然而,它既不能赋予知识,也不能揭示真相。人们可能会在镜前虚度光阴,或是被镜中景象迷惑,甚至因无法分辨这些景象的真实性与可能性而陷入疯狂。”

通用人工智能一直是人工智能领域追求的终极目标。有趣的是,这种通用能力正在大语言模型中逐步显现,但其实现形式与早期人工智能研究者的设想有所不同。大语言模型不仅展现出在各类语言任务中的多面性,还具备编程等跨领域能力。

特别值得注意的是,这些模型表现出了超乎预期的社交智能。镜像假说为我们提供了一个全新的思考角度:通用智能是否首先源于人类的社交互动能力,而语言能力是在进化过程中发展出来的社交强化工具?这促使我们需要重新审视人类“通用智能”的本质和起源。这种观点可能会对我们理解智能的本质带来革命性的改变。

人类“智能”的标准该重写了吗?

2023年12月1日,加州大学圣迭戈分校认知科学系举办了一场主题为“ChatGPT真的理解语言吗?”的教师辩论会,现场座无虚席。

反方辩手首先提出了“中文屋”的变体:一位哲学家在房间内,有人从门缝递进写有中文的纸条,这位哲学家按照既定算法处理后将回应递回门外。那么,这位哲学家是否真正理解了中文?这个论证引发了诸多质疑。

在辩论中,案例被改编为“匈牙利语屋”,哲学家则被替换为大语言模型,从而推论出大语言模型并不理解匈牙利语。然而,如果我们把“匈牙利语屋”换成“匈牙利大脑”,把哲学家换成物理定律,同样的论证逻辑依然成立。至此,辩论的水平开始走低。

在我看来,这就像一杯水,反方认为它是半空的,正方认为它是半满的,真相应该介于两者之间。在随后的问答环节中,我提出语言学家普遍认为语言的表达能力源于语法,而在语法生成能力方面,大语言模型实际上比多数人更为出色。对此,反方认为语法问题并非核心所在。值得注意的是,随着技术的不断进步,人们对人工智能的评判标准也在不断提高。

关于大语言模型是否具有智能的讨论,最终取决于我们如何定义“智能”。

大语言模型LaMDA通过了阿尔卡斯设计的心智理论测试,而心智理论被认为是自我意识的重要标志之一。不过,也有不少人对此持谨慎怀疑态度。人类往往会低估其他动物的智能,仅仅因为它们无法与我们进行语言交流。这种消极偏见恰好与另一种偏见形成呼应:我们倾向于对能与我们交谈的个体产生积极偏见,即便它们的实际智能水平可能并不高。

这不禁让人思考:我们是否具备足够的智慧来判断智能?大语言模型问世仅有短短数年,现在就推断它们或其后代可能达到怎样的智能水平还为时尚早。就像会说话的狗最令人称奇的是它能说话这一点本身,而非它所说内容的智慧程度或真实性。大语言模型即便在不够准确的情况下也会做出自信满满的回应。如果我们将评判标准从理想化的人类转向普通人,或许能得到更切实的比较结果。

专家们对大语言模型智能的认知分歧,凸显出我们基于自然智能的传统认知框架已难以适应当前形势。大语言模型的出现为我们提供了一个重要契机,促使我们突破固有思维模式,超越19世纪心理学遗留下来的过时概念。我们需要重新审视并深化对“智能”“理解”“伦理”以及“人工”等核心概念的认识。

人类的智能显然不仅限于语言能力;我们可能在某些领域与大语言模型拥有共同的智能特征,但在其他方面则存在本质差异。以创造力为例,它是自然智能的典型特征,而大语言模型也确实展现出了创造性思维的潜质。在实际对话中,如果否认大语言模型具备理解人类意图的能力,那么它生成的许多文本内容就难以得到合理解释。这使我们必须对“意图”这一概念进行更深入的探讨。这一概念源自心智理论,而心智理论本身也值得我们进行更细致的研究和重新思考。

问题的关键在于,对于大脑这样一个复杂系统,存在着无数相互作用的神经元和内部状态,不同的实验探测了不同的大脑区域,实际上每个实验研究的都是不同类型的“注意力”。对于大脑这样的复杂动力系统,很难用“注意力”和“意识”这样的概念来进行准确定义。

语言赋予人类独特能力,但词语本身具有不稳定性,这种不稳定性恰恰是它们力量的源泉。因此,我们需要更坚实的基础来构建新的概念框架。

我们正处在一个前所未有的历史机遇期,这与17世纪物理学变革时期极为相似。当时,“力”“质量”和“能量”等概念经过数学形式化处理,从模糊的术语转变为精确的可测量指标,由此奠定了现代物理学的基础。在研究大语言模型的过程中,我们很可能会发现关于智能本质的新原理,就像20世纪物理学家揭示物理世界的基本原理一样。正如量子力学在首次提出时违背人们的直觉认知一样,当智能的基本原理被揭示时,可能也会呈现出违反常理的特性。

自然是否在高度进化的灵长类大脑中实现了一个类似于大语言模型的系统?通过研究大语言模型展现的语言处理能力,我们可能会发现一些关于语言智能的基本原理,这些原理或许能够推广到社会智能、机械智能等其他智能形式。与生物进化相比,大语言模型的发展速度要快得多。一旦相关技术基础确立,其性能就会在持续改进中不断提升。

这项技术最为突出的特点在于:在探索其发展的过程中,我们可能会深入理解人类智能的本质。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
江苏假博士背景曝光,势力大不差钱,产业遍布多省,难怪能骗众人

江苏假博士背景曝光,势力大不差钱,产业遍布多省,难怪能骗众人

削桐作琴
2025-11-19 22:29:13
陈梦回应女团夺冠

陈梦回应女团夺冠

大象新闻
2025-11-20 07:42:04
解放军报警告日本,日本一旦介入台海,日本全国都会成为战场

解放军报警告日本,日本一旦介入台海,日本全国都会成为战场

合赞历史
2025-11-20 15:42:44
美媒也看不懂:现在连特朗普都不敢惹中国,高市到底哪来的勇气?

美媒也看不懂:现在连特朗普都不敢惹中国,高市到底哪来的勇气?

现代小青青慕慕
2025-11-20 08:39:42
杨瀚森NBA生涯达到20分:4中1仅2+2+1末节被弃用 距周琦仅差4分

杨瀚森NBA生涯达到20分:4中1仅2+2+1末节被弃用 距周琦仅差4分

醉卧浮生
2025-11-20 13:36:11
从11月份开始,国内或将迎来4大降价潮,建议大家提前做好准备!

从11月份开始,国内或将迎来4大降价潮,建议大家提前做好准备!

猫叔东山再起
2025-11-19 13:00:03
如果中国与欧美全面脱钩会怎样?基于数据的深度分析,结果让人触目惊心!

如果中国与欧美全面脱钩会怎样?基于数据的深度分析,结果让人触目惊心!

V记录号
2025-11-19 09:07:34
辣眼睛!又是出轨,响水47秒成关键词,某金店女店长登上热搜…

辣眼睛!又是出轨,响水47秒成关键词,某金店女店长登上热搜…

火山诗话
2025-11-19 20:30:15
发布涉金龙鱼不实言论,湖北前首富、企业家兰世立被判公开道歉,本人回应

发布涉金龙鱼不实言论,湖北前首富、企业家兰世立被判公开道歉,本人回应

鲁中晨报
2025-11-20 14:33:15
热搜爆了!胡彦斌易梦玲马尔代夫拥吻 16岁年龄差跨界恋情引热议

热搜爆了!胡彦斌易梦玲马尔代夫拥吻 16岁年龄差跨界恋情引热议

行者聊官
2025-11-20 09:04:39
刚恢复14天,中国通知日本全面禁止,中方埋伏笔,下步反制将出炉

刚恢复14天,中国通知日本全面禁止,中方埋伏笔,下步反制将出炉

影孖看世界
2025-11-19 17:35:26
加入CPTPP:关乎未来的“高难度闯关”搏杀

加入CPTPP:关乎未来的“高难度闯关”搏杀

墨心人
2025-11-19 19:42:48
武统台湾的难度和代价有多大?远超多数人的想象!

武统台湾的难度和代价有多大?远超多数人的想象!

山间听雨
2025-11-19 12:25:23
霸王茶姬创始人张俊杰将与天合光能“光伏女神”高海纯结婚

霸王茶姬创始人张俊杰将与天合光能“光伏女神”高海纯结婚

红星新闻
2025-11-20 13:10:07
Gemini 3 强得有点不太像阳间的东西。

Gemini 3 强得有点不太像阳间的东西。

差评XPIN
2025-11-20 00:09:23
为什么我们无法忘却胡耀邦?从他的历史角色、精神遗产说起

为什么我们无法忘却胡耀邦?从他的历史角色、精神遗产说起

阜成门六号院
2025-11-20 14:10:12
喜提8天小米YU7车主截肢后续:当事人已出院,再次发声,心态乐观

喜提8天小米YU7车主截肢后续:当事人已出院,再次发声,心态乐观

娜乌和西卡
2025-11-20 11:27:35
广州长隆马戏团笼中表演突发意外,演员坠落砸向另一位表演者

广州长隆马戏团笼中表演突发意外,演员坠落砸向另一位表演者

黄河新闻网吕梁频道
2025-11-20 08:41:17
刘景扬母亲透露:她没有教练没人看好她 她这一冠是广东计划外金牌

刘景扬母亲透露:她没有教练没人看好她 她这一冠是广东计划外金牌

劲爆体坛
2025-11-19 23:18:42
“顺其自然”再捐110万元 27年累计捐款1796万

“顺其自然”再捐110万元 27年累计捐款1796万

环球网资讯
2025-11-20 10:44:28
2025-11-20 16:31:00
文汇报 incentive-icons
文汇报
华语世界高品质人文阅读平台
263990文章数 309787关注度
往期回顾 全部

科技要闻

英伟达单季狂揽570亿美元,手握5000亿订单

头条要闻

数名蔚来车主被销售诈骗160万 称对品牌表态特别寒心

头条要闻

数名蔚来车主被销售诈骗160万 称对品牌表态特别寒心

体育要闻

Faker,何以成为Faker

娱乐要闻

胡彦斌易梦玲恋情曝光,相差16岁

财经要闻

霸王茶姬创始人将与“光伏女神”结婚

汽车要闻

一汽丰田发布IT'S TiME 3.0 三款焕新产品同步亮相

态度原创

家居
健康
艺术
游戏
军事航空

家居要闻

黑白极简 慵懒通透空间

警惕超声报告这六大"坑"

艺术要闻

陈洪绶:花鸟册二十开

大腿音游《萌萌夹击》更新限时免费“裤袜”DLC

军事要闻

日本称已向美国出口爱国者导弹

无障碍浏览 进入关怀版