网易首页 > 网易号 > 正文 申请入驻

数学论证GPT-4不是随机鹦鹉:真如此的话整个宇宙都会坍缩

0
分享至

克雷西 发自 凹非寺
量子位 | 公众号 QbitAI

对于ChatGPT的工作原理,一个常见的解释是根据统计学规律预测下一个词。

但最近一位叫Jacob Bayless的工程师用数学方法得出惊人结论:

若是如此,所需的信息量足以让整个宇宙都坍塌成黑洞

这一数据量是50000^8000,根据贝肯斯坦上限(Bekenstein bound)原理,如果把这些信息分配到空间当中,所需要的信息密度已经远超宇宙能承受的最大值。

而这仅仅是把数据存储起来的消耗,更不必说还要进行运算了。

而ChatGPT与单纯统计预测的区别,可以做这样的类比:

如果天文学家通过历史观测记录推算出月食的周期,这可以算是统计学。

但当他们总结出牛顿万有引力定律的时候,就已经超越了统计学。

什么是“随机鹦鹉”

一个流传很广的说法,所谓大语言模型实际上相当于一个“随机鹦鹉”——

  • 与我们观察其输出时的情况相反,语言模型只是将其在庞大的训练数据中观察到的语素胡乱拼接在一起,根据概率生成文本,但不清楚文字背后的任何含义,就像一个随机的鹦鹉。
    出自论文On The Dangers of Stochastic Parrots: Can Language Models Be Too Big

这对过去的语言模型,或许确实成立。

比如曾经流行的n-gram算法。

比如当我们在搜索引擎中进行搜索时,出现的联想词就能用此方法实现。

具体来说,下面的三行文本中,第一行纯粹是随机生成,第二行考虑了单词在英语中整体的出现概率,第三行则考虑了单词在前一个词后面出现的概率。

  • n = 0: RECEIVE FALL SURPRISED FRIDAY INGREDIENT…
    n = 1: REPRESENTING AND SPEEDILY IS AN GOOD…
    n = 2: THE CHARACTER OF THIS POINT IS THEREFORE…

不难看出,随着n值的升高,文本越来越接近人类语言。

而n-gram模型根本不需要掌握其中的语义或理解其中的抽象概念,就能生成像模像样的句子。

据此有人猜想,GPT-4会不会也只是一种高级的n-gram呢?

Bayless提出,GPT必须学会抽象才能有如今的效果,至少GPT-4肯定如此。

GPT-4不只是“随机鹦鹉”

要证明这一点,可以先看下棋机器人的例子。

如果有一种下棋机器人,存储了巨量棋谱数据,对于每个棋局都能推荐下一步。

那它就能通过“背谱法”模仿其他任何棋手或程序的下法

比如Stockfish是最先进的国际象棋程序,如果仅通过对战而不看源码,是无法确定Stockfish是否在背谱。

但实际上,包含所有情形和步骤的棋谱数据量可能超过2^154。

而Stockfish的程序只占用了不到50MB的空间,根本不可能存下需要的所有棋谱。

所以Stockfish肯定是通过更高级的方法来实现下棋的。

人类语言的复杂度远超过棋类游戏,因此GPT的数据量更是同理。

仅在上一代的GPT-3的token字典中就有超过5万token。

如果对每个词都逐一建立统计信息,n-gram模型中n值将高达8000。

届时,需要存储的情景数量将达到50000^8000。

正如文章开头所提到,这简直是天文数字,足以让整个宇宙坍缩。

因此,GPT是“随机鹦鹉”的猜测在理论上得到了一定程度的批驳。

“随机鹦鹉”达不到的高度

仅在理论上进行说明是不充分的,因此研究人员还进行了两个实验,意图证明大模型在学习过程中已经抽象出了算法。

第一个实验关于一个经典的农夫过河问题。

  • 一个农夫有一条船,和狼、羊、菜,农夫要把这3样东西运到河道另一边,农夫每次最多只能通过这个船运一样东西,要防止狼吃羊、羊吃白菜(即不能在没有农夫在的情况下同时在同一岸边),该怎么过?

研究人员将这个问题中的农夫、船、河分别替换成地球人、虫洞和银河系。

狼、羊和菜则分别换成火星人、金星人和月球人。

替换的目的是因为互联网上不太可能出现类似语料,可以判断大语言模型是不是真的掌握了通用方法。

如果GPT不是“随机鹦鹉”,那么它至少不会犯下只有“随机鹦鹉”才会犯的错误。

GPT-4针对替换后的问题给出了正确的回答,GPT-3.5则没有。

但它们并没有犯研究人员预想的“鹦鹉”错误——即在回答中出现狼、船、河等已被替换掉的词语。

回答中使用的句子,也无法在互联网中被检索到。

这些现象都证明了现在的大语言模型的生成方式已经超越了“概率预测”。

第二个实验则是数字排序。

如果让GPT学习数字排序,它们究竟是只会记住给出过的数字顺序,还是真的研究出排序算法呢?

其实只要从GPT的输出当中就可以看出来了。

假如从1-100中随机选择10个数字,并将其顺序打乱,将一共有这么多种情形:

如果再考虑数字的重复出现,又或者数字的数量发生变化,根本不可能存储如此之多的情形。

因此,只要GPT能够针对未知的排序问题给出正确的回答,便可以说明它们是真的研究出了排序算法。

研究人员训练了一款特斯拉前AI总监Andrej Kaparthy发明的语言模型nanoGPT,专门让它做数字排序。

结果显示,随着训练步数的增加,模型给出的数字顺序越来越完美。

虽然在训练步数达到16万左右时突然出现了大量错误,但也很快得到了纠正。

这说明这款模型并不是仅仅根据学习的素材对未知的数字进行排序,而是已经掌握了背后的方法。

这个测试只是在一台笔记本电脑、算力非常有限的GPU上进行的。

更不必说GPT-4了。

参考链接:
https://jbconsulting.substack.com/p/its-not-just-statistics-gpt-4-does

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
1931年特科科长奉命杀顾顺章全家后,要求归队,周恩来说不动如山

1931年特科科长奉命杀顾顺章全家后,要求归队,周恩来说不动如山

干史人
2024-04-28 08:00:10
今起四天广东大部降雨频繁局地有暴雨或大暴雨 需警惕强降雨致灾

今起四天广东大部降雨频繁局地有暴雨或大暴雨 需警惕强降雨致灾

北青网-北京青年报
2024-04-28 08:57:02
“新冠疫苗之父”杨晓明被抓!个人履历曝光,评论区彻底失控!

“新冠疫苗之父”杨晓明被抓!个人履历曝光,评论区彻底失控!

古希腊掌管松饼的神
2024-04-28 09:10:08
丈夫、弟弟、儿子均遇难!家属质疑“华为问界M7刚买仨月事故后起火”,回应→

丈夫、弟弟、儿子均遇难!家属质疑“华为问界M7刚买仨月事故后起火”,回应→

鲁中晨报
2024-04-28 15:49:03
多位网友反映连接高铁WiFi时弹出“X你妈”,12306:确系官方授权APP

多位网友反映连接高铁WiFi时弹出“X你妈”,12306:确系官方授权APP

极目新闻
2024-04-28 17:34:27
常住人口再创新历史新高 解读深圳人口增长的背后……

常住人口再创新历史新高 解读深圳人口增长的背后……

南方都市报
2024-04-28 16:36:19
贾跃亭称已还清100亿美元债务,却被大V光速打脸:还了跟没还一样

贾跃亭称已还清100亿美元债务,却被大V光速打脸:还了跟没还一样

可达鸭面面观
2024-04-28 15:28:34
曝上海市公共卫生临床中心主任范小红遭控诉:不作任何协商,迫使科研人员搬离实验室

曝上海市公共卫生临床中心主任范小红遭控诉:不作任何协商,迫使科研人员搬离实验室

互联网大聪明
2024-04-28 13:16:19
34岁鹿晗自曝不吃碳水很多年!脸部肿胀显老,已经配不上关晓彤!

34岁鹿晗自曝不吃碳水很多年!脸部肿胀显老,已经配不上关晓彤!

西瓜爱娱娱
2024-04-28 15:48:06
田馥甄内地复出失败!音乐节宣布取消其演出,本人发声强撑体面

田馥甄内地复出失败!音乐节宣布取消其演出,本人发声强撑体面

萌神木木
2024-04-27 22:17:58
网红东东举办葬礼,母亲在灵堂内崩溃大哭,前妻晒合影曝离婚真相

网红东东举办葬礼,母亲在灵堂内崩溃大哭,前妻晒合影曝离婚真相

180°视角
2024-04-28 10:45:27
博世称问界M7涉事车辆并未搭载博世智驾系统

博世称问界M7涉事车辆并未搭载博世智驾系统

鞭牛士
2024-04-28 17:32:15
布林肯在中国遭BBC女记者连怼:你们要求中国停止出口零部件,自己却向以色列提供武器?

布林肯在中国遭BBC女记者连怼:你们要求中国停止出口零部件,自己却向以色列提供武器?

国际在线
2024-04-28 14:52:26
330天研发疫苗盈利7000亿!杨晓明被查:打3针北京生物者说感恩

330天研发疫苗盈利7000亿!杨晓明被查:打3针北京生物者说感恩

大风文字
2024-04-28 08:15:57
只因得罪这三人,许家印才沦落到如今这般田地!究竟是谁呢?

只因得罪这三人,许家印才沦落到如今这般田地!究竟是谁呢?

娱乐圈见解说
2024-04-28 16:13:21
印尼女网红视频作证:雅万高铁漏水!印尼媒体质疑中国高铁品质?

印尼女网红视频作证:雅万高铁漏水!印尼媒体质疑中国高铁品质?

步论天下事
2024-04-28 10:00:30
最近,一位以色列网民在网上表示惊讶:中国人居然不敬畏以色列人

最近,一位以色列网民在网上表示惊讶:中国人居然不敬畏以色列人

平祥生活日志
2024-04-28 12:43:17
郯城县公安局回应“警车进村喊话村民涉嫌嫖娼”:警方让中间人联系当事人 是因多次传唤不到

郯城县公安局回应“警车进村喊话村民涉嫌嫖娼”:警方让中间人联系当事人 是因多次传唤不到

红星新闻
2024-04-28 15:33:22
11年云南女学生捐骨髓救人,患者康复后却大骂:她就不是个东西!

11年云南女学生捐骨髓救人,患者康复后却大骂:她就不是个东西!

小金鱼的眼泪
2024-04-27 08:56:20
重庆燃气事件调查结果出炉;一季度全国电力燃气等行业利润增长40.0%;网传上海电力正在裁员

重庆燃气事件调查结果出炉;一季度全国电力燃气等行业利润增长40.0%;网传上海电力正在裁员

小萝卜丝
2024-04-28 17:25:22
2024-04-28 18:32:49
量子位
量子位
追踪人工智能动态
9328文章数 175242关注度
往期回顾 全部

科技要闻

马斯克周日突然现身北京,要谈FSD入华?

头条要闻

警方回应"警车进村喊话村民涉嫖娼":多次传唤对方不到

头条要闻

警方回应"警车进村喊话村民涉嫖娼":多次传唤对方不到

体育要闻

赢了!詹皇末节14分制胜咆哮 压力给到KD

娱乐要闻

张杰谢娜发文为何炅庆生,亲如家人!

财经要闻

上财万字报告深度解读Q1经济

汽车要闻

鸿蒙首款行政旗舰轿车 华为享界S9实车亮相车展

态度原创

手机
本地
房产
旅游
艺术

手机要闻

OPPO A60正式发布 搭载骁龙680 起售价约1570元

本地新闻

云游中国|苗族蜡染:九黎城的“潮”文化

房产要闻

海南最新房价出炉,三亚跌价最猛!

旅游要闻

年轻人出游:为了爱好说走就走 好玩不贵很重要

艺术要闻

10年900个项目 | 第九批中国20世纪建筑遗产项目推介名录出炉

无障碍浏览 进入关怀版