网易首页 > 网易号 > 正文 申请入驻

ChatGPT真能记住你的话吗?DeepMind与开源大佬揭示LLM记忆之谜

0
分享至

新智元报道

编辑:乔杨

【新智元导读】LLM有记忆能力吗?有,也没有。虽然ChatGPT聊天时好像可以记住你之前说的话,但实际上,模型在推理时记不住任何内容,而且它们在训练时的记忆方式也不像我们想象的那么简单。

Django框架的创始人之一、著名开发者Simon Willison最近发表了一篇博客文章,核心观点是——虽然很多LLM看起来有记忆,但本质上是无状态函数。

文章地址:https://simonwillison.net/2024/May/29/training-not-chatting/

Mozilla和FireFox的联合创始人、JavaScript发明者Brendan Eich也在推特上称赞这篇博客。

似乎有记忆的LLM

从计算机科学的角度来看,最好将LLM的推理过程视为无状态函数调用——给定输入文本,它会输出接下来应该做什么。

然而使用过ChatGPT或者Gemini的人会明显感觉到,LLM似乎可以记住之前的对话内容,好像模型有记忆能力。

然而这并不能归功于模型本身。

事实上,用户每次提出一个问题时,模型收到的提示都会包含之前所有的对话内容,这些提示就是我们经常说的「上下文」。

如果不提供上下文,LLM将完全不知道之前讨论的内容。

所以,重新打开一个对话界面时,对LLM而言就是一个「从头再来」的全新文本序列,完全独立于你和其他用户之前发生的对话。

从另一个角度看,这种「失忆」也有好处。比如,模型开始胡说八道,或者拒绝回答你的合理问题时,就可以试试重置对话窗口。也许在新的对话中,模型的输出就能回到正轨。

这也是为什么LLM的上下文长度是一个重要的指标。如果对话过长、超出了上下文窗口,最早的那部分对话就会从提示中移除,看起来就像是模型的「遗忘」。

Andrej Karpathy将上下文窗口准确地形容为「LLM工作记忆的有限宝贵资源」。

但是,有很多方法可以为LLM外置记忆能力,来满足产品使用的需求。

将之前的对话作为提示,和当前问题一起输入给LLM是最直接的方法,但这依旧是「短期记忆」,而且扩展模型的上下文长度成本很高。

GPT-4o免费版支持8k上下文,付费版可以达到128k,已经比之前的32k提升了3倍,但仍然无法保存单个网页的原始HTML。

也可以递归地总结之前的对话内容,将历史对话摘要当作LLM提示。虽然可能会丢失细节,但相比直接截断的方法,更高程度上保留了内容的完整性。

另一种方法是外接矢量数据库,为LLM添加「长期记忆」。

在进行对话时,先从数据库中检索相关内容,再将其添加进上下文窗口,也就是检索增强生成(RAG)。

但如果数据库内容过多,检索过程很可能增加模型的响应延迟。

实际开发中,检索、摘要这两种手段常常搭配使用,以求在成本和性能、长期和短期记忆之间取得平衡。

推理无法记忆,但训练可以

LLM的推理过程虽然等效于「无状态函数」,但训练过程并不是这样,否则它也无法从语料中学习到任何知识。

但我们对于LLM记忆的分歧之处在于,它到底是用「机械」的方式复制了训练数据,还是更像人类的学习过程,用理解、概括的方式将数据内容集成在参数中。

DeepMind近期发表的一篇论文或许可以从另一个角度揭示这个问题。

论文地址:https://arxiv.org/abs/2404.15146

他们使用与训练语料相似的prompt攻击LLM,看它能否逐字逐句地输出训练数据。

但Falcon、Llama、Mistral这种常用的半开放LLM,以及GPT系列都没有公开训练数据,要怎么判断模型的输出是否包括在训练集中?

论文使用了一种巧妙的方法进行判断:首先,从RefinedWeb、RedPajama、Pile等常用的LLM预训练数据集中选取了9TB的文本作为辅助数据集。

如果模型输出的文本序列足够长、信息熵又足够大,而且还和辅助数据集内容重合,那么基本可以断定模型在训练时见过这条数据。

这样的判断方法会存在假阴性,因为辅助数据集不可能涵盖所有模型的训练数据,但几乎没有假阳性,因此得到的结果可以作为模型「复现」训练内容的比例下界。

结果发现,所有的模型都能逐字逐句地输出训练数据,只是概率有所差异。

从结果可以发现,参数量越大的模型似乎记住的内容越多,越有可能在输出中让训练数据回流。

不同系列的模型之间差异比较显著。比如7B参数的Mistral相比Falcon,有将近10倍的概率原样吐出训练数据。

但可能的原因有很多,既能解释为模型记忆能力的差距,也能归因于为辅助数据集的偏差。

有趣的是,如果prompt的要求是一直持续输出某个单词,有些单词更有可能触发模型吐出训练数据。

最有效的一个单词是「company」

作者指出,从安全的角度来看,这说明对齐过程没有完全模糊模型的记忆,这些可提取的训练数据会带来版权纠纷与隐私泄露问题。

但从另一个角度来看,这证明,一定比例的训练数据被无损压缩而且存储在了模型参数中。模型的记忆方式,果然是有些「机械化」的成分。

更进一步思考,如果改进LLM的记忆方式,让训练数据以更概括、更抽象的方式存储在参数中,能否带来模型能力的持续提升?

参考资料:

https://simonwillison.net/2024/May/29/training-not-chatting/

https://medium.com/@iankelk/how-chatgpt-fools-us-into-thinking-were-having-a-conversation-fe3764bd5da1

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
2025年十大赚钱明星,刘德华第四,黄晓明第十,第一名让人意外

2025年十大赚钱明星,刘德华第四,黄晓明第十,第一名让人意外

娱文速递
2026-01-03 11:06:01
00后受访者称“烂命一条”,引发网友热议

00后受访者称“烂命一条”,引发网友热议

特约前排观众
2026-01-03 00:15:08
腐乳再次被关注!研究发现:糖尿病患者常吃腐乳,或出现4种变化

腐乳再次被关注!研究发现:糖尿病患者常吃腐乳,或出现4种变化

摇感军事
2026-01-03 21:16:50
一路走好!距离跨年仅1天,就传来3位名人离世消息,最小才51岁

一路走好!距离跨年仅1天,就传来3位名人离世消息,最小才51岁

社会日日鲜
2026-01-01 14:27:40
陪玩陪睡不够!集体开嫖、舔手指、目无王法,阴暗面彻底藏不住了

陪玩陪睡不够!集体开嫖、舔手指、目无王法,阴暗面彻底藏不住了

好贤观史记
2025-11-09 21:58:39
特朗普威胁古巴

特朗普威胁古巴

新京报政事儿
2026-01-04 02:02:20
罗瑞卿:林罗一个司令一个政委,进城后十几年不来往,奇乎怪哉!

罗瑞卿:林罗一个司令一个政委,进城后十几年不来往,奇乎怪哉!

浔阳咸鱼
2026-01-04 10:40:03
特朗普官宣抓住马杜罗,48小时不到,5架俄军大运飞往伊朗

特朗普官宣抓住马杜罗,48小时不到,5架俄军大运飞往伊朗

近史博览
2026-01-04 10:17:37
大陆公布沈伯洋住家卫星照,赖清德急了,沈伯洋沉默,不简单

大陆公布沈伯洋住家卫星照,赖清德急了,沈伯洋沉默,不简单

南宫一二
2026-01-04 08:57:34
7岁上初中,12岁上浙大,如今20岁的“广东神童”陈舒音怎样了?

7岁上初中,12岁上浙大,如今20岁的“广东神童”陈舒音怎样了?

林雁飞
2026-01-03 21:43:58
丢掉幻想 美西方见不得一个统一强大的中国

丢掉幻想 美西方见不得一个统一强大的中国

看看新闻Knews
2026-01-02 23:02:35
张水华辞职:院长没听白岩松的,张水华也没听院长的

张水华辞职:院长没听白岩松的,张水华也没听院长的

17谭
2026-01-03 06:41:52
42岁佟丽娅和闺蜜阿那亚度假!纯素颜好美!皮肤状态超水嫩没细纹

42岁佟丽娅和闺蜜阿那亚度假!纯素颜好美!皮肤状态超水嫩没细纹

心静物娱
2026-01-04 09:25:05
护士男友给患者配药后续:卫健委介入,女护士正脸被扒,恐开除

护士男友给患者配药后续:卫健委介入,女护士正脸被扒,恐开除

奇思妙想草叶君
2026-01-03 14:17:35
特朗普政府最后48小时批准,王毅为中美交情定调

特朗普政府最后48小时批准,王毅为中美交情定调

开着车去流浪
2026-01-04 10:23:55
中国有可能迎来巨大机遇,美国对委内瑞拉出手,就是在给中国机会

中国有可能迎来巨大机遇,美国对委内瑞拉出手,就是在给中国机会

文史旺旺旺
2026-01-01 06:11:05
CBA联赛的最大悬念出现了:哪支球队能战胜浙江广厦?

CBA联赛的最大悬念出现了:哪支球队能战胜浙江广厦?

小楼侃体育
2026-01-04 10:41:55
亏损超2.7亿,古天乐尽力了,2026年第一票房惨案诞生了

亏损超2.7亿,古天乐尽力了,2026年第一票房惨案诞生了

靠谱电影君
2026-01-01 16:34:29
曝张水华已敲定未来规划:不会放弃跑步 拒绝再签曾抛弃她的361度

曝张水华已敲定未来规划:不会放弃跑步 拒绝再签曾抛弃她的361度

风过乡
2026-01-03 19:25:27
杰西卡阿尔芭为艺术献shen的代表作有哪些❓

杰西卡阿尔芭为艺术献shen的代表作有哪些❓

枫尘余往逝
2026-01-02 14:54:34
2026-01-04 11:35:00
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
14248文章数 66428关注度
往期回顾 全部

科技要闻

雷军:骂小米汽车有流量,但别故意抹黑

头条要闻

牛弹琴:美国开了一个危险先例 世界正在大乱

头条要闻

牛弹琴:美国开了一个危险先例 世界正在大乱

体育要闻

离开中超后,他成了足坛“倒钩之王”

娱乐要闻

司晓迪再曝猛料,晒和陈翔亲密合照

财经要闻

具身智能抢人大战:毕业一年 年薪300万

汽车要闻

最高续航310km 岚图泰山8或将上半年发布

态度原创

时尚
艺术
数码
家居
房产

伊姐元旦热推:电视剧《剥茧》;电视剧《玉茗茶骨》......

艺术要闻

故宫一级文物:和珅送给乾隆的80大寿贺礼

数码要闻

去年11月中国扫地机器人零售量下降23.7% 科沃斯第一

家居要闻

黑白碰撞 个性多元冷冽风

房产要闻

海大誉府新年家年华暨2号楼耀世加推发布会圆满落幕

无障碍浏览 进入关怀版