网易首页 > 网易号 > 正文 申请入驻

ChatGPT真能记住你的话吗?DeepMind与开源大佬揭示LLM记忆之谜

0
分享至

新智元报道

编辑:乔杨

【新智元导读】LLM有记忆能力吗?有,也没有。虽然ChatGPT聊天时好像可以记住你之前说的话,但实际上,模型在推理时记不住任何内容,而且它们在训练时的记忆方式也不像我们想象的那么简单。

Django框架的创始人之一、著名开发者Simon Willison最近发表了一篇博客文章,核心观点是——虽然很多LLM看起来有记忆,但本质上是无状态函数。

文章地址:https://simonwillison.net/2024/May/29/training-not-chatting/

Mozilla和FireFox的联合创始人、JavaScript发明者Brendan Eich也在推特上称赞这篇博客。

似乎有记忆的LLM

从计算机科学的角度来看,最好将LLM的推理过程视为无状态函数调用——给定输入文本,它会输出接下来应该做什么。

然而使用过ChatGPT或者Gemini的人会明显感觉到,LLM似乎可以记住之前的对话内容,好像模型有记忆能力。

然而这并不能归功于模型本身。

事实上,用户每次提出一个问题时,模型收到的提示都会包含之前所有的对话内容,这些提示就是我们经常说的「上下文」。

如果不提供上下文,LLM将完全不知道之前讨论的内容。

所以,重新打开一个对话界面时,对LLM而言就是一个「从头再来」的全新文本序列,完全独立于你和其他用户之前发生的对话。

从另一个角度看,这种「失忆」也有好处。比如,模型开始胡说八道,或者拒绝回答你的合理问题时,就可以试试重置对话窗口。也许在新的对话中,模型的输出就能回到正轨。

这也是为什么LLM的上下文长度是一个重要的指标。如果对话过长、超出了上下文窗口,最早的那部分对话就会从提示中移除,看起来就像是模型的「遗忘」。

Andrej Karpathy将上下文窗口准确地形容为「LLM工作记忆的有限宝贵资源」。

但是,有很多方法可以为LLM外置记忆能力,来满足产品使用的需求。

将之前的对话作为提示,和当前问题一起输入给LLM是最直接的方法,但这依旧是「短期记忆」,而且扩展模型的上下文长度成本很高。

GPT-4o免费版支持8k上下文,付费版可以达到128k,已经比之前的32k提升了3倍,但仍然无法保存单个网页的原始HTML。

也可以递归地总结之前的对话内容,将历史对话摘要当作LLM提示。虽然可能会丢失细节,但相比直接截断的方法,更高程度上保留了内容的完整性。

另一种方法是外接矢量数据库,为LLM添加「长期记忆」。

在进行对话时,先从数据库中检索相关内容,再将其添加进上下文窗口,也就是检索增强生成(RAG)。

但如果数据库内容过多,检索过程很可能增加模型的响应延迟。

实际开发中,检索、摘要这两种手段常常搭配使用,以求在成本和性能、长期和短期记忆之间取得平衡。

推理无法记忆,但训练可以

LLM的推理过程虽然等效于「无状态函数」,但训练过程并不是这样,否则它也无法从语料中学习到任何知识。

但我们对于LLM记忆的分歧之处在于,它到底是用「机械」的方式复制了训练数据,还是更像人类的学习过程,用理解、概括的方式将数据内容集成在参数中。

DeepMind近期发表的一篇论文或许可以从另一个角度揭示这个问题。

论文地址:https://arxiv.org/abs/2404.15146

他们使用与训练语料相似的prompt攻击LLM,看它能否逐字逐句地输出训练数据。

但Falcon、Llama、Mistral这种常用的半开放LLM,以及GPT系列都没有公开训练数据,要怎么判断模型的输出是否包括在训练集中?

论文使用了一种巧妙的方法进行判断:首先,从RefinedWeb、RedPajama、Pile等常用的LLM预训练数据集中选取了9TB的文本作为辅助数据集。

如果模型输出的文本序列足够长、信息熵又足够大,而且还和辅助数据集内容重合,那么基本可以断定模型在训练时见过这条数据。

这样的判断方法会存在假阴性,因为辅助数据集不可能涵盖所有模型的训练数据,但几乎没有假阳性,因此得到的结果可以作为模型「复现」训练内容的比例下界。

结果发现,所有的模型都能逐字逐句地输出训练数据,只是概率有所差异。

从结果可以发现,参数量越大的模型似乎记住的内容越多,越有可能在输出中让训练数据回流。

不同系列的模型之间差异比较显著。比如7B参数的Mistral相比Falcon,有将近10倍的概率原样吐出训练数据。

但可能的原因有很多,既能解释为模型记忆能力的差距,也能归因于为辅助数据集的偏差。

有趣的是,如果prompt的要求是一直持续输出某个单词,有些单词更有可能触发模型吐出训练数据。

最有效的一个单词是「company」

作者指出,从安全的角度来看,这说明对齐过程没有完全模糊模型的记忆,这些可提取的训练数据会带来版权纠纷与隐私泄露问题。

但从另一个角度来看,这证明,一定比例的训练数据被无损压缩而且存储在了模型参数中。模型的记忆方式,果然是有些「机械化」的成分。

更进一步思考,如果改进LLM的记忆方式,让训练数据以更概括、更抽象的方式存储在参数中,能否带来模型能力的持续提升?

参考资料:

https://simonwillison.net/2024/May/29/training-not-chatting/

https://medium.com/@iankelk/how-chatgpt-fools-us-into-thinking-were-having-a-conversation-fe3764bd5da1

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
在蒙古住了两个月,才知道,蒙古的艰苦,远远超乎你的想象

在蒙古住了两个月,才知道,蒙古的艰苦,远远超乎你的想象

诗意世界
2025-11-06 11:13:06
63岁吴镇宇刷老年卡坐公交,“打卡后车长就开始不爽,差点赶我下车”“我解释我不是故意的,天生如此”

63岁吴镇宇刷老年卡坐公交,“打卡后车长就开始不爽,差点赶我下车”“我解释我不是故意的,天生如此”

观威海
2025-11-05 10:42:03
退休夫妇从32楼跃下,3年后房被贱卖,买主深夜竟听天花板有脚步声

退休夫妇从32楼跃下,3年后房被贱卖,买主深夜竟听天花板有脚步声

罪案洞察者
2025-09-23 14:37:35
正式退出,王曼昱退赛原因找到,将遭罚款+积分赋0处罚

正式退出,王曼昱退赛原因找到,将遭罚款+积分赋0处罚

懂球社
2025-11-05 15:40:44
172cmD杯女孩,撩走肌肉猛男,网友:没X生活的我哭晕了…

172cmD杯女孩,撩走肌肉猛男,网友:没X生活的我哭晕了…

健身迷
2025-10-16 10:10:40
今晚开战!亚冠二级联赛第4轮:国安再战大埔 想出线必须争胜

今晚开战!亚冠二级联赛第4轮:国安再战大埔 想出线必须争胜

爱奇艺体育
2025-11-06 14:36:09
还没完了!赵鸿刚对手给所有武林大师下战书,中国武协或出面干预

还没完了!赵鸿刚对手给所有武林大师下战书,中国武协或出面干预

杨华评论
2025-11-05 23:59:12
坐3.6亿飞机,戴1000万名表,拿5000万炒股的秦奋究竟什么背景

坐3.6亿飞机,戴1000万名表,拿5000万炒股的秦奋究竟什么背景

青史楼兰
2025-08-25 10:50:56
独领风骚,目前欧冠前8球队英超占4席,其余四大联赛各出1队

独领风骚,目前欧冠前8球队英超占4席,其余四大联赛各出1队

懂球帝
2025-11-06 08:14:10
比缅北更恐怖!曾经的旅游胜地,如今黄赌毒俱全,性交易随处可见

比缅北更恐怖!曾经的旅游胜地,如今黄赌毒俱全,性交易随处可见

来科点谱
2025-10-24 09:25:32
印度开始围猎江浙沪独生女?有机构研究如何0成本拿下她们背后家产

印度开始围猎江浙沪独生女?有机构研究如何0成本拿下她们背后家产

趣笔谈
2025-09-29 16:51:57
中共广东省委党校决策咨询部副主任、教授林先扬:省委“1310”具体部署 承载“走在前列”的使命

中共广东省委党校决策咨询部副主任、教授林先扬:省委“1310”具体部署 承载“走在前列”的使命

新浪财经
2025-11-05 07:52:26
不到5天,被点名的秦雯再迎3大噩耗,袭警只是冰山一角

不到5天,被点名的秦雯再迎3大噩耗,袭警只是冰山一角

娱小北
2025-11-04 18:41:34
国运来了挡不住!30亿吨铁矿重见天日,美媒:中国将改写全球格局

国运来了挡不住!30亿吨铁矿重见天日,美媒:中国将改写全球格局

来科点谱
2025-11-06 13:44:10
面相全变了,分手7年,马思纯欧豪罕见同框,才知两人差距在哪里

面相全变了,分手7年,马思纯欧豪罕见同框,才知两人差距在哪里

银河史记
2025-11-05 21:33:57
超级网红撒盐哥餐饮帝国塌了!门店狂亏540万,员工哭诉:他逼我们做足疗??

超级网红撒盐哥餐饮帝国塌了!门店狂亏540万,员工哭诉:他逼我们做足疗??

英国那些事儿
2025-10-21 23:27:06
贝森特以己度人,若中方在稀土问题上卡脖子,美国随时准备反悔

贝森特以己度人,若中方在稀土问题上卡脖子,美国随时准备反悔

司马平邦
2025-11-06 17:33:17
房贷断供率暴涨130%,失控恐惧下的楼市即将进入的周期终局

房贷断供率暴涨130%,失控恐惧下的楼市即将进入的周期终局

重远投资观
2025-11-05 13:00:18
主动出走,至今下落不明的三位红军高级将领,谁的离开最可惜?

主动出走,至今下落不明的三位红军高级将领,谁的离开最可惜?

明月清风阁
2025-11-06 14:10:03
哪些弦外之音是你多年后才醒悟的?网友:好多都没听出来,没眼力

哪些弦外之音是你多年后才醒悟的?网友:好多都没听出来,没眼力

带你感受人间冷暖
2025-11-05 00:05:16
2025-11-06 18:27:00
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
13801文章数 66238关注度
往期回顾 全部

科技要闻

小鹏机器人里藏真人?何小鹏发一镜到底视频

头条要闻

孙东旭离开东方甄选 曾因与董宇辉"小作文风波"引争议

头条要闻

孙东旭离开东方甄选 曾因与董宇辉"小作文风波"引争议

体育要闻

送走两位全明星,公牛成了东部第一

娱乐要闻

“黑料缠身”的白百何 谁给她的勇气?

财经要闻

南银法巴加速发展背后:资金饥渴症待解

汽车要闻

是我眼花了么?怎么大猩猩都来参加新车发布了?

态度原创

游戏
手机
本地
时尚
公开课

《街头篮球》20年自由不息:你欠青春的那场重逢,该赴约了

手机要闻

2025年第三季度,中国手机在印度遭遇了什么?

本地新闻

这届干饭人,已经把博物馆吃成了食堂

中国色特别策划 | 故宫技艺与古意新生

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版