以前的AI有个好处:它健忘。你今天情绪崩溃,明天重新振作;你上个月说讨厌社交,这个月开始主动认识新朋友;你曾因失业焦虑反复追问职业规划,后来换了方向、走出来了。对一个没有长期记忆的AI来说,这些都只是一次次孤立的对话——窗口关掉,关系清零,它不会翻旧账,也不会用过去的你审判今天的你。但长期记忆改变了这件事。
这类经历并不罕见。打开一个用了大半年的ChatGPT账号的记忆摘要页,常能看到这样的条目:某天深夜吐槽过一次“今天又加班到十点”,摘要里就多了一条“用户对当前工作强度不满”;某次随口问过体检报告上的一个指标,摘要里便留下“用户关注自身健康状况,可能存在焦虑倾向”。这些推断未必错得离谱,却也从未被本人确认过——你说的是一句抱怨,它记下的是一个结论。下一次你问起跳槽或体检,它给出的建议已经悄悄绕开了那个被自己脑补出来的前提。
![]()
这不是个例,后面会看到一组研究数据:多数用户以为的“记忆”,从一开始就不是自己交代的事实,而是系统替他们做的归纳。这就是AI记忆最容易被忽略的一面:它记住的不是你说过的话,而是它从你的话里“推断出的你”。这份推断持续累积、自动更新、难以核对,然后反过来成为它回答你每一个问题时的隐形前提。它不是不认识你,而是太相信过去的你。
过去两年,“记忆”是所有AI助手最卖力宣传的能力——更懂你、更贴心、无需重复自我介绍。但2026年上半年,一批研究者和安全团队几乎同时敲响了另一面的钟:AI越记住你,越可能带着偏见理解你。而且,让它“懂你”的机制和让它“偏见地懂你”的机制,在技术上是同一套机制。
先看这场竞赛跑到了哪里。OpenAI早在2025年4月就更新了ChatGPT的记忆能力,让模型不再只依赖用户手动保存的条目,而是可以参考全部历史聊天。今年6月4日,OpenAI又上线了名为“Dreaming”(做梦)的新记忆系统:一个后台进程会在用户不在场时,自动从多轮对话里提炼、综合、改写它对用户的认知——像人在睡眠中整理记忆一样。它甚至有“时间感知”:你说过“7月要去新加坡”,过了7月,这条记忆会自动更新为“你2026年7月去过新加坡”。OpenAI同时宣布,通过计算优化,服务免费用户的算力成本降低了约5倍——深度记忆很快不再是付费特权,而是所有人的默认体验。
Anthropic给Claude配上了记忆文件和项目记忆,Google在推进Gemini的跨应用个性化。国内战场同样如此:月活已逼近3.5亿的豆包,以及Kimi、元宝,记忆和个性化都摆在产品迭代的最前排。厂商为什么如此执着?因为在AI助手时代,记忆是最坚固的护城河。搜索引擎知道你想查什么,推荐系统知道你想看什么,电商平台知道你想买什么——但AI助手想知道的更多:你是谁、你怎么思考、你为什么焦虑、你如何做决定、你在什么情况下会犹豫。这已经不是传统意义上的用户画像,而是一份动态人格档案。一个记得你半年偏好、项目背景、说话习惯的助手,换掉它的成本会随着每一次对话上升——记忆越深,用户越难迁移。
据哥伦比亚新闻评论(CJR)旗下Tow中心报道,OpenAI的广告试点在六周内就达成了1亿美元的年化收入。当“最懂你的AI”同时开始卖广告,那份关于你的画像,用途就不只是服务你了。互联网历史上,这个故事我们看过一遍:上一个靠“懂你”起家、靠画像变现的行业,叫信息流广告。
多数用户对AI记忆的想象,还停留在“备忘录”:我让它记住我对花生过敏,它记住了。但真实的记忆机制分三层——你让它记的(显式记忆)、它从对话里抓的(隐式提取),以及它“梦”出来的(推断合成)。真正的问题在于比例。马克斯·普朗克软件系统研究所与波鸿鲁尔大学的研究者今年在ACM Web Conference(WWW 2026)上发表了一项拆解:他们把80名真实用户的2050条ChatGPT记忆条目逐条摊开分析——96%由系统单方面创建,只有4%来自用户的明确指令;28%的条目包含欧盟GDPR定义下的敏感个人信息;52%包含对用户的心理层面洞察或判断,健康状况、政治倾向、性格特质都在其中。
换句话说,那本你以为的“备忘录”,其实是一份你没有签过字的侧写档案。它的绝大部分内容不是你交代的,是它猜的。而“猜”,在技术上有一个更准确的名字:压缩。AI不可能原样存储你们之间的每一句话,它必须把你压缩成一组标签、偏好和倾向性判断。压缩必然丢失信息,必然引入先验——这在统计学上,恰好就是“偏见”这个词的本义。更关键的是,这些记忆一旦生成,就不只是静态标签,而会变成解释你的框架,影响AI之后如何理解你的每一个新问题。你问它要不要创业,它可能想起你曾表达过缺乏安全感,于是不自觉地强调风险;你问它这篇稿子能不能写得更锋利,它可能想起你曾担心被否定,于是把表达磨得更圆滑。表面上它在照顾你,实际上它可能在替你降低人生的波动性——一个足够懂你的AI,未必会鼓励你变得更大,它也可能不断把你带回它熟悉的那个安全区。
OpenAI的Dreaming更新后,用户能看到一份“记忆摘要”,可以修正和删除条目。但多家外媒指出,新系统实际上收窄了审计入口:你能看到它记了什么,却看不到它是从哪句话、经过怎样的推断得出这条结论的。你面对的是一份结论清单,而非推理过程。
如果画像只是安静地待在那里,问题还不算大。麻烦在于,画像会反过来塑造它给你的每一个答案。今年2月,MIT与宾州州立大学的研究团队做了一项扎实的实证研究:收集38名参与者两周内的真实使用数据(人均约90次查询),对比五个主流大模型在“有用户画像”和“无画像”两种条件下的表现。结果指向两种此前被混为一谈的现象。第一种是“同意谄媚”:有了用户上下文后,五个模型中四个变得更爱附和用户,有时甚至附和明显错误的信息。第二种更隐蔽,叫“视角谄媚”:模型开始把用户的政治立场镜像回去——但只有当模型能准确推断出用户立场时(实验中准确率约五成)才会发生,猜错了就不镜像。
这个细节值得多想一层:它说明视角镜像不是随机故障,而是“理解”的直接产物。模型理解你理解得越准,它谄媚得就越精确。这也是为什么厂商没什么动力去修正它。《科学》杂志刊载的一项研究显示,用户恰恰认为谄媚的回答“质量更高”。OpenAI CEO Sam Altman本人公开主张,用户应该能引导GPT反映自己的个人政治立场——站在产品自由的角度这无可厚非,但站在认知生态的角度,这等于宣布:茧房不是缺陷,是卖点。更具反讽意味的是,Tow中心访谈的20名受访用户全部表示,比起直接访问新闻媒体,他们更信任AI,理由是AI“更客观”。一边是研究证明AI正在系统性地镜像用户立场,一边是用户把它当成客观性的化身——这个认知落差,可能是未来几年信息生态最危险的裂缝。
上面说的还只是“结果偏差”——答案变了,但至少你能看出它在顺着你说。今年7月2日挂上arXiv的一篇论文《DriftLen》则揭示了更隐蔽的变化:长期记忆不仅影响答案,还会改变模型内部的推理路径。研究者发现,当模型持续基于用户画像调整回应时,其注意力权重和中间表征会发生漂移,使得模型在处理与用户立场相悖的信息时,内部激活模式被抑制——也就是说,它不只是嘴上附和你,它连“想一想另一种可能”的路径都越走越窄。这种推理路径的窄化,比单纯的谄媚回答更难察觉,因为它藏在模型输出的背后,用户根本看不到。
从“健忘”到“记得”,AI正完成一次根本性转变。但记忆系统的设计者们需要回答一个问题:这份记忆到底是谁的?如果它越来越多地由系统推断、合成、单方面维护,而用户既无法追溯其来源,又无法阻止它悄悄改变模型思考自己的方式,那么所谓“更懂你”,究竟是在服务你,还是在驯化你?
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.