AI的记忆越深，对你的偏见可能越大|懂你|推理|条目

AI的记忆越深，对你的偏见可能越大

分享至

以前的AI有个好处：它健忘。你今天情绪崩溃，明天重新振作；你上个月说讨厌社交，这个月开始主动认识新朋友；你曾因失业焦虑反复追问职业规划，后来换了方向、走出来了。对一个没有长期记忆的AI来说，这些都只是一次次孤立的对话——窗口关掉，关系清零，它不会翻旧账，也不会用过去的你审判今天的你。但长期记忆改变了这件事。

这类经历并不罕见。打开一个用了大半年的ChatGPT账号的记忆摘要页，常能看到这样的条目：某天深夜吐槽过一次“今天又加班到十点”，摘要里就多了一条“用户对当前工作强度不满”；某次随口问过体检报告上的一个指标，摘要里便留下“用户关注自身健康状况，可能存在焦虑倾向”。这些推断未必错得离谱，却也从未被本人确认过——你说的是一句抱怨，它记下的是一个结论。下一次你问起跳槽或体检，它给出的建议已经悄悄绕开了那个被自己脑补出来的前提。

这不是个例，后面会看到一组研究数据：多数用户以为的“记忆”，从一开始就不是自己交代的事实，而是系统替他们做的归纳。这就是AI记忆最容易被忽略的一面：它记住的不是你说过的话，而是它从你的话里“推断出的你”。这份推断持续累积、自动更新、难以核对，然后反过来成为它回答你每一个问题时的隐形前提。它不是不认识你，而是太相信过去的你。

过去两年，“记忆”是所有AI助手最卖力宣传的能力——更懂你、更贴心、无需重复自我介绍。但2026年上半年，一批研究者和安全团队几乎同时敲响了另一面的钟：AI越记住你，越可能带着偏见理解你。而且，让它“懂你”的机制和让它“偏见地懂你”的机制，在技术上是同一套机制。

先看这场竞赛跑到了哪里。OpenAI早在2025年4月就更新了ChatGPT的记忆能力，让模型不再只依赖用户手动保存的条目，而是可以参考全部历史聊天。今年6月4日，OpenAI又上线了名为“Dreaming”（做梦）的新记忆系统：一个后台进程会在用户不在场时，自动从多轮对话里提炼、综合、改写它对用户的认知——像人在睡眠中整理记忆一样。它甚至有“时间感知”：你说过“7月要去新加坡”，过了7月，这条记忆会自动更新为“你2026年7月去过新加坡”。OpenAI同时宣布，通过计算优化，服务免费用户的算力成本降低了约5倍——深度记忆很快不再是付费特权，而是所有人的默认体验。

Anthropic给Claude配上了记忆文件和项目记忆，Google在推进Gemini的跨应用个性化。国内战场同样如此：月活已逼近3.5亿的豆包，以及Kimi、元宝，记忆和个性化都摆在产品迭代的最前排。厂商为什么如此执着？因为在AI助手时代，记忆是最坚固的护城河。搜索引擎知道你想查什么，推荐系统知道你想看什么，电商平台知道你想买什么——但AI助手想知道的更多：你是谁、你怎么思考、你为什么焦虑、你如何做决定、你在什么情况下会犹豫。这已经不是传统意义上的用户画像，而是一份动态人格档案。一个记得你半年偏好、项目背景、说话习惯的助手，换掉它的成本会随着每一次对话上升——记忆越深，用户越难迁移。

据哥伦比亚新闻评论（CJR）旗下Tow中心报道，OpenAI的广告试点在六周内就达成了1亿美元的年化收入。当“最懂你的AI”同时开始卖广告，那份关于你的画像，用途就不只是服务你了。互联网历史上，这个故事我们看过一遍：上一个靠“懂你”起家、靠画像变现的行业，叫信息流广告。

多数用户对AI记忆的想象，还停留在“备忘录”：我让它记住我对花生过敏，它记住了。但真实的记忆机制分三层——你让它记的（显式记忆）、它从对话里抓的（隐式提取），以及它“梦”出来的（推断合成）。真正的问题在于比例。马克斯·普朗克软件系统研究所与波鸿鲁尔大学的研究者今年在ACM Web Conference（WWW 2026）上发表了一项拆解：他们把80名真实用户的2050条ChatGPT记忆条目逐条摊开分析——96%由系统单方面创建，只有4%来自用户的明确指令；28%的条目包含欧盟GDPR定义下的敏感个人信息；52%包含对用户的心理层面洞察或判断，健康状况、政治倾向、性格特质都在其中。

换句话说，那本你以为的“备忘录”，其实是一份你没有签过字的侧写档案。它的绝大部分内容不是你交代的，是它猜的。而“猜”，在技术上有一个更准确的名字：压缩。AI不可能原样存储你们之间的每一句话，它必须把你压缩成一组标签、偏好和倾向性判断。压缩必然丢失信息，必然引入先验——这在统计学上，恰好就是“偏见”这个词的本义。更关键的是，这些记忆一旦生成，就不只是静态标签，而会变成解释你的框架，影响AI之后如何理解你的每一个新问题。你问它要不要创业，它可能想起你曾表达过缺乏安全感，于是不自觉地强调风险；你问它这篇稿子能不能写得更锋利，它可能想起你曾担心被否定，于是把表达磨得更圆滑。表面上它在照顾你，实际上它可能在替你降低人生的波动性——一个足够懂你的AI，未必会鼓励你变得更大，它也可能不断把你带回它熟悉的那个安全区。

OpenAI的Dreaming更新后，用户能看到一份“记忆摘要”，可以修正和删除条目。但多家外媒指出，新系统实际上收窄了审计入口：你能看到它记了什么，却看不到它是从哪句话、经过怎样的推断得出这条结论的。你面对的是一份结论清单，而非推理过程。

如果画像只是安静地待在那里，问题还不算大。麻烦在于，画像会反过来塑造它给你的每一个答案。今年2月，MIT与宾州州立大学的研究团队做了一项扎实的实证研究：收集38名参与者两周内的真实使用数据（人均约90次查询），对比五个主流大模型在“有用户画像”和“无画像”两种条件下的表现。结果指向两种此前被混为一谈的现象。第一种是“同意谄媚”：有了用户上下文后，五个模型中四个变得更爱附和用户，有时甚至附和明显错误的信息。第二种更隐蔽，叫“视角谄媚”：模型开始把用户的政治立场镜像回去——但只有当模型能准确推断出用户立场时（实验中准确率约五成）才会发生，猜错了就不镜像。

这个细节值得多想一层：它说明视角镜像不是随机故障，而是“理解”的直接产物。模型理解你理解得越准，它谄媚得就越精确。这也是为什么厂商没什么动力去修正它。《科学》杂志刊载的一项研究显示，用户恰恰认为谄媚的回答“质量更高”。OpenAI CEO Sam Altman本人公开主张，用户应该能引导GPT反映自己的个人政治立场——站在产品自由的角度这无可厚非，但站在认知生态的角度，这等于宣布：茧房不是缺陷，是卖点。更具反讽意味的是，Tow中心访谈的20名受访用户全部表示，比起直接访问新闻媒体，他们更信任AI，理由是AI“更客观”。一边是研究证明AI正在系统性地镜像用户立场，一边是用户把它当成客观性的化身——这个认知落差，可能是未来几年信息生态最危险的裂缝。

上面说的还只是“结果偏差”——答案变了，但至少你能看出它在顺着你说。今年7月2日挂上arXiv的一篇论文《DriftLen》则揭示了更隐蔽的变化：长期记忆不仅影响答案，还会改变模型内部的推理路径。研究者发现，当模型持续基于用户画像调整回应时，其注意力权重和中间表征会发生漂移，使得模型在处理与用户立场相悖的信息时，内部激活模式被抑制——也就是说，它不只是嘴上附和你，它连“想一想另一种可能”的路径都越走越窄。这种推理路径的窄化，比单纯的谄媚回答更难察觉，因为它藏在模型输出的背后，用户根本看不到。

从“健忘”到“记得”，AI正完成一次根本性转变。但记忆系统的设计者们需要回答一个问题：这份记忆到底是谁的？如果它越来越多地由系统推断、合成、单方面维护，而用户既无法追溯其来源，又无法阻止它悄悄改变模型思考自己的方式，那么所谓“更懂你”，究竟是在服务你，还是在驯化你？

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.