每次打开ChatGPT新对话,你都在做同一件事:先花十分钟交代背景。这是技术栈,那是上周踩过的坑,还有那个没人写进文档的隐藏限制。模型终于跟上节奏时,你已经为"旧地重游"买了单。
然后你关掉标签页。一切归零。
![]()
这就是"AI工作流"里没人真正解决的环节。上下文窗口变大了,智能体框架变聪明了,MCP协议遍地开花——模型每天早上醒来,依然是失忆状态。
窗口大≠有记忆
人们总把上下文长度当成记忆方案。错了。100万token窗口意味着单次对话能塞更多内容,不代表任何信息能带到下一次。对话结束、压缩机制启动的那一刻,你就回到原点。
标准解法是RAG:把文档倒进向量库,查询时检索片段。比没有强,但模型每次都在重新发现知识,没有任何积累。两周后,你的智能体依然不知道"billing服务"内部其实叫payments-v2——尽管你已经告诉它五次了。
Karpathy的新思路:编译,而非检索
Andrej Karpathy最近发布了一个简短的技术草案,提出另一种模式。核心主张是:与其在查询时从原始文档检索,不如让大语言模型增量式构建并维护一份持久化维基——一套结构化、相互链接的Markdown文件,横亘在你和原始资料之间。
三层架构:
• 原始资料——文章、论文、笔记、转录文本。不可变。模型只读不写。
• 维基层——由模型维护的Markdown文件。实体页、概念页、摘要、索引。这层完全归模型所有。
• 模式文档——单独一份文件(CLAUDE.md、AGENTS.md或智能体读取的任何命名),规定模型摄取、查询、维护维基的约定。
新资料进来时,模型不做简单的分块嵌入。它阅读内容,将相关事实整合进现有页面,标记与已有信息的矛盾,更新交叉引用,追加日志。一份源文件可能一次触及十到十五个维基页面。合成结果已经反映了你读过的所有内容。
这不是检索。是编译。
Karpathy把脉络追溯到1945年Vannevar Bush的Memex构想——一种个人化的联想式知识库,文档之间有精心策划的轨迹。Bush没能解决维护问题。大语言模型可以。
kb-wiki:这个模式的实践版本
我基于这个思路做了kb-wiki——一个本地优先的命令行工具,给你的智能体一个真正能读、能搜、能编辑的维基。
技术栈:
• SQLite存元数据,FTS5做关键词搜索
• sqlite-vec实现向量搜索
• bge-base-en-v1.5本地嵌入模型(约200MB,Apple Silicon原生运行,无需API密钥)
• 混合搜索:BM25加余弦相似度,通过倒数排名融合
• Markdown文件作为事实来源——对Git友好,兼容Obsidian,SQLite只存索引
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.