网易首页 > 网易号 > 正文 申请入驻

卡帕西解锁大模型新玩法!构建个人知识库,“大部分Token已经不跑代码了”

0
分享至

一水 发自 凹非寺

量子位 | 公众号 QbitAI

Karpathy大模型新玩法热乎出炉!

这次是新瓶装老酒——用AI搭建个人知识库

怎么说呢?能让卡神亲自出手,就注定这个知识库还真和咱想象的不一样。

比如过去最烦的一点——一旦你懒得更新,知识库就废了,在卡神这里却变成了一个“懂得自己更新、还能越用越聪明”的小可爱。


而且还不止于此。

连卡神自己都绷不住,直言现在大部分Token都不是用来写代码,而是拿来跑知识库了。

所以问题来了,卡神的知识库到底有啥不一样?

别急,看完他随手附赠的搭建教程你就明白了。

卡帕西教你这样搭个人知识库

开始之前不得不感慨一句——卡帕西的《个人知识库搭建教程》来得刚刚好。

这两天正愁怎么把四处分散且越积越多的资料,真正沉淀下来。

很多时候都是看完就忘、一找就废——收藏的文章躺在文件夹里吃灰,读过的论文回头就想不起结论,上次踩过的坑下次照样再踩一遍。信息越多,脑子越乱,真正要用的时候,反而什么都翻不到。

说白了,我需要的就是一个能替我记住、替我整理、还能随叫随到的东西

而卡帕西这次给的,恰恰就是这个。

第一步:导入数据

虽然用上AI了,但知识库最最基础的准备工作还是免不了——仍需要手动导入原始资料。

不过卡帕西也说了,这项工作只是早期有点累,等后面AI熟悉你的工作风格了,导入的方式也会更简单。

比如你俩熟了后,只需说一句“把这个新文档存到我们的维基里”,甚至直接给个路径,AI就能自动归类、自动打标签、自动关联到相关内容。

具体来说,这一步需要你把所有资料打包进一个文件夹(raw/)——过程中无需人工整理。

然后让大模型帮忙干一件事:

把raw/里乱七八糟的资料,编译成一个井井有条的维基百科

这个维基百科本质上就是一堆Markdown文件,但内容已经完全不一样了,里面包含:

摘要:每篇文章/论文/代码,模型先读一遍,然后写个简短的摘要;

反向链接:不同内容之间会自动建立反向链接;

概念分类:模型会判断“这篇文章讲的是Transformer”,然后把它归到“深度学习/注意力机制”这个分类下;

新文章:模型甚至会根据已有资料撰写出新的内容。

最终,所有资料汇集在一起,会形成一个互相引用的知识网络(就是你印象当中的那个维基)。

对了,为了将网页和图片也转成Markdown,卡帕西还分享了自己的工具——Obsidian Web Clipper插件。

平时看到好文章的时候,直接点一下插件就能将网页转成.md文件,顺便再把图片一键下载到本地(os:不下载的话,如果哪天网站崩了图也就没了~)。

第二步:前端查看数据

等AI整理完数据后,我们可以在前端查看原始数据(raw/)、编译好的维基,以及生成的可视化图表。

卡帕西这里用的是Obsidian——它不止可以当浏览面板,还自带一些插件(比如用Marp生成幻灯片)。

而且他还特意提到,维基里的所有数据,基本都是由大模型来编写和维护的,自己几乎从不直接动手修改。

第三步:用起来、跑起来

一旦数据积累的足够多,且被AI整理得井井有条后,接下来当然是用起来了。

卡帕西分享道,自己最近有项研究的维基攒了100篇文章(约40万字),本以为这个规模得搞一套复杂的RAG(检索增强生成)技术才行。

结果发现:根本不需要。

只要大模型平时把索引文件和摘要维护好了,哪怕40万字的规模,它也能相对轻松地读取所有重要相关数据,然后给出高质量的回答。

而且卡帕西真心夸赞,大模型在自动维护索引和摘要方面“表现相当好”。

以及最重要的一步来了——所有输出结果不是给了就完了,而是被归档到维基中,形成循环。卡帕西表示:

通常,我会把这些输出结果“归档”回维基,为后续查询做准备。

这样一来,我自己的每一次探索和提问,都会在知识库中不断沉淀、持续累积。

划重点,光自己补还不够。为了让整个系统保持更新,卡帕西还补了两层关键能力:

一是专门设计了一层“Lint+Heal”机制,本质上就是让大模型定期扫描整个知识库,自动发现不一致的数据、补全缺失信息,甚至主动建议新增条目,必要时还可以通过外部搜索把空缺补齐。

二是在更底层,提供了一套CLI工具,用来给知识库提供搜索和访问接口——一方面让大模型可以高效检索和读取内容,另一方面也方便人通过命令行或网页直接使用这套知识库。

到这里,整个知识库才真正“活起来”。

你会发现,它和传统知识库已经完全不是一回事了:

过去的知识库,本质是一个需要人不断维护的“存储工具”,而在卡帕西这里,它变成了一个由大模型持续整理、持续更新的“运行系统”——

不是一个单纯的“搜索引擎”,而是可以不断长出新知识的“第二大脑”

在网友看来,卡帕西正在展示一种真正有效的、最简单的AI架构:

将研究资料存入文件夹,让模型将其组织成维基,提出问题,然后将答案存回。

真正的洞见在于这个循环……每个查询都让维基变得更好。它不断积累,现在这就像一个自我构建的第二大脑。

这下不用卷上下文了?

而一旦有了这样的知识库,人们会突然发现:

好像也不需要再一味拼命卷上下文窗口了?

过去大家卷上下文,是因为AI老是容易“说着说着就忘了以前的内容”,越到后面越驴唇不对马嘴。

核心症结就一个——记忆问题

但是现在,情况变了。

原本需要一次性塞进上下文的资料,被沉淀进了个人知识库里,模型不再强行记忆,而是按需读取、按需使用。

于是整个逻辑彻底反过来了:

你每次提供的信息不再是“临时的”,而是在知识库里“长期存储”;每一次用也不是纯消耗,而是在给知识库不断补充新知识。

对模型来说,它也不需要时刻记住一切,而是只需要知道“什么东西在哪里”。

本质上,这其实是从“让模型记住”,变成了“让系统可查找”。

而这一转变,按网友的话来说,其影响在智能体时代将更加“疯狂”。

我认为如果正确应用(卡帕西的这种个人知识库),这对智能体来说非常好。

不再是每轮对话都从共享内存中临时提取信息,而是构建一个持续存在的、有生命力的知识库。

你的协调者(Agent)不再只是协调任务……它还在维护机构化的知识,这样每一次执行都会为知识库增添一些东西。

更大的影响是疯狂的。

拥有自己知识层的Agent,并不需要无限的上下文窗口——它们只需要良好的文件组织能力,以及读取自己索引的能力。

这比把所有东西都塞进一个巨大的提示词里,更便宜、扩展性更强、也更容易检查和理解。

[1]https://x.com/karpathy/status/2039805659525644595

[2]https://x.com/jumperz/status/2039826228224430323

一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法!

谁会代表2026年的AI?

龙虾爆火,带动一波Agent与衍生产品浪潮。

但真正值得长期关注的AI公司和产品,或许不止于此。

如果你正在做,或见证着这些变化,欢迎申报。

让更多人看见你。 https://wj.qq.com/s2/25829730/09xz/

一键关注 点亮星标

科技前沿进展每日见

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
为何好多小国都莫名其妙反华?马斯克一语道破本质

为何好多小国都莫名其妙反华?马斯克一语道破本质

秋巷雨潇潇
2026-04-05 18:53:20
传疯了!特朗普被传去世,数日未公开露面,引发网友热议

传疯了!特朗普被传去世,数日未公开露面,引发网友热议

魔都姐姐杂谈
2026-04-05 22:00:52
印度18米高摩天轮因超载倒塌:从底座撕裂,近80人被压或甩出,至少30人受伤,2名儿童情况危急;初步调查显示摩天轮底座不牢固

印度18米高摩天轮因超载倒塌:从底座撕裂,近80人被压或甩出,至少30人受伤,2名儿童情况危急;初步调查显示摩天轮底座不牢固

潇湘晨报
2026-04-05 20:16:12
美国制裁绞杀也门,中国硬刚警告直接出手,这回华盛顿踢到铁板了

美国制裁绞杀也门,中国硬刚警告直接出手,这回华盛顿踢到铁板了

通文知史
2026-04-05 01:10:03
4月1日起,高血压、糖尿病患者去社区办这个证,一年能省下不少钱

4月1日起,高血压、糖尿病患者去社区办这个证,一年能省下不少钱

牛锅巴小钒
2026-04-05 20:20:47
老爸测评退一赔三最多30万,而董宇辉要赔偿1.2亿

老爸测评退一赔三最多30万,而董宇辉要赔偿1.2亿

映射生活的身影
2026-04-05 16:59:07
4月5日俄乌最新:10个月以来最好的一次

4月5日俄乌最新:10个月以来最好的一次

西楼饮月
2026-04-05 19:42:11
历史第一人!孙颖莎胜王曼昱,获澳门世界杯三连冠

历史第一人!孙颖莎胜王曼昱,获澳门世界杯三连冠

体坛周报
2026-04-05 20:58:17
同战温特!一个横扫,一个被横扫,孙颖莎与王艺迪的差距在哪里?

同战温特!一个横扫,一个被横扫,孙颖莎与王艺迪的差距在哪里?

田先生篮球
2026-04-05 12:55:08
遗憾!中国航天又一次发射失利,损失一枚大火箭

遗憾!中国航天又一次发射失利,损失一枚大火箭

深蓝财经
2026-04-05 21:11:48
深夜!美伊谈判,突传重磅!

深夜!美伊谈判,突传重磅!

证券时报
2026-04-06 00:22:04
“自动铅笔”事件火了,面相学果然权威,带入同学视角天都塌了!

“自动铅笔”事件火了,面相学果然权威,带入同学视角天都塌了!

番外行
2026-04-04 12:52:45
底牌全打光!霍尔木兹、真主党、胡塞全失效,饥荒蔓延,民生凋敝

底牌全打光!霍尔木兹、真主党、胡塞全失效,饥荒蔓延,民生凋敝

番外行
2026-04-05 00:05:11
连人民日报也怒批:别再讲正确的废话,群众要的是有用的真话!

连人民日报也怒批:别再讲正确的废话,群众要的是有用的真话!

细说职场
2026-04-05 15:02:32
王楚钦:我非常庆幸我做到了,我“活到”了最后

王楚钦:我非常庆幸我做到了,我“活到”了最后

懂球帝
2026-04-05 22:22:17
优思益:公司已无力进行相关售后及客诉服务,整体处于崩溃边缘

优思益:公司已无力进行相关售后及客诉服务,整体处于崩溃边缘

界面新闻
2026-04-03 16:32:06
研究首次绘制出完整的阴蒂神经网络

研究首次绘制出完整的阴蒂神经网络

生物学霸
2026-04-03 17:24:20
川崎老员工深夜吐真言:整个日本摩托圈,现在最怕一个中国修车娃

川崎老员工深夜吐真言:整个日本摩托圈,现在最怕一个中国修车娃

潮鹿逐梦
2026-04-05 20:06:47
重磅:乌克兰在利比亚消灭俄情报总局的将军阿韦里亚诺夫!

重磅:乌克兰在利比亚消灭俄情报总局的将军阿韦里亚诺夫!

项鹏飞
2026-04-05 20:46:38
别吃,寄生虫达上千条,近期正大量出现

别吃,寄生虫达上千条,近期正大量出现

番禺台
2026-04-05 08:11:02
2026-04-06 02:51:00
呼呼历史论
呼呼历史论
分享有趣的历史
369文章数 16773关注度
往期回顾 全部

科技要闻

花200薅5千算力,Claude冷血断供“龙虾”

头条要闻

伊朗官员提开放霍尔木兹海峡条件

头条要闻

伊朗官员提开放霍尔木兹海峡条件

体育要闻

CBA最老球员,身价7500万美元

娱乐要闻

王灿兮否认婆媳不和 晒与杜淳妈合影

财经要闻

谁造出了优思益这头“怪物”?

汽车要闻

家用SUV没驾驶乐趣?极氪8X第一个不同意

态度原创

家居
艺术
房产
公开课
军事航空

家居要闻

温馨多元 爱的具象化

艺术要闻

高210米,砸13亿!厦门“矿泉水瓶大楼”即将建成!

房产要闻

小阳春全面启动!现房,才是这波行情里最稳的上车票

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

美飞行员获救细节:美伊发生激烈交火 至少4死1伤

无障碍浏览 进入关怀版