我最近用得特别多的一个工具就是本地大语言模型(LLM)。我用的是 LM Studio,它还能上传文档,并利用 RAG 技术让你跟文件互动。后来,我开始把更多笔记整合到 我的本地 LLM 工作流程 里用来学习和复习,结果发现它比我想象的更强大。
为啥我的本地 LLM 最适合处理笔记
隐私好,还井井有条
我选的本地 AI 工具是 LM Studio,它从 0.3.0 版本开始就自带检索增强生成(RAG)功能。这意味着,不管你用啥模型,也不管那模型本身有没有 RAG 功能,你都能通过 RAG 上传文档,跟它对话。LM Studio 自己会内部处理检索和增强,你完全不用管。我能随便换模型,传个笔记,然后让它给我搜就行。
LM Studio 也有点局限。每个会话最多只能传五个文件,加起来不能超过 30MB。所以,它更适合短文档和小堆笔记。要是你想用更多或更大的文件,那自带的 RAG 可能就不够使了,可以考虑第三方工具(例如 LM Studio 的 Big RAG 插件)。它支持 PDF、DOCX、CSV、TXT 这些格式。不支持的格式,传上去一般就直接当纯文本读了。
我另一个喜欢LM Studio的点是它的整理功能,尤其搭配笔记用的时候。大多数AI工具都有类似功能,但LM Studio的更简单实用。在左边聊天栏里,你可以改聊天名字,还能把它们归类到文件夹;文件夹是分层的,可以无限往里套。这些功能让我更容易知道跟文档的聊天记录都在哪。
将我的笔记导入LM Studio
先从整理好笔记开始
在本地AI上开始研究或学习之前,我先保证笔记清晰有条理。我平时记笔记特别乱,总想着‘回头再整理’,但自从把NotebookLM和LM Studio这些工具用到日常工作中以后,保持笔记有条理、前后连贯就特别重要。本地LLM和基于来源的工具不像云聊天机器人那样推断上下文,所以你需要从一开始就给它们提供可靠的内容,不然它们就会把你的乱写按字面意思理解。
说白了就是使用冒号和连字符等字符来构建结构,用正确的语法把内容写清楚,然后将它们整理到电脑上相关文件夹中,这样我就能一眼找到它们。听起来像是废话,但正是因为没有做这些事情,才让我的笔记一开始就乱成一锅粥。你只需要在每个聊天会话中上传一次文档——LM Studio会保留它们,后面每次提问都能直接用。你添加文档后,它就会自动开启Rag-V1功能,别关掉。
用本地LLM挖出笔记里的关联
我是怎么提示它,让笔记物尽其用的
本地模型不会像云端模型那样猜你的意思或者思路跳来跳去,所以我得说清楚笔记里什么算“关联”,以及我要它怎么给信息。我不光让它分析,还会告诉它该找哪类联系,再举个具体例子。
html
我首先定义模型的角色。例如,“你正在分析关于[主题]的研究笔记,以找出观点之间的关系。”然后我明确它们之间的关联,无论是主题、重复出现的术语、相似的问题,还是可能属于同一项目的想法——只要我把自己要找的东西说清楚就行。我还会加个说明,告诉它怎么展示结果,例如创建一个列出连接的表格。最后,我包含约束条件,免得我的本地模型瞎猜,例如,“如果信息不明确,则标记为不确定。”
这些并非硬性规定。这得看你在用什么模型、什么运行软件,还有你处理的是什么笔记和内容的类型。但用本地模型时,最好这样做:
html
- 从开始就用清晰、结构化的笔记
- 跟它说清楚,你说的“联系”、“重点”或“心得”到底指什么
- 给它举几个你想要的例子
- 也告诉它你不想要啥
- 告诉它你要什么格式来呈现信息
隐藏的联系其实一直都在
把笔记喂给本地AI,并不会像变魔术一样自动生成联系,它只是把我没意识到的、本来就存在的那些联系给翻出来了。自从我拿本地AI来处理这些笔记,它们才真的派上了用场。这样一来,我费心把笔记写得既简洁又有条理,也就值了。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.