这款开源工具，把你滑走的日常变成可搜索的记忆库|手机|上下文|命令提示符

这款开源工具，把你滑走的日常变成可搜索的记忆库

分享至

我经常遇到一种很具体的遗忘：明明知道自己之前在手机上看到过某个东西，却完全想不起它来自哪个App、出现在哪一天、存在于哪个页面。更麻烦的是我通常没有截图来帮我回忆，那些内容只是当时恰好看到，没有收藏、没有转发、也没有写进笔记。后来想找，连一个可以回去的入口都没有。

一开始我只是觉得烦，后来我慢慢意识到，这件事可能比“找不到截图”更大一点。如果将来每个人都能拥有自己的AI助手，它能不能理解你不只取决于模型有多强，也取决于你给它留下过多少真实的上下文。今天没有留下来的东西，明天很难补上。

于是我做了屏忆（ScreenMemo），一个开源的本地屏幕记忆工具。它做的事情说起来很简单：自动记录屏幕内容，然后通过OCR、搜索、时间线、每日总结和AI回顾，把那些原本滑走、然后遗忘的内容，变成可以找回的线索。

## 工作原理：比你想象的更直接

屏忆的基础工作流程并不神秘。它通过无障碍服务定时截屏，然后把截图保存在本地，同时记录当前应用、时间和路径。对截图做OCR并建立本地索引后，在App里提供搜索、图库、收藏、时间线、动态总结、每日总结和AI回顾。

这套流程拆开看，每一步都在回答一个具体的问题：截屏负责“看到什么”，OCR负责“上面写了什么”，索引负责“以后怎么找”，回顾负责“这一天到底发生了什么”。

## 两种遗忘，两种找回方式

它最直接的场景，是找回那些你觉得“我明明看过”、但记忆相对模糊的内容。

比如昨天在信息流里刷到过一个有用的方法，隔天想再看时却发现没有收藏，想不起作者、也想不起标题。放在过去，你大概会翻浏览记录、重新搜关键词，或者干脆等它哪天再次被推荐。屏忆的做法更直接：如果当时屏幕被记录下来，OCR文本进入了本地索引，之后你就可以搜索那几个模糊的关键词，再回到对应截图确认。

第二种情况是找回一段过程。有些操作不是一张截图能说明白的。注册、登录、授权、付款、查询、客服沟通，都可能跨过好几个页面。单张截图只能告诉你某一刻屏幕上有什么，时间线能把前后关系补回来。屏忆支持按时间回看，也可以生成回放，用来还原一次操作路径。

## 每日总结与AI回顾：线索需要整理

如果你一直在手机上查资料、沟通、处理事情，屏幕内容本身也会留下不少线索。每日总结不是日记，只是先把一天里零散的记录整理成一份能读的摘要。它不一定深刻，但至少能回答一个朴素的问题：今天我大概看过什么、处理过什么。

AI回顾也是类似思路。普通AI助手并不知道你昨天在手机上看过什么。屏忆在你配置AI提供商后，可以基于截图、动态总结、上下文片段和你明确选择的证据图片做回顾。你可以问它“下午那段流程大概在做什么”，也可以让它帮你从一组截图里整理出重点。这里的AI不是凭空聊天，它只会将你已经留下的屏幕线索作为上下文。

屏忆也支持收藏和备注。自动记录负责兜底，但有些内容还是要人来标一下，看到值得留下的截图，你可以加一句自己的说明。这个功能小但必要，自动记录再多也替代不了人的判断。

## 桌面端的教训：产品会转向，但记忆不该丢失

如果要找一个参照物，屏忆和一些桌面端自动记录屏幕的工具有点像。比如Rewind，它早期的方向和屏忆很接近，记录Mac上看过、听过的内容，再用OCR和语音识别做搜索。这个想法很诱人，也确实说明桌面端早就有人在尝试“屏幕记忆”。只是后来的故事有点复杂：Rewind在2024年转向Limitless，开始做会议记录和录音吊坠；2025年被Meta收购后，Limitless官方说明写明Rewind应用会逐渐停止运营，最新版从2025年12月19日起已经禁用了屏幕和音频捕获。

Rewind的事不是一句“产品失败”就能概括的，商业产品会转向、会被收购、会砍掉特定功能，开发团队有自己的选择。但对个人记忆库来说，这些“意外”的影响会变得十分具体：它们的理想状态是长期记录，但这些产品本身未必长期存在。

后续微软的Recall则补上了另一层提醒。它同样想把电脑上出现过的内容做成可搜索的时间线。2024年遇到隐私和安全方面的质疑后，微软在官方博客里说，Recall会先进入Windows Insider计划，而不是直接随Copilot+ PC面向用户提供预览。大公司也绕不开这个问题：只要工具会持续记录屏幕，信任就会跑到功能前面。

## 为什么选手机端：最零碎的上下文都在这里

在手机上几乎没找到同类工具的前提下，偏偏很多最零碎、最容易丢的上下文又都发生在手机上：聊天、搜索、信息流、支付、设置、临时打开的网页。这便是屏忆开发的初心。

你的屏幕里可能有聊天、订单、账号、位置、支付流程、工作资料和临时验证码。有了Rewind、Recall等功能的“前车之鉴”，屏忆在设计理念上强调本地保存和开源：截图、OCR、索引和大多数配置默认留在本地；代码、实现方式和隐私边界你也能直接在GitHub仓库里看到。本地优先也意味着用户必须能把数据带走，屏忆支持导出ZIP备份，导入时提供覆盖导入和合并导入。

屏忆还提供隐私模式、敏感内容分析和NSFW相关能力。这不是猎奇功能，而是长期记录屏幕以后必须面对的问题。一个记忆工具不能只会保存，也要能遮挡、限制和删除。

## 存储与设置：增长不可避免，控制权必须留给你

存储方面，自动截图的数据是长期增长的。按压缩后约50KB一张、每分钟一张粗算，30天大约是43200张截图，约2.1GB。这个数字不算夸张但会持续增长，所以屏忆不能只负责保存。它还要提供目标大小压缩、历史压缩、过期清理、存储分析和按应用策略。你可以只记录真正需要的App，也可以定期清理不再需要的截图。

屏忆的设置页自上线以来变得越来越长，一开始我也有点犹豫：设置太多会不会显得复杂？但做了一段时间后，我觉得这些开关不能省。因为屏忆记录的是屏幕，很多选择不应该由工具替用户决定：哪些App要进入记忆库、哪些内容需要自动遮挡、AI请求发给哪个模型、提示词怎么写、请求日志要不要保留……甚至要不要把本地记忆通过MCP暴露给同一局域网里的AI客户端，这些都应该是明确的选择，而不应该藏在默认行为里。

所以屏忆把AI能力做成了可选项。只有在你启用AI并配置提供商后，相关总结或对话请求才会发往你配置的模型服务。这会增加配置门槛，但我更愿意把选择权留给用户。你可以配置OpenAI、Claude、Gemini或兼容接口的服务，也可以调整Prompt，查看请求日志和工具调用报告。这样做不如“打开即用”顺滑，但出了问题时，你至少知道一次总结用了哪些图片、发给了哪个模型、返回了什么结果。MCP服务也是同样的思路，它可以让桌面端AI客户端读取手机里的摘要、搜索结果和少量证据图片，但需要手动开启，只在局域网内工作，并且带token。

## 记住不是单点功能，是一条链路

做屏忆之后，我越来越觉得“记住”不是一个单点功能。只做自动截图，会变成图片堆；只做AI总结，会缺少证据；只强调本地保存，又必须面对备份和迁移；只强调找回，也要承认有些内容应该被清理。屏忆现在做的这些功能，本质上都在围绕同一件事：让屏幕上发生过的事，在未来还能有线索可循。

所以它也不会只停在手机端。目前我正在做桌面端，一方面是为了处理更大的备份、合并和迁移任务，另一方面也是希望把手机里留下的记录带到更适合整理、检索和写作的环境里。手机负责捕获那些稍纵即逝的画面，桌面负责承接更长时间尺度上的整理和回看。

更远一点，我希望屏忆能逐步适配更多平台。不是为了把所有设备都塞进同一个App，而是让记录、搜索、回顾、备份和迁移之间形成一条更完整的链路。你在不同设备上看到过的内容，不应该因为换了设备就断了线索。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.