我经常遇到一种很具体的遗忘:明明知道自己之前在手机上看到过某个东西,却完全想不起它来自哪个App、出现在哪一天、存在于哪个页面。更麻烦的是我通常没有截图来帮我回忆,那些内容只是当时恰好看到,没有收藏、没有转发、也没有写进笔记。后来想找,连一个可以回去的入口都没有。
一开始我只是觉得烦,后来我慢慢意识到,这件事可能比“找不到截图”更大一点。如果将来每个人都能拥有自己的AI助手,它能不能理解你不只取决于模型有多强,也取决于你给它留下过多少真实的上下文。今天没有留下来的东西,明天很难补上。
![]()
于是我做了屏忆(ScreenMemo),一个开源的本地屏幕记忆工具。它做的事情说起来很简单:自动记录屏幕内容,然后通过OCR、搜索、时间线、每日总结和AI回顾,把那些原本滑走、然后遗忘的内容,变成可以找回的线索。
![]()
## 工作原理:比你想象的更直接
屏忆的基础工作流程并不神秘。它通过无障碍服务定时截屏,然后把截图保存在本地,同时记录当前应用、时间和路径。对截图做OCR并建立本地索引后,在App里提供搜索、图库、收藏、时间线、动态总结、每日总结和AI回顾。
这套流程拆开看,每一步都在回答一个具体的问题:截屏负责“看到什么”,OCR负责“上面写了什么”,索引负责“以后怎么找”,回顾负责“这一天到底发生了什么”。
## 两种遗忘,两种找回方式
它最直接的场景,是找回那些你觉得“我明明看过”、但记忆相对模糊的内容。
比如昨天在信息流里刷到过一个有用的方法,隔天想再看时却发现没有收藏,想不起作者、也想不起标题。放在过去,你大概会翻浏览记录、重新搜关键词,或者干脆等它哪天再次被推荐。屏忆的做法更直接:如果当时屏幕被记录下来,OCR文本进入了本地索引,之后你就可以搜索那几个模糊的关键词,再回到对应截图确认。
第二种情况是找回一段过程。有些操作不是一张截图能说明白的。注册、登录、授权、付款、查询、客服沟通,都可能跨过好几个页面。单张截图只能告诉你某一刻屏幕上有什么,时间线能把前后关系补回来。屏忆支持按时间回看,也可以生成回放,用来还原一次操作路径。
## 每日总结与AI回顾:线索需要整理
如果你一直在手机上查资料、沟通、处理事情,屏幕内容本身也会留下不少线索。每日总结不是日记,只是先把一天里零散的记录整理成一份能读的摘要。它不一定深刻,但至少能回答一个朴素的问题:今天我大概看过什么、处理过什么。
AI回顾也是类似思路。普通AI助手并不知道你昨天在手机上看过什么。屏忆在你配置AI提供商后,可以基于截图、动态总结、上下文片段和你明确选择的证据图片做回顾。你可以问它“下午那段流程大概在做什么”,也可以让它帮你从一组截图里整理出重点。这里的AI不是凭空聊天,它只会将你已经留下的屏幕线索作为上下文。
屏忆也支持收藏和备注。自动记录负责兜底,但有些内容还是要人来标一下,看到值得留下的截图,你可以加一句自己的说明。这个功能小但必要,自动记录再多也替代不了人的判断。
## 桌面端的教训:产品会转向,但记忆不该丢失
如果要找一个参照物,屏忆和一些桌面端自动记录屏幕的工具有点像。比如Rewind,它早期的方向和屏忆很接近,记录Mac上看过、听过的内容,再用OCR和语音识别做搜索。这个想法很诱人,也确实说明桌面端早就有人在尝试“屏幕记忆”。只是后来的故事有点复杂:Rewind在2024年转向Limitless,开始做会议记录和录音吊坠;2025年被Meta收购后,Limitless官方说明写明Rewind应用会逐渐停止运营,最新版从2025年12月19日起已经禁用了屏幕和音频捕获。
Rewind的事不是一句“产品失败”就能概括的,商业产品会转向、会被收购、会砍掉特定功能,开发团队有自己的选择。但对个人记忆库来说,这些“意外”的影响会变得十分具体:它们的理想状态是长期记录,但这些产品本身未必长期存在。
![]()
后续微软的Recall则补上了另一层提醒。它同样想把电脑上出现过的内容做成可搜索的时间线。2024年遇到隐私和安全方面的质疑后,微软在官方博客里说,Recall会先进入Windows Insider计划,而不是直接随Copilot+ PC面向用户提供预览。大公司也绕不开这个问题:只要工具会持续记录屏幕,信任就会跑到功能前面。
## 为什么选手机端:最零碎的上下文都在这里
在手机上几乎没找到同类工具的前提下,偏偏很多最零碎、最容易丢的上下文又都发生在手机上:聊天、搜索、信息流、支付、设置、临时打开的网页。这便是屏忆开发的初心。
你的屏幕里可能有聊天、订单、账号、位置、支付流程、工作资料和临时验证码。有了Rewind、Recall等功能的“前车之鉴”,屏忆在设计理念上强调本地保存和开源:截图、OCR、索引和大多数配置默认留在本地;代码、实现方式和隐私边界你也能直接在GitHub仓库里看到。本地优先也意味着用户必须能把数据带走,屏忆支持导出ZIP备份,导入时提供覆盖导入和合并导入。
屏忆还提供隐私模式、敏感内容分析和NSFW相关能力。这不是猎奇功能,而是长期记录屏幕以后必须面对的问题。一个记忆工具不能只会保存,也要能遮挡、限制和删除。
## 存储与设置:增长不可避免,控制权必须留给你
存储方面,自动截图的数据是长期增长的。按压缩后约50KB一张、每分钟一张粗算,30天大约是43200张截图,约2.1GB。这个数字不算夸张但会持续增长,所以屏忆不能只负责保存。它还要提供目标大小压缩、历史压缩、过期清理、存储分析和按应用策略。你可以只记录真正需要的App,也可以定期清理不再需要的截图。
屏忆的设置页自上线以来变得越来越长,一开始我也有点犹豫:设置太多会不会显得复杂?但做了一段时间后,我觉得这些开关不能省。因为屏忆记录的是屏幕,很多选择不应该由工具替用户决定:哪些App要进入记忆库、哪些内容需要自动遮挡、AI请求发给哪个模型、提示词怎么写、请求日志要不要保留……甚至要不要把本地记忆通过MCP暴露给同一局域网里的AI客户端,这些都应该是明确的选择,而不应该藏在默认行为里。
所以屏忆把AI能力做成了可选项。只有在你启用AI并配置提供商后,相关总结或对话请求才会发往你配置的模型服务。这会增加配置门槛,但我更愿意把选择权留给用户。你可以配置OpenAI、Claude、Gemini或兼容接口的服务,也可以调整Prompt,查看请求日志和工具调用报告。这样做不如“打开即用”顺滑,但出了问题时,你至少知道一次总结用了哪些图片、发给了哪个模型、返回了什么结果。MCP服务也是同样的思路,它可以让桌面端AI客户端读取手机里的摘要、搜索结果和少量证据图片,但需要手动开启,只在局域网内工作,并且带token。
## 记住不是单点功能,是一条链路
做屏忆之后,我越来越觉得“记住”不是一个单点功能。只做自动截图,会变成图片堆;只做AI总结,会缺少证据;只强调本地保存,又必须面对备份和迁移;只强调找回,也要承认有些内容应该被清理。屏忆现在做的这些功能,本质上都在围绕同一件事:让屏幕上发生过的事,在未来还能有线索可循。
所以它也不会只停在手机端。目前我正在做桌面端,一方面是为了处理更大的备份、合并和迁移任务,另一方面也是希望把手机里留下的记录带到更适合整理、检索和写作的环境里。手机负责捕获那些稍纵即逝的画面,桌面负责承接更长时间尺度上的整理和回看。
更远一点,我希望屏忆能逐步适配更多平台。不是为了把所有设备都塞进同一个App,而是让记录、搜索、回顾、备份和迁移之间形成一条更完整的链路。你在不同设备上看到过的内容,不应该因为换了设备就断了线索。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.