![]()
你有没有过这样的体验:对着AI助手下达指令,它能精准理解、快速回复,可一旦需要操作电脑桌面——点击弹窗按钮、填写表单、切换窗口,它就瞬间"失明",只能干看着,最后还得你自己动手收尾。这正是此前AI代理(Agent)的核心痛点:只会动口,不会动手。
近期,开源项目OpenClaw迎来关键突破——配套工具Peekaboo完成重大升级,为AI补上了"眼睛"(屏幕识别)和"手"(键鼠操作)。从停更许久到一日三更,从纯聊天网关到可落地执行的系统,OpenClaw正带着AI从"副驾驶指路"走向"主驾驶实操",真正走进我们的电脑桌面。
![]()
一、热度褪去,核心痛点浮出水面
半年前,OpenClaw(昵称"龙虾")刚出圈时,热度堪比沸水。作为开源AI代理平台,它解决了一个关键问题:打通微信、iMessage、WhatsApp等主流聊天渠道,让用户在熟悉的聊天窗口就能调用AI,无需切换网页或工具。
巅峰时期,GitHub星标超20万,社区讨论热火朝天。但热度褪去后,大家的提问从"这是什么"变成"它还能做什么",一个老问题始终绕不开:AI能理解指令,却碰不到真实世界。
我们的大部分工作,最后一步都要落在电脑桌面:点击软件按钮、处理弹窗、滚动页面、输入账号密码。而当时的OpenClaw,更像一个"只会说不会做"的助手——能帮你梳理操作步骤,却没法自己动手完成,最终还是要把待办清单交还给你。
就像开车时,副驾驶的人再懂路线,碰不到方向盘、踩不到油门,也没法把车开到目的地。AI要真正成为实用工具,必须突破"屏幕操作"这最后一公里。
![]()
二、Peekaboo归来:为AI装上"眼和手"
就在大家期待突破时,曾一度停更的Peekaboo正式归来,带着v3.0.0正式版重磅上线,
![]()
随后开启"狂飙更新"模式——一天内连发v3.1.0、v3.1.1、v3.1.2三个版本,修复细节、优化体验。
![]()
1.从停更到爆发:半年磨一剑
Peekaboo的名字很俏皮,直译是"躲猫猫",恰好对应电脑界面的特点:按钮藏在弹窗里、菜单躲在系统栏、窗口一动坐标全变,总跟自动化工具"躲猫猫"。
它并非新项目,早在2025年6月就推出初版,年末发布v3.0.0-beta3后便暂停更新。当时开发者Peter把全部精力投入OpenClaw——搭建多渠道网关、优化本地运行、调度Agent,每一件都是让普通用户"用得上、跑得稳"的关键事。
直到最近两周,OpenClaw的基础框架趋于成熟,Peekaboo才重新回归。这次爆发式更新,不是"救火修bug",而是"蓄力大释放"——过去半年的技术积累,终于集中落地。
2.核心能力:看懂屏幕,精准操作
对普通用户来说,Peekaboo就是一套macOS专属的AI自动化工具包,核心就两件事:"看得清"和"动得了"。
眼睛:把像素变成"可读懂的地图"
它不只是简单截图,而是能实现像素级捕捉,精准识别窗口、菜单栏、弹窗等界面元素,还能读取每个按钮、输入框、文本的位置和属性。传统脚本遇到窗口移动、弹窗遮挡就失效,而Peekaboo能把杂乱的桌面整理成"结构化地图",让AI看到的不是模糊像素,而是清晰的界面关系。
手:复刻人类的桌面操作
点击按钮、输入文字、滚动页面、切换应用、操作菜单、按快捷键……人类能做的基础桌面操作,它几乎都能完成。更重要的是,它能"边看边做边等"——点击后等待界面变化,截图确认状态,再执行下一步,全程可追踪、可复盘。
简单说,OpenClaw负责"接消息、派任务",Peekaboo负责"看屏幕、做操作",两者结合,AI才算真正拥有了"落地干活"的能力。
三、为什么是现在:AI能力跨过"临界点"
很多人好奇,Peekaboo的功能不算新奇,为什么直到现在才真正好用?核心原因是:AI视觉能力和桌面操作能力,近期刚好跨过"实用临界点"。
去年,视觉模型能看图,但看不懂复杂界面;自动化工具能点击,但精准度低,像"第一次摸触控板的人",动作僵硬、容易出错。而今年,模型的界面理解、文字识别、逻辑判断能力同步提升,叠加Peekaboo的精准操控,体验发生质变——AI不再只能演示简单操作,而是能稳定跑完完整工作流。
与此同时,用户需求也到了爆发点。大家早已习惯在聊天窗口发指令,没人愿意为每个AI任务打开新网页、来回搬运上下文。当模型足够聪明、工具足够稳定时,"让AI直接操作桌面"的需求,自然从"可有可无"变成"必不可少"。
四、从"聊天机器人"到"桌面工人":应用场景全面落地
Peekaboo接入后,OpenClaw彻底摆脱"聊天机器人"的标签,变成能帮你处理电脑工作的"专属工人",实用场景远超想象。
1.日常办公自动化
让AI自动打开Excel、整理数据、生成图表;自动登录办公系统、填写日报、提交审批;自动回复邮件、分类归档,全程无需手动操作。
2.软件测试与调试
社区已有用户用它驱动远程iOS模拟器:识别应用欢迎页、点击"创建账号"按钮、等待界面加载、截图确认结果,全程自动探索,无需人工干预。对开发者来说,这能大幅减少重复测试工作,提升效率。
![]()
3.个人工作流托管
你只需在聊天窗口说一句"整理今天的会议纪要并归档",OpenClaw接收指令后,调度Peekaboo打开文档、提取关键信息、整理排版、保存到指定文件夹,全程自主完成。
这些场景的核心价值,是让AI从"偶尔演示的玩具"变成"持续干活的工具"——每一步操作都可观察、可复盘、可修正,真正解决实际工作问题。
五、看不见的"脏活":为普通用户扫清障碍
很多人只看到Peekaboo的酷炫功能,却忽略了开发者背后做的大量"脏活"——这些工作不吸睛,却是AI工具"能用、好用"的关键。
近期更新日志里,满是"模型目录优化""工具schema调整""打包产物修复""权限适配"等琐碎内容。说白了,就是解决普通用户安装使用时会遇到的各种问题:权限不足、路径错误、模型加载失败、截图卡顿、输入法冲突……
![]()
AI工具最尴尬的场景,就是"演示时行云流水,用户一装就各种报错"。Peekaboo的连续更新,就是要让不同系统、不同模型、不同设备之间的"摩擦"降到最低,让一次点击、一次截图、一次窗口切换都变得稳定可控。
好工具的最高境界是"没存在感"——你不用关心它怎么识别屏幕、怎么点击按钮,只需下达指令,它就能稳定完成任务。Peekaboo正在朝着这个方向努力,把复杂的技术细节藏在背后,把简单的操作留给用户。
六、AI的下一步,是走进你的电脑
从OpenClaw打通聊天渠道,到Peekaboo补上桌面操作能力,AI正完成从"云端对话"到"本地执行"的关键跨越。
过去,AI是"屏幕里的助手",只能听你说、跟你聊;现在,有了"眼和手"的AI,将成为"电脑里的工人",能帮你看屏幕、点按钮、跑流程。
未来,OpenClaw不会只局限于AI入口,更会成为AI操作个人电脑的本地控制层。我们不用再为简单的电脑操作重复劳动,只需专注思考、下达指令,剩下的工作,交给AI完成。
AI时代的终极目标,从来不是替代人类,而是把人类从繁琐的重复劳动中解放出来——而OpenClaw与Peekaboo的组合,正是朝着这个目标,迈出了坚实的一大步。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.