![]()
如果你已经安装了OpenClaw,接下来该做什么?
工具分散在不同的文档中,OpenClaw技能默认自动加载,全部启用的话会让你面临一些不确定的风险,要从文档和源代码中搭建出完整的体系,需要花费大量精力。
这是我设置OpenClaw后的研究笔记,包括25个工具和53个官方捆绑技能的功能,本文重点介绍每个工具和技能的功能以及如何根据您的需求进行配置。
了解工具和技能之间的区别
很多人会把这两者混淆。其实很简单。
工具就像人体的器官一样,它们决定了 OpenClaw能否执行某些操作,read例如write访问文件、exec运行系统命令、web_search像谷歌一样进行搜索、web_fetch读取网页以及browser与页面交互(点击按钮、填写表单、截屏)。如果没有启用某个工具,有些想法就无法得以实现。
技能就像教科书一样,它们教会OpenClaw如何组合各种工具来完成任务。gog例如它们教会OpenClaw如何使用Google Workspace收发邮件和日历,obsidian如何整理笔记,github如何使用代码仓库,以及slack如何向频道发送消息。53项官方技能涵盖笔记、电子邮件、社交媒体、开发、智能家居等领域。
安装技能会赋予OpenClaw新的权限吗?不会。
例如您安装了obsidian技能。OpenClaw现在知道如何整理笔记,但如果没有write启用工具,它根本无法写入文件。
要让OpenClaw通过技能实际执行某些操作,必须满足三个条件。以“读取你的Gmail”为例:
配置:您是否允许OpenClaw运行命令?(如果没有允许exec,它甚至无法启动程序)
安装:gog机器上是否已安装桥接工具?(如果没有安装,OpenClaw知道该做什么,但无法连接到Google)
授权:您是否已登录Google帐户并授予访问权限?(未经授权,Google将不会允许访问)
这三者缺一不可。
同心圆架构:从核心到边缘
如果把全部25种工具和53种技能全部列出来,会非常繁杂。所以我把它们整理成同心圆的形式:
第一层核心功能(8种工具):文件访问、命令执行、Web访问。几乎所有用户都启用了这些功能。
第二层高级功能(17种工具):浏览器控制、内存管理、多会话管理、自动化。根据需要启用。
第三层知识层(53项技能):教OpenClaw与Google、Obsidian、Slack等配合使用。安装您使用的软件。
![]()
第一层:核心功能(8种工具)
这8个工具是OpenClaw的基础。仅启用这些工具时,OpenClaw是被动响应式的,你问它,它就响应。它可以读取文件、运行命令和搜索网络,但它不会记住你在不同会话之间的偏好设置,也不会主动推送通知。真正让OpenClaw从“聊天机器人”变成“助手”的是第二层。但如果没有第一层,第二层就无法运行。
文件操作:读取、写入、编辑、应用补丁
read是只读的,write可以edit修改文件,apply_patch应用代码更改。这四项功能至关重要——大多数人都会启用它们。
执行与流程管理:执行、流程
exec OpenClaw允许它运行任何shell命令,安装软件包、运行脚本、管理系统等。它可以为你安装依赖项,但也可能控制rm-rf你的整个机器。如果没有OpenClaw exec,大多数任务都会失败。如果没有OpenClaw exec且没有其他安全措施,你就等于拱手让出了root权限。
因此,我强烈建议启用审批功能exec,每个命令都会先显示给您,只有在您确认后才会运行:
![]()
这很烦人吗?说实话,确实很烦人。但这是最基本的保护措施,如果人工智能判断失误或受到“即时注入”攻击,这道门就是你的最后一道防线。
process管理后台进程,列出任务、检查输出、终止卡住的进程。
网页访问:web_search、web_fetch
web_search它执行关键词搜索,web_fetch读取网页内容。这两项功能共同使OpenClaw能够浏览互联网以获取信息。
第二层:高级功能(17 种工具)
第一层是“它能否运行”,第二层是“它是否运行良好”。这些工具将 OpenClaw从一个命令执行器转变为一个真正的助手,它可以记住你的偏好设置、控制浏览器并发送定时通知。但每增加一个工具,攻击面就会扩大,因此要评估这种权衡是否值得。
浏览器
browser OpenClaw可以控制Chrome浏览器(点击按钮、填写表单、截屏等)。我用它来比较价格、查询产品规格,以及将商品添加到购物车。但我总是自己结账。“最后一公里”的支付环节绝不会交给人工智能,这是我的底线。
canvas是一个用于图表和流程图的可视化工作空间,image让OpenClaw能够“理解”图像。
内存
让 OpenClaw 记住跨会话的信息。使用一周后,它就知道我用 Astro 建博客、部署在Azure上,并且偏好繁体中文,无需每次都重新解释。使用时间越长,它就越了解你。
系列课程(5种工具)
同时运行多个会话,分别处理不同的任务,一个讨论产品创意,另一个研究旅行计划,互不干扰。
sessions_list并sessions_history查看会话。session_status检查状态。sessions_send与sessions_spawn启用会话间通信和生成子任务。
让OpenClaw向Discord、Slack、Telegram、WhatsApp、iMessage发送消息。
我启用了这项功能,但仅用于给自己发送消息,绝不会让它代表我与他人沟通。原因很简单,人工智能以你的名义发送的消息是无法撤回的,如果它误解了上下文、使用了错误的语气,或者被提示注入欺骗而发送了某些内容,后果将不堪设想。
我使用OpenClaw作为我的AI目标管理系统的通信层,启用后,message它可以主动向我推送通知:每日简报、任务提醒和待办事项提醒,全部发送给我自己。
硬件控制
跨设备硬件控制(远程屏幕截图、GPS定位、摄像头访问)。
我第一次看到这个工具时,就问自己:我什么时候需要AI自动打开相机呢?我想不出任何场景。截图的话,我可以直接用Telegram发过去,虽然多一步,但安心多了,因为我已禁用。
自动化
cron设置计划任务,gateway让OpenClaw自行重启。
每天早上6:47,我的Telegram都会收到OpenClaw准备的每日简报,包括我今天需要做的事情、待回复的消息以及天气预报。这就是cron Plusmessage的实际应用,也是我的AI 目标管理系统的核心。
代理通信
列出可用的代理ID。OpenClaw支持多代理架构,但官方文档并未详细介绍。如果您只运行一个OpenClaw实例,则无需此操作。
扩展工具
lobster是一个用于定义多步骤流程的工作流引擎,llm_task可将LLM处理步骤插入到工作流中。
如果你不使用工作流引擎,则跳过这两项。
第三层:知识层(53项官方技能)
53个技能听起来很多,但浏览之后你会发现,可能只有十几个与你相关。其余的技能虽然也不错,但如果不符合你的使用场景,那就没什么意义了。
重要提示:捆绑的技能默认自动加载——如果系统上安装了相应的命令行工具,技能将自动激活。并非“未安装则不加载”,而是“未禁用则全部加载”。要控制哪些技能处于活动状态,请使用skills.allowBundled白名单模式。
ClawHub拥有3000多个第三方技能,但它们的安全风险是另一个需要关注的问题。
下面按使用场景分类。
笔记
4种笔记技巧:它们是否有效取决于你的部署情况。notion apple-notes bear-notes apple-notes而且bear-notes只能在本地Mac上运行,如果OpenClaw运行在虚拟机中,那就不行了。obsidian它只能处理本地文件。我用的是Obsidian,但我的库在我的Mac上,而OpenClaw运行在Azure虚拟机上,所以我用Claude Code在本地处理笔记,而不是通过OpenClaw。如果你想让OpenClaw直接管理笔记,而它又运行在虚拟机中,并且notion是基于云的,没有部署限制。
生产率
两款电子邮件应用:gog 一款集成了整个Google Workspace(Gmail、日历、任务、云端硬盘、文档、表格),另一款himalaya仅使用IMAP/SMTP进行收发邮件。如果您使用Google帐户,建议选择另一款功能更全面,而且您可以随时通过Google帐户撤销访问权限。gog himalaya gog
任务管理工具包括things-mac Things 3、apple-reminders Google Tasks和Google Tasks trello。如果您已经gog安装了Google Tasks,则无需额外安装。
即时通讯和社交媒体
wacli(WhatsApp)、imsg(iMessage)、bird(X/Twitter)slack,discord这些技能让OpenClaw能够深度访问各个平台,包括搜索消息历史记录、同步对话和管理频道。与message仅能发送消息的工具不同,安装这些技能后,OpenClaw将获得您在该平台上的完全数据访问权限。
我一个都没安装,对外通信的最后一步总是手动操作。
开发者工具
●github通过gh命令行界面 (CLI) 操作 GitHub,需要 OAuth 认证,权限可控。
●tmux管理多个终端会话
●session-logs搜索并分析过往对话记录
●coding-agent在后台调用其他人工智能编码助手(例如 Codex、Claude Code等)
我已经安装了Claude Code github、tmuxGitHub和session-logsOpenClaw。我使用Claude Code在本地编写代码,但始终可以通过Telegram访问OpenClaw,如果我外出时CI/CD出现故障,我只需在手机上问“检查一下为什么这个PR构建失败”,它就会拉取GitHub Actions错误日志并告诉我原因。
我还没安装coding-agent,但它的潜力巨大——你可以把Claude Code安装在OpenClaw的虚拟机上,让它在后台执行编码任务。想象一下,你通过Telegram告诉OpenClaw:“我在GitHub上发现了一个有趣的代码库然后搭建一个演示网站。”它就会启动Claude Code,自主执行,完成后推送通知。这简直就是AI编排AI。我还没深入研究过,但它已经在我的计划之中了。
密码管理
1password允许OpenClaw访问您的1Password密码库(查找密码、自动登录、填写表单)。使用场景包括:“登录AWS控制台”或“此网站的密码是什么?”
但这种权限模式是非此即彼:一旦获得授权,它就能访问整个密码库。你无法将其限制为只能访问特定条目,无论你存储了什么,它都能读取。所以我选择不安装它。如果你真的需要这项功能,可以考虑创建一个“仅限AI使用的密码库”,其中只包含你愿意与AI共享的密码。
其他类别
以上列出的类别是我目前正在使用或认真考虑过的。其余的——音乐播放、智能家居、图像生成、语音转文字、外卖——我还没有安装。完整列表见附录。
工具和技能设置
我的OpenClaw运行在Azure虚拟机上,通过Telegram进行操控。它与桌面端的Claude Code配合使用,形成移动端+桌面端的双工作流程。移动设备用于随时随地进行讨论、研究和记录想法(对话记录自动同步),桌面端用于执行。我每天还用它来收发邮件、查看日历、进行研究以及阅读每日简报。
以下是我当前的配置以及每个选择背后的原因。
工具(已启用 21/25)
我的原则很简单:如果我想不出使用场景,那就保持关闭状态。
![]()
已启用21项,已禁用4项:(nodes想不到使用场景),canvas(不需要),llm_task/ lobster(未使用工作流引擎)。exec已启用审批。message仅发送给自己。
技能(已启用 9/53)
如前所述,捆绑的技能默认自动加载。我使用allowBundled白名单来限制只加载我需要的技能:
![]()
简而言之:gog用于电子邮件和日历,github用于存储库,其余部分是每日简报和系统管理的实用程序。
如何使用 AI 代理自动执行任务
OpenClaw从聊天机器人转变为基础设施,其功能也由此而来。通过cron(调度)和message(推送通知)的结合,它变成了一个即使在你睡觉时也能运行的自动化引擎。
模式始终相同:触发 + 操作 + 执行。定义何时运行、执行什么操作以及结果发送到哪里。以下是我实际使用的自动化流程:
每日简报:每天早上6:47,我的Telegram都会收到一份简报:当天的日程安排、待回复的邮件、天气预报以及夜间发生的任何CI/CD故障。这个自动化功能取代了我以前喝咖啡前查看五个不同应用程序的习惯。
邮件分类:OpenClaw每天两次扫描我的收件箱,根据紧急程度对邮件进行分类,并发送摘要。新闻简报会被存档。任何需要处理的邮件都会被标记,并附上一行摘要。我的收件箱管理时间从30分钟缩短到了5分钟。
CI/CD监控:当GitHub Actions工作流失败时,OpenClaw会读取错误日志,识别可能的原因,并通过Telegram推送诊断信息。我甚至在排队买咖啡的时候,都能用手机修复生产环境问题。
内容研究:OpenClaw每日从我关注的特定 Reddit 子版块、Hacker News帖子和RSS源中收集热门讨论,然后汇总潜在的写作主题。它不会替我写作,它只是挖掘出值得写作的内容。
设置并不复杂,每个自动化流程都是一个cron触发提示的条目,提示会告诉OpenClaw使用哪些工具以及将结果发送到哪里。难点不在于配置,而在于弄清楚日常工作流程中哪些部分值得自动化。先从一个能最大程度减少日常繁琐操作的流程入手,确保它运行正常,然后再添加其他流程。
后续步骤:开始配置您的OpenClaw
您不需要全部25种工具,53项捆绑技能默认全部启用,allowBundled您可以根据需要自行选择保留哪些技能。打开您的工具openclaw.json,并从以下三个原则开始:
●如果想不出使用场景,就把它关掉。
●更强大的功能,更完善的控制,启用审批功能exec,只给自己发送消息。
●最后一步需要人工操作,结账、发送消息、公开发布,任何不可逆的操作都会一直伴随着你。
我上面的配置可以作为参考,然后根据你的需要进行调整。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.