一个GitHub工单刚被标记为"处理中",你的Claude Code已经自动打开浏览器、登录后台、截图比对、提交复现报告——全程没等你喝完那口咖啡。这不是科幻,是SideButton正在做的事。
2024年下半年,AI编程助手(编程智能体)的渗透率从17%飙到34%,但有个尴尬的事实:它们能写代码,却搞不定"打开Jira看需求"这种脏活。SideButton的团队算过账,开发者平均每天要在浏览器和IDE之间切换47次,每次上下文切换的恢复成本是23分钟。
把浏览器变成AI的"手"
SideButton的核心设计像给AI配了个实习生——不是替代你思考,而是替你跑腿。它通过MCP(模型上下文协议)接入Claude Code、Cursor、Copilot或Windsurf,然后扔给它们三样东西:浏览器自动化引擎、工作流调度器、领域知识包。
Chrome扩展是这套系统的关键。它给AI提供真实的浏览器会话:截图、DOM访问、实时JS执行。Agent看到的页面和你看到的一模一样,而不是靠HTML解析猜结构。每个操作都记录在本地日志,出事了能复盘。
知识包(Skill Packs)的设计更细。它不是泛泛的"你会用React吗",而是针对具体产品的结构化记忆:数据模型、预期状态、常见工作流。比如你的内部后台系统,新人需要两周上手,Agent读一遍知识包就能开工。角色剧本(Role Playbooks)再细化到岗位——软件工程师怎么测、QA怎么写用例、产品经理怎么验收。
Webhook驱动的自动化流水线
外部触发器是另一个被低估的设计。Jira工单状态变更、GitHub PR评论、Slack @mention,这些事件通过webhook进入SideButton的队列,Agent自动认领下一个任务。
一个典型场景:产品经理在Jira把需求拖到"开发中",SideButton唤醒Agent,Agent打开Figma看设计稿、读知识包里的组件规范、在代码库创建分支、生成初步实现——全部在Claude Code里完成,人类开发者收到通知时,骨架代码已经躺在那里。
知识包文件是纯Markdown,存在~/.sidebutton/skills/,启动时加载。你可以让Claude从当前会话提取知识生成新包,也可以装社区贡献的。工作流用YAML定义,可复用的任务入口。本地配置会合并工作流、角色和领域目标,这意味着同一套Agent在不同项目里行为可以完全不同。
开源策略与生产就绪的底气
SideButton选择完全开源,代码在GitHub上。团队的说法很直接:Agent基础设施太重要了,不能黑箱。Bug报告和功能请求走GitHub issue,官网有个一键报Bug按钮。
平台目前标记为"稳定且生产就绪",路线图里提到正在扩展更多第三方集成和更复杂的并行工作流。没有放卫星,也没有"即将推出"的空头支票。
一个早期用户的反馈被团队挂在文档里:"上周三下午2点,我在开会,Agent把我积压的12个Jira工单全处理完了,包括3个我以为要手动复现的浏览器兼容问题。"
当AI代理开始争抢"谁更懂你的内部系统"时,把领域知识结构化、可版本化、可共享,会不会成为新的技术壁垒?你的团队现在有多少"只有老王知道"的隐性知识,正在随着人员流动蒸发?
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.