大多数AI编程教程还在教人怎么在IDE里等自动补全。有用,但远不是最高效的玩法。
真正的突破点,是一个能跑在VPS上的小型编程代理。它能检查代码库、制定计划、修改文件、运行测试、总结失败原因——你睡觉的时候它继续干活。
![]()
这篇文章展示一套无需企业级基础设施的实用方案。
![]()
目标不是造出一个神奇的高级工程师,而是自动化开发中最枯燥的中间环节:生成样板代码、重构重复文件、写初版测试、更新文档、扫描日志、提交小型PR、总结变更内容。
如果任务需要产品判断、架构权衡或安全审批,代理应该停下来询问。如果是机械性工作,直接执行。
一个能用的24/7编程代理需要五个模块:任务队列存放工作项;规划器将请求拆解为步骤;工具层负责文件编辑、shell命令、git操作和测试运行;记忆层存储项目规范、约定和过往失败记录;审核门防止不安全部署。
全部可以跑在一台小型VPS上。贵的通常不是算力,是token消耗。所以设计目标是最小化不必要的上下文。
技术栈建议:Python做编排;GitHub issues或本地SQLite表当任务队列;Docker隔离执行;ripgrep搜索代码;pytest、npm test或常规测试命令;一个强模型做规划,一个便宜模型做摘要和重复转换。
![]()
目录结构很简单:agent/下放tasks.db、main.py、tools/、memory/、workspaces/。代理循环逻辑直白:取任务→无任务则休眠→检出代码库→收集相关上下文→向模型要计划→逐条执行步骤→失败则请求调试→运行测试→生成摘要→开PR或请求审核。
不花哨,但能用。
最关键的规则:给代理的上下文越少越好。常见错误是把整个仓库塞进prompt。又慢又贵,效果还更差。
应该分层构建上下文:项目规则、相关文件树、搜索找到的文件、失败测试输出、精确任务请求。比如"给发票加CSV导出"这个任务,代理大概需要发票模型、路由、导出工具、测试和编码规范,不需要整个前端代码。
有shell权限的编程代理需要边界。建议的安全规则包括:工作区不放生产凭证;破坏性shell命令需显式批准;未经审核不能直接部署。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.