当AI开始自动给你的代码库提PR，我们该担心什么|调用|pr|字符串

当AI开始自动给你的代码库提PR，我们该担心什么

2026-02-11 17:25:01　来源: 我不叫阿哏

广东举报

分享至

该图片可能由AI生成

GitHub刚刚发布了一个野心勃勃的新项目：Agentic Workflows。设想一下，每天早上你打开电脑，发现代码库里已经躺着几个自动生成的PR，文档更新了，测试覆盖率提高了，CI失败被自动分析了，Issue也被自动分类了。听起来很美好，对吧？

这套系统的核心思路是把AI编程代理塞进GitHub Actions里，用Markdown文件定义任务，然后让Copilot、Claude或Codex这些模型去执行。官方强调了安全设计：默认只读权限、沙箱执行、网络隔离、工具白名单。

但社区的反应相当精彩。

有人挖出了一个真实案例：Dependabot创建了一个版本升级的Issue，AI代理接手后，没有用正确的go get命令，而是直接在go.mod里加了一个replace语句。这根本不是正确的做法。更离谱的是，PR里还混入了一些无关的改动，AI审查员指出了问题，但人类维护者没注意就直接合并了。

这暴露了一个根本性问题：AI代理并没有真正理解它在做什么，它只是在模式匹配字符串，然后生成看起来正确的新字符串。

类似的问题在npm的package.json里也很常见。代理不会用npm install命令，而是直接编辑JSON文件，然后幻觉出一个版本号。重命名变量时更糟糕，代理不会用IDE的重构工具，而是暴力用字符串替换，然后编译、看报错、再改，烧掉大量算力。

有开发者分享了应对策略：在提示词里明确写上「添加依赖时用cargo add，不要指定版本」，问题就消失了。但这治标不治本，当上下文窗口变长，模型遵循指令的能力会下降。

更深层的担忧是：执行安全和决策验证是两回事。权限控制解决的是代理能做什么，但真正的失败往往来自代理在权限范围内做了错误的事情，而且信心满满。

还有人吐槽GitHub的优先级问题。Actions的核心功能还有一堆bug没修，付费用户遇到问题一年了还没解决，现在却在往上面堆AI功能。有开源维护者直言：我交的钱被拿去搞AI噱头，而不是改进核心产品，这让我很恼火。

域名选择也引发了争议。官方用的是github.github.io而不是github.com，这违反了人们被教导的防钓鱼规则。GitHub自己说过github.io是用户生成内容的域名，官方内容应该在github.com上。现在自己打脸，等于在训练用户忽视域名安全。

不过也有人看到了价值。把代理放在一个能访问CI、Issue和源码的中心化平台上，确实是个合理的位置。关键是要把AI调用和实际应用分开，这个架构思路是对的。

项目团队在评论区积极回应，承认这还是早期研究，欢迎反馈。他们修复了一些被指出的问题，包括那个go.mod的案例。

我的看法是：自动化本身不是问题，问题是我们还没有好的方法来验证AI的决策质量。代码不只是字符串，它承载着组织的知识。让AI慢慢改进代码库是个好想法，但前提是每一步都经过人类审视。否则，你得到的不是助手，而是一个需要你不断收拾烂摊子的实习生。

github.github.io/gh-aw/

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

手机 / 数码

房产 / 家居

当AI开始自动给你的代码库提PR，我们该担心什么

字节跳动官宣豆包大模型今日进入2.0阶段

王毅：日本如果再赌一次 只能败得更快输得更惨

王毅：日本如果再赌一次 只能败得更快输得更惨

最戏剧性的花滑男单，冠军为什么是他？

田亮一家新年全家福！森碟变清纯少女

谁在掌控你的胃？起底百亿"飘香剂"江湖

星光730新春促销开启 80天销量破2.6万台

态度原创

中古雅韵 乐韵伴日常

下一站是嘉禾望岗，请各位乘客做好哭泣准备

转头就晕的耳石症，能开车上班吗？

钓鱼岛、黄岩岛、仁爱礁已充满中国年味

王毅：日本如果再赌一次只能败得更快输得更惨

王毅：日本如果再赌一次只能败得更快输得更惨

中古雅韵乐韵伴日常