网易首页 > 网易号 > 正文 申请入驻

Claude Code自动模式上线:人类审批成最后防线

0
分享至

Anthropic给Claude Code加了自动模式,开发者能从"盯着屏幕点确认"里解放出来。但关键问题没变:哪些操作可以放手,哪些必须等人拍板?

这篇产品更新背后,是AI编程工具从" copilot(副驾驶)"向" autopilot(自动驾驶)"跃迁的典型困境——既要效率,又要有人背锅。


一、自动模式改了什么:三层架构拆解

旧版Claude Code是 permission-based(基于许可)模型。用户每执行一个命令、修改一个文件,都要手动确认。安全是安全,但长会话里反复弹窗,开发者陷入 approval fatigue(审批疲劳)——时间花在管理提示词上,而非写代码。

自动模式的核心变化:系统自主处理多步骤任务,只在敏感操作点暂停等人。

具体能力包括:

• 代码生成:根据目标自动编写

• 命令执行:运行测试、构建等操作

• 工具调用:集成外部API和服务

• 迭代优化:根据结果自我修正

Intempt产品负责人Sid Chaudhary的反馈很直白:「你现在可以启动Claude,然后走开。喝咖啡。真的出去走走。不用盯着它。」

这句话点出了产品设计的真实用户价值——不是让AI更聪明,是让人的注意力从"监督"降级为"抽查"。

二、安全架构:输入层、执行层、审批门

自动模式不是无限制放权。Anthropic设计了一套分层的安全与执行架构,同时管控输入处理和动作执行。

第一层是输入处理。系统分析用户目标,拆解为可执行步骤,识别潜在风险点。

第二层是执行控制。常规操作自动推进,敏感操作触发暂停。

第三层是人类审批门。这是最后防线,针对可能产生不可逆后果的动作——比如删除生产环境数据、修改核心配置文件、调用付费API等。

这种设计的商业逻辑很清晰:Anthropic不想替用户承担操作风险,但又必须提供流畅体验。审批门的位置和粒度,成了产品竞争力的关键变量。

放太宽,出事用户骂;收太紧,体验回到解放前。找到这个平衡点,是自动模式真正的技术难点。

三、对比旧模式:效率与控制的 trade-off(权衡)

旧模式的痛点被官方文档明确承认:repeated confirmations(重复确认)导致 longer sessions(长会话)中的 friction(摩擦)。

翻译成人话:开发者用着用着就烦了。

自动模式的解决思路不是取消确认,而是延迟确认——把分散的、高频的打断,压缩为关键的、低频的决策。

这类似于自动驾驶的分级逻辑。L2是手不能离方向盘,L3是特定场景可以脱手,但系统随时可能交还控制权。Claude Code自动模式大概处于L2.5:大部分时候自己跑,危险路段喊你接管。

区别在于,开车出事有保险和交警定责,代码出事责任边界模糊得多。这也是审批门必须保留的根本原因——Anthropic需要用户的书面确认(点击确认即视为)来转移法律风险。

四、竞品格局:Cursor、GitHub Copilot、Devin怎么玩

AI编程工具的自动化竞赛早已开打。各家路径不同,但核心矛盾一致:如何让AI多干活,同时让用户少担责。

Cursor主打"预测性编辑",AI在后台分析代码,主动提出修改建议,但执行仍需用户确认。它的自动化程度低于Claude Code自动模式,但用户控制感更强。

GitHub Copilot走的是"渐进增强"路线,从代码补全扩展到聊天式编程,再到Copilot Workspace的多文件编辑。微软的保守体现在:所有生成代码都需用户主动采纳,没有真正意义上的"自动执行"。

Cognition的Devin是另一个极端——宣称能独立完成端到端开发任务,包括自主规划、编码、调试、部署。但Devin的封闭性和高昂定价(每月500美元起)限制了普及,且其"自主性"更多体现在演示视频而非真实用户反馈中。

Claude Code自动模式的定位介于Cursor和Devin之间:比Cursor放手更多,比Devin约束更紧。Anthropic的选择反映了一家公司对"现阶段用户能接受什么"的判断——完全自主还不现实,但完全手动已经过时。

五、用户场景:谁需要自动模式,谁应该远离

自动模式不是万能药。从产品设计反推,它最适合三类场景:

第一类是标准化任务。脚手架搭建、依赖安装、格式统一、测试用例生成——这些有明确验收标准、失败成本低的活儿,交给AI循环执行最划算。

第二类是探索性原型。快速验证想法时,开发者需要"先跑起来再看",自动模式的迭代优化能力可以减少中断,保持心流。

第三类是长时运行任务。构建、测试套件执行、文档生成——这些耗时但不需要人类实时判断的操作,适合"启动后走开"。

但三类场景建议保持手动:生产环境部署、涉及敏感数据的处理、跨系统关键接口修改。这些地方容错空间小,审批疲劳的代价远低于一次误操作。

Sid Chaudhary说的"可以走开",是有隐含前提的——你走开的任务,必须在你预设的安全边界内。

六、产品哲学的分歧:工具 vs 代理

Claude Code自动模式的推出,暴露了AI产品设计的深层分歧:AI应该是工具(tool),还是代理(agent)?

工具逻辑:AI响应每个指令,用户完全控制节奏。好处是责任清晰,坏处是效率天花板低。

代理逻辑:AI接受目标,自主规划执行。好处是释放人类注意力,坏处是信任成本和法律风险。

自动模式是两者的折中:代理式的执行,工具式的兜底。审批门就是折中的具象化——你可以让AI当代理,但关键时刻必须回到工具关系。

这种设计是否最优,取决于用户画像。对资深开发者,频繁的审批门可能是干扰;对新手或风险厌恶型用户,它是必要的安全网。Anthropic的选择暗示了当前主流用户的位置:还不够信任AI,但已经厌倦 babysit( babysit:像看小孩一样盯着)。

七、商业模式的隐含假设

自动模式对Anthropic的营收模型有直接影响。

首先是token消耗。自动模式下的多步骤迭代、自我修正,意味着单次任务的API调用量显著增加。这对按token计价的Claude API是利好,也可能推动更多用户从免费/低价 tier(层级)向高用量方案迁移。

其次是企业市场的敲门砖。审批门的设计,本质是为企业合规需求预留接口。SOC 2、ISO 27001等认证都要求"关键操作需经授权",自动模式的人类确认点可以直接映射为审计日志中的控制点。

最后是差异化壁垒。Cursor和Copilot都在追赶自动化能力,但Anthropic率先把"分层安全架构"作为官方卖点,试图建立"更懂企业风险"的品牌认知。

这套商业逻辑成立的前提是:自动模式确实能减少开发者的有效工作时间,而非只是把"盯着屏幕"换成"等着弹窗"。

八、未回答的问题

官方公告留了几个关键空白。

审批门的触发规则是什么?是基于操作类型(删除、写入、执行)、基于影响范围(文件路径、环境标识)、还是基于AI的风险评估?规则不透明,用户无法预判何时会被打断。

误操作的责任如何界定?如果AI在自动模式下删除了生产数据,用户点了确认(或错过了确认超时自动继续),Anthropic的条款如何免责?

学习成本如何?开发者需要多长时间建立对自动模式的信任,知道哪些任务可以放心走开,哪些必须守在旁边?

这些问题的答案,决定了自动模式是成为生产力标配,还是沦为演示功能。

九、对开发者的实际建议

如果你打算试用自动模式,几点实操建议:

从小任务开始。先用格式化、文档生成等低风险操作建立信任,再逐步扩展到代码生成。

预设安全边界。在启动自动模式前,明确告诉Claude哪些目录、哪些命令、哪些API是禁区。系统是否尊重这些边界,是测试重点。

保持日志审查。自动模式的迭代过程会产生大量中间步骤,定期复盘可以发现自己的需求描述哪里模糊,导致AI走了弯路。

准备回滚方案。无论审批门设计多完善,自动执行的总有可能出错。确保你的版本控制和备份策略能覆盖自动模式的操作范围。

最后,别真的完全走开——至少第一次别。Sid Chaudhary的"咖啡 break"是信任建立后的状态,不是新手开箱即用的体验。

十、行业信号:2024-2026的自动化竞赛

Claude Code自动模式的发布时间值得注意:2026年5月。此时距离Devin的轰动发布已过去一年多,Cursor的月活据称突破百万,GitHub Copilot企业版渗透率持续攀升。

Anthropic的入场不算早,但时机选择有其考量。过早推出自动模式,技术不成熟、事故频发,会损害品牌;过晚则市场被瓜分。2026年中这个时间点,暗示Anthropic认为"人类审批门"的技术方案和用户教育都已ready(就绪)。

更宏观地看,AI编程工具的演进正在压缩"人类必须参与的环节"。从代码补全(人写框架,AI填细节)到结对编程(人和AI轮流写)再到自动模式(人定目标,AI执行),人的角色从"动手"转向"动口"再转向"拍板"。

这个链条的终点是"动眼"——人只负责验收结果。但审批门的存在说明,Anthropic认为这个终点还太远,中间态至少要持续几年。

对开发者而言,这意味着技能重心的转移。代码能力不会贬值,但"定义问题、评估方案、承担风险"的能力权重在上升。自动模式消灭的是重复劳动,不是专业判断。

讽刺的是,为了使用好自动模式,你可能需要比以前更懂代码——只有懂,才知道审批门弹出来时该点确认还是取消。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
浏阳烟花厂爆炸最新伤亡公布,遇难人数增至26人,年龄信息披露

浏阳烟花厂爆炸最新伤亡公布,遇难人数增至26人,年龄信息披露

Mr王的饭后茶
2026-05-05 15:35:02
辽宁男篮创耻辱纪录,赵继伟离队成定局?合约卡死关键

辽宁男篮创耻辱纪录,赵继伟离队成定局?合约卡死关键

晚雾空青
2026-05-06 05:32:50
金价一夜暴跌!门店称最低7折,有人拖着行李箱跨城买金,商家:销量仍下滑

金价一夜暴跌!门店称最低7折,有人拖着行李箱跨城买金,商家:销量仍下滑

环球网资讯
2026-05-05 21:41:21
伊朗下“二选一”通牒 美国骑虎难下 海峡主导权争夺趋于激烈

伊朗下“二选一”通牒 美国骑虎难下 海峡主导权争夺趋于激烈

极目新闻
2026-05-05 17:24:43
SpaceX发生爆炸!部件炸飞到天上,水雾满天喷,到底咋回事

SpaceX发生爆炸!部件炸飞到天上,水雾满天喷,到底咋回事

姿势分子knowledge
2026-05-05 23:08:00
曝麻六记发不起工资!多位骨干纷纷离职,小玥儿消费水平也下降

曝麻六记发不起工资!多位骨干纷纷离职,小玥儿消费水平也下降

八卦王者
2026-05-03 11:00:54
上将被查、院士被除名,这背后释放的信号,比你想的更不简单

上将被查、院士被除名,这背后释放的信号,比你想的更不简单

李昕言温度空间
2026-03-19 22:56:18
戴手套!“72小时可夺命”,珠海、深圳曾有人中招→

戴手套!“72小时可夺命”,珠海、深圳曾有人中招→

珠海发布
2026-05-05 19:08:25
相差15岁姐弟恋!00后体育生爱上重庆单亲妈妈,喜欢叫对方姐姐

相差15岁姐弟恋!00后体育生爱上重庆单亲妈妈,喜欢叫对方姐姐

那年秋天
2026-05-03 11:50:10
51假期还没过完,多省景区接连塌房!央视出手,当地文旅跟着遭殃

51假期还没过完,多省景区接连塌房!央视出手,当地文旅跟着遭殃

米果说识
2026-05-05 19:41:35
被快手砸了5.7亿的A站,成了沉默的“赛博坟场”。

被快手砸了5.7亿的A站,成了沉默的“赛博坟场”。

差评XPIN
2026-05-06 00:07:34
95年我相亲碰大雨,丈母娘叫我和大姐住一屋,那夜我目睹难忘一幕

95年我相亲碰大雨,丈母娘叫我和大姐住一屋,那夜我目睹难忘一幕

白云故事
2025-03-04 05:45:02
32℃!雷雨、7级大风!江苏最新天气预测

32℃!雷雨、7级大风!江苏最新天气预测

江南晚报
2026-05-06 02:58:45
枪手2-1淘汰马竞,20年后再进欧冠决赛创历史新纪录

枪手2-1淘汰马竞,20年后再进欧冠决赛创历史新纪录

老牛体育解说
2026-05-06 05:13:05
男子频繁骚扰女乘客,公交司机直接把车开到派出所!

男子频繁骚扰女乘客,公交司机直接把车开到派出所!

环球网资讯
2026-05-05 11:02:17
爆红太子妃竟成豪门小姨太的瓜

爆红太子妃竟成豪门小姨太的瓜

十锤星人
2026-05-04 23:41:41
“中年返贫三件套”,正在吞掉一代人的存款

“中年返贫三件套”,正在吞掉一代人的存款

十点读书
2026-04-18 18:36:15
离了大谱:当妈的猥亵女儿?

离了大谱:当妈的猥亵女儿?

十柱
2026-05-04 14:54:35
神预言应验!印度专家早已看穿:中印一旦和平,美国全盘棋局

神预言应验!印度专家早已看穿:中印一旦和平,美国全盘棋局

Ck的蜜糖
2026-05-05 21:23:36
知名女星自曝:7年没性行为!流泪求救,被强行注射50针不明液体

知名女星自曝:7年没性行为!流泪求救,被强行注射50针不明液体

草莓解说体育
2026-05-04 01:09:39
2026-05-06 06:19:00
码上闲叙
码上闲叙
有态度网友ytd
3331文章数 40关注度
往期回顾 全部

科技要闻

传苹果考虑让英特尔、三星代工设备处理器

头条要闻

媒体:中国史无前例下"阻断禁令" 美媒迅速捕捉到信号

头条要闻

媒体:中国史无前例下"阻断禁令" 美媒迅速捕捉到信号

体育要闻

全世界都等着看他笑话,他带国米拿下冠军

娱乐要闻

内娱真情谊!杨紫为谢娜演唱会送花篮

财经要闻

浏阳烟花往事

汽车要闻

同比大涨190% 方程豹4月销量29138台

态度原创

时尚
本地
健康
艺术
军事航空

衣服不用准备太多,找到一些实用的单品才最重要,百搭又有性价比

本地新闻

用青花瓷的方式,打开西溪湿地

干细胞治烧烫伤面临这些“瓶颈”

艺术要闻

这些劳动图画最美!

军事要闻

特朗普威胁伊朗不要向美国船开火

无障碍浏览 进入关怀版