网易首页 > 网易号 > 正文 申请入驻

Claude Opus 4.7安全过滤器误伤合规请求,开发者怨声载道

0
分享至


Anthropic上周发布的Opus 4.7在推出时附带了更严格的安全防护机制,旨在防止滥用行为。然而,这些防护措施也意外阻断了大量合规的正常使用场景。

Opus 4.7的发布紧随Anthropic宣布Mythos模型之后——该模型据称在漏洞发现与利用方面能力过强,因此不向公众开放。尽管外界普遍认为这一风险评估带有自利性质,但Anthropic仍决定以Opus 4.7作为测试平台,部署高度警觉的安全护栏。

Anthropic表示:"我们在发布Opus 4.7时配套了能够自动检测并拦截涉及禁止或高风险网络安全用途请求的安全防护机制。通过对这些防护措施的实际部署,我们将积累经验,逐步推进Mythos级别模型的广泛发布。"

然而,Anthropic只需仔细查阅其Claude Code的GitHub仓库,便能从中获得大量有价值的反馈。针对可接受使用政策(AUP)分类器的投诉急剧增加,用户普遍反映正常工作受到了干扰。

安全防护越严格,误报就越多——Claude变得过于谨慎,频繁拒绝回应无害请求。一张由Claude整理生成的AUP拒绝投诉趋势图清晰呈现了这一问题。

Claude Code用户数月来持续在GitHub上反映被错误拒绝的问题,但此前投诉数量相对平稳。

2025年7月至9月,此类投诉每月约为两至三条。其中一个典型案例是编号4373的议题:"来自claude.ai的内存授权码触发API政策错误。"

2025年10月至11月,AUP相关拒绝的投诉量上升至每月五至七条,例如编号8784的议题:"Claude 4.5在处理正常请求时随机抛出API错误:Claude Code无法响应该请求。"

12月相关投诉较少,这或许与美国节假日期间活跃度下降有关。

1月投诉数量回升至约八条。提交编号16129议题"Claude Code中反复出现AUP误判违规"的开发者指出:"技术性软件开发对话不应触发AUP违规。安全过滤器对良性内容的识别明显过于激进。"2月和3月的情况与此相近。

进入4月后,情况彻底失控。

仅在4月,开发者已提交超过30份疑似误报,涉及安全、通用开发及科学类请求被拒等多个方面。

具体案例包括:

编号48442:《持续性AUP误报——4个会话中出现40余次误报,涉及多个不相关项目(心理学书籍、网页应用、基础设施、机器人)》,记录了Claude拒绝处理多条俄语提示词的问题。

编号49751:《Opus 4.7将标准计算结构生物学标记为使用政策违规,相较4.6版本出现功能退步》,描述了计算结构生物学任务被误判标记的情况。

编号50916:《使用政策问题》,由路易斯安那州立大学网络中心及应用网络安全实验室主任Golden G. Richard III提交。他写道:"我花费每月200美元以上,基本的编辑辅助请求却遭到拒绝,这实在难以接受。这是一个与我的教材《网络安全实战》配套的实验室,我完全了解AI模型被滥用于网络攻击的潜在风险,但模型拒绝为包含简单加密练习的实验室内容校对,实属荒谬。如果模型被限制到连网络安全教育者和研究人员都无法正常使用的程度,这究竟对安全领域有何正面意义?"

编号48723:《Claude Code在读取原始数据文件时持续报AUP违规错误(附示例)》,描述了Claude在被要求读取一份孩之宝Shrek玩具广告PDF时抛出AUP错误的情况。提交该议题的开发者随后发现,文件中某段特定的PDF内容流语法触发了Claude的拒绝响应,其实际内容翻译为"CHARACTER OR FOR DONKEY UNDERNEATH(驴子下方的角色)"。

此外还有编号49679:《已获网络安全用例豁免授权,在Claude Chat中可正常使用,但在Claude Code API中仍持续收到安全系统的误报。已批准的网络安全用例豁免未能完整传递至使用Opus的Claude Code API》,描述了Anthropic专为安全研究人员设立的绕过安全护栏豁免机制,在API层面无法正常生效的问题。

其他近期疑似误判拒绝的案例还有:50795、51352、51794、52086、50494、49904、46147和51248等多个编号。

投诉数量的部分增长或许可归因于用户群体的扩大——用户越多,反馈问题的人自然也越多。但显然,大量Claude用户确实遭受了过激的AUP分类器的不当拦截。

从已泄露的Claude Code源代码来看,其情感分析采用了正则表达式匹配这一简化方式,AUP分类器很可能也沿用了类似的捷径——仅逐字检测是否含有敏感词汇,而不考虑上下文语境。

Anthropic对此未予置评。

Q&A

Q1:Claude Opus 4.7的AUP分类器为什么会产生大量误报?

A:Claude Opus 4.7在发布时配套了更严格的安全护栏,旨在自动检测并拦截涉及禁止或高风险网络安全用途的请求。然而,从已泄露的Claude Code源代码来看,其分类器可能采用了正则表达式匹配等简化方式,仅检测敏感词汇而不考虑上下文语境,导致大量无害的合规请求也被错误拦截。

Q2:Anthropic为网络安全研究人员设立的AUP豁免机制是否有效?

A:根据开发者反馈,这一豁免机制存在明显缺陷。编号49679的GitHub议题显示,已获批准的网络安全用例豁免授权在Claude Chat中可正常生效,但在通过API使用Claude Code(Opus版本)时,豁免权限未能完整传递,安全系统仍会持续产生误报拦截。

Q3:Claude Opus 4.7的AUP误报问题从什么时候开始明显加剧?

A:根据GitHub上的投诉趋势,2025年7月至9月每月约有两至三条相关投诉,10月至11月上升至五至七条,1月至3月维持在约八条左右。进入4月后,投诉数量急剧攀升,仅一个月内开发者便提交了超过30份疑似误报报告,涉及安全、通用开发及科学类请求等多个领域。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
心态被打崩了!麦丹上空篮,约基奇跑全场讨说法引冲突,前者亮了

心态被打崩了!麦丹上空篮,约基奇跑全场讨说法引冲突,前者亮了

篮球资讯达人
2026-04-26 11:40:03
两男子应聘浦发银行销售代表,通过3轮面试,做了497元体检,工资卡都办好了,银行却以学历不符为由拒绝入职

两男子应聘浦发银行销售代表,通过3轮面试,做了497元体检,工资卡都办好了,银行却以学历不符为由拒绝入职

大象新闻
2026-04-24 16:49:09
掘金主帅:我不喜欢麦克丹尼尔斯的行为,但这就是他的为人

掘金主帅:我不喜欢麦克丹尼尔斯的行为,但这就是他的为人

懂球帝
2026-04-26 12:45:19
孩子脱臼复位只收100元,家长举报乱收费!卫健委:应收110元,你还少给了!家长拒缴费后离开!

孩子脱臼复位只收100元,家长举报乱收费!卫健委:应收110元,你还少给了!家长拒缴费后离开!

医脉圈
2026-04-25 20:04:06
马齿苋立功!研究发现:其天然成分4周降脂33%,还能减少血管斑块

马齿苋立功!研究发现:其天然成分4周降脂33%,还能减少血管斑块

思思夜话
2026-04-25 11:16:17
民进党提出“谴责大陆案”高票通过,国民党2重量级人物站队支持

民进党提出“谴责大陆案”高票通过,国民党2重量级人物站队支持

达文西看世界
2026-04-26 07:26:56
一张“初三女孩体测”照片,让家长被数万网友指责:太不用心了!

一张“初三女孩体测”照片,让家长被数万网友指责:太不用心了!

川渝视觉
2026-04-25 20:19:24
争议?19岁王钰栋提前结束谢场+怒摔水瓶!5场0球后他5次情绪失控

争议?19岁王钰栋提前结束谢场+怒摔水瓶!5场0球后他5次情绪失控

我爱英超
2026-04-26 14:15:58
嫌犯携多种武器冲向安检点后开火,特朗普再次躲过危险称与伊朗无关

嫌犯携多种武器冲向安检点后开火,特朗普再次躲过危险称与伊朗无关

澎湃新闻
2026-04-26 12:32:27
“望月鳝剧毒,误食必死”,望月鳝比毒蛇还要毒?什么是望月鳝?你们有遇到过吗?

“望月鳝剧毒,误食必死”,望月鳝比毒蛇还要毒?什么是望月鳝?你们有遇到过吗?

农夫也疯狂
2026-04-26 11:01:20
赵心童两阶段9-7领先丁俊晖 “中国德比”今日17时决胜负

赵心童两阶段9-7领先丁俊晖 “中国德比”今日17时决胜负

齐鲁壹点
2026-04-26 07:18:18
房子遭人强拆,因反抗坐3年牢!出狱后扬言:不赢官司就杀人

房子遭人强拆,因反抗坐3年牢!出狱后扬言:不赢官司就杀人

就一点
2026-04-24 17:46:47
前所未有!中国罕见直接表态:军演针对菲律宾

前所未有!中国罕见直接表态:军演针对菲律宾

凤眼论
2026-04-24 18:49:26
笑不活了!女孩把鸡画得圆肥被判不合格,家长把鸡的照片发给老师

笑不活了!女孩把鸡画得圆肥被判不合格,家长把鸡的照片发给老师

夜深爱杂谈
2026-04-25 07:33:34
赖清德被摁住,29国24小时内为台撑腰,大陆三句话回应

赖清德被摁住,29国24小时内为台撑腰,大陆三句话回应

嘴角上翘
2026-04-26 03:57:43
马英九之女:全台湾男人的梦中情人,被日媒称“全球第四美千金”

马英九之女:全台湾男人的梦中情人,被日媒称“全球第四美千金”

探源历史
2026-04-26 08:40:52
最强赵心童上线!71%长台成功率让丁俊晖绝望:拼到极限仍7-9落后

最强赵心童上线!71%长台成功率让丁俊晖绝望:拼到极限仍7-9落后

风过乡
2026-04-26 06:29:38
切尔诺贝利被遗忘的60万人:拿铲子对抗核辐射,没人告诉他们真相

切尔诺贝利被遗忘的60万人:拿铲子对抗核辐射,没人告诉他们真相

网易新闻出品
2026-04-26 08:51:02
确诊癌症别先住院!先去政务中心,50万费用只花2万多

确诊癌症别先住院!先去政务中心,50万费用只花2万多

苗苗情感说
2026-04-25 21:52:52
外媒:中资工厂正将996加班文化传入欧洲,挤压当地正常就业岗位

外媒:中资工厂正将996加班文化传入欧洲,挤压当地正常就业岗位

凡人学电脑
2026-04-25 23:23:58
2026-04-26 15:03:00
至顶头条 incentive-icons
至顶头条
记录和推动数字化创新
17997文章数 49700关注度
往期回顾 全部

科技要闻

涨价浪潮下,DeepSeek推动AI“价格战”

头条要闻

特朗普2年内遭遇4次刺杀威胁 第一个任期也曾险遭袭击

头条要闻

特朗普2年内遭遇4次刺杀威胁 第一个任期也曾险遭袭击

体育要闻

那一刻开始,两支球队的命运悄然改变了

娱乐要闻

《八千里路云和月》大结局意难平

财经要闻

DeepSeek V4背后,梁文锋的转身

汽车要闻

预售19.38万元起 哈弗猛龙PLUS七座版亮相

态度原创

本地
游戏
艺术
公开课
军事航空

本地新闻

云游中国|逛世界风筝都 留学生探秘中国传统文化

Pearl Abyss 正式发布《红色沙漠》首张官方原声音乐专辑

艺术要闻

郑丽文访问清华附中引发热议,蒋中正信札字迹真实性遭质疑

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

伊朗总统:不会在压力、威胁下进行谈判

无障碍浏览 进入关怀版