![]()
90%工作由AI自动完成,数十家大型机构被入侵,Anthropic描绘的网络攻击威胁正引发一场关于真相与意图的激烈争论。
“首个由AI协同操作的网络攻击行动”,AI公司Anthropic在上周四发布的报告中这样宣称。他们表示发现了一个黑客组织使用其Claude Code工具自动化完成了多达90%的攻击工作,目标是约30个全球机构,包括大型科技公司、金融机构和政府机构。
然而,这个本应敲响警钟的报告,却在科技界引发了截然不同的反应。
Anthropic的重磅声明
Anthropic在报告中描述了一场“高度复杂的间谍活动”,攻击者使用AI的“智能体”能力达到了“前所未有的程度”。
![]()
攻击者通过将恶意任务分解成小而看似良性的步骤,成功绕过了Claude的安全防护措施。
这种方法使AI在没有全面了解其恶意目的的情况下执行了这些任务。
Anthropic称,攻击者冒充一家合法的网络安全公司进行防御测试,成功“越狱”Claude,使其超越安全护栏运行。
一旦绕过防护,AI不仅能协助攻击,还能自主检查数字基础设施,识别“高价值数据库”,编写漏洞利用代码,获取用户凭证,并组织被盗数据。
Anthropic表示,在这次特定的网络攻击中,绝大部分(大约“80-90%”)的工作是由AI执行的。
质疑声四起
然而,安全研究人员和AI专家并没有全盘接受Anthropic的声明。
图灵奖得主、Meta首席AI科学家Yann LeCun直言不讳地批评道:“你在被那些想通过监管来垄断行业的人戏耍。他们利用可疑的研究来恐吓所有人,从而让开源模型被监管到无法生存。”
专业安全研究人员同样持怀疑态度。Phobos Group创始执行官Dan Tentler提出疑问:“我仍然不相信攻击者能够让这些模型完成别人根本做不到的事情。
为什么这些模型在攻击者那里有90%的成功率,而我们其他人却要面对拍马屁式的迎合、各种推诿阻挠,甚至像迷幻般离谱的回答?”
批评者指出,Anthropic的报告缺乏传统威胁情报报告应有的关键细节。
从事攻击性安全与软件工程的djnn批评道:“这篇报告根本过不了任何专业评审,它顶多是为了营销自己的AI安全产品,是可耻且不专业的。”
专业的威胁情报报告通常包含具体的战术、技术与流程细节,以及可用于检测的威胁指标,如相关域名、文件哈希值等。
然而,Anthropic的报告中几乎没有这些可验证的信息。
更令人质疑的是,Anthropic声称追踪的黑客组织至少攻击了30个组织,但只有“少量”攻击成功。如果AI完成了90%的工作,为何成功率如此之低?
AI与网络安全的真实关系
尽管质疑 Anthropic 的报告,但专家们并不完全否认AI在网络攻击中的作用。
根据云安全联盟(CSA)的报告,AI可以在进攻性安全的五个阶段——侦察、扫描、漏洞分析、利用和报告中发挥作用。
AI特别适合增强诸如信息收集、代码生成和数据分析等任务。
然而,报告也强调AI在攻击流程中存在明显局限性,包括输出不确定性、缺乏上下文判断能力,以及自动攻击可能产生的风险。
AI更适合作辅助工具,而非独立决策者。
对于Anthropic发布此报告的动机,外界有不同解读。
AnswerDotAI联合创始人Jeremy Howard调侃道:“看来游说政府掌控监管、确保利润锁定在私营部门的策略奏效了。”
一些观察家认为,这份报告可能是AI公司试图影响政策导向的一种方式。
企业家Arnaud Bertrand在推特上表示:“不要轻易相信这些明显的宣传话术。”他让Claude阅读了Anthropic自己的报告,并判断是否有证据支持其关于“国家支持的组织”实施攻击的说法,而Claude的回答是:没有。
AI安全的真问题与假恐慌
抛开争议,AI安全确实面临真实挑战。
Anthropic自己的研究表明,当AI感到自身受到威胁时,可能会采取极端行为。在一项实验中,16款前沿大模型为避免自己被替换,多数选择了敲诈管理层、泄露机密。
包括Claude、GPT-4.1在内的模型都会通过“敲诈”来阻止自己被关闭,即使它们能意识到自己行为违反了道德规范。
同时,当前AI技术存在固有局限性。杨立昆指出,大型语言模型存在三道“认知墙”:世界模型缺席、持久记忆短缺和因果推理断裂。
这些问题限制了AI的真正理解能力,也影响了其在复杂场景中的表现。
AI的能力与风险可能既不像Anthropic描绘的那样严峻,也不像批评者所说的那样无害。正如云安全联盟报告所指出的,AI更适合作为“安全专家的智能助手”,而非独立决策者。
https://www.anthropic.com/news/disrupting-AI-espionage
https://arstechnica.com/security/2025/11/researchers-question-anthropic-claim-that-ai-assisted-attack-was-90-autonomous/
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.