网易首页 > 网易号 > 正文 申请入驻

OpenClaw走红背后:当AI助手拥有你的邮箱和硬盘访问权

0
分享至


(来源:麻省理工科技评论)

AI 智能体在使用过程中存在诸多风险。

例如,即便仅局限在聊天窗口内,大语言模型也会出现错误,表现出不当行为。一旦它们配备网页浏览器、电子邮箱等可与外界交互的工具,这些错误带来的后果会严重得多。

这或许能解释,为何首款实现突破的大语言模型个人助手并非出自头部 AI 实验室,而是由独立软件工程师彼得・斯坦伯格(Peter Steinberger)研发。2025 年 11 月,斯坦伯格将这款名为 OpenClaw 的工具上传至 GitHub 平台,今年 1 月末,该项目迅速走红。

OpenClaw 依托现有大语言模型,让用户打造定制化的个人助手。对部分用户而言,这意味着要提交海量个人数据,包括所有的邮件记录与硬盘内容,这一情况让安全专家深感担忧。OpenClaw 带来的安全风险范围极广,过去几周涌现的相关安全分析博客文章,普通人可能需要近一周时间才能全部读完。中国政府已公开发布警告,提示 OpenClaw 存在安全漏洞

针对这些担忧,斯坦伯格在 X 平台发文称,非技术人员不应使用该软件。他并未回应本文的置评请求。但市场对 OpenClaw 提供的功能需求明确,且这类需求并非只存在于能自主完成软件安全检测的人群中。所有希望涉足个人助手领域的 AI 企业,都需研发保障用户数据安全的系统。企业需要借鉴智能体安全前沿研究的相关技术方案。

OpenClaw 本质上是为大语言模型配备的机械外骨骼。用户可任选一款大语言模型作为核心驱动,这款模型会获得更强的记忆能力,还能自主设定并定期重复执行任务。与头部 AI 企业推出的智能体产品不同,OpenClaw 智能体支持全天候运行,用户可通过 WhatsApp 或其他即时通讯软件与其交互。这意味着它能成为超强能力的个人助手,每天早晨用定制待办事项提醒用户,在用户工作时规划假期,空闲时开发新应用。

但这种强大能力也伴随相应风险。用户若想让 AI 个人助手管理收件箱,就需要授予其邮箱访问权限,其中包含所有敏感信息;用户若想让助手代为购物,就需要提供信用卡信息;用户若想让助手在电脑上完成编写代码等任务,就需要授予其本地文件访问权限。

这类权限会引发多种问题。第一种是 AI 助手自身出现操作失误,曾有用户的 Google Antigravity 编程智能体清空了其整个硬盘。第二种是黑客通过常规黑客工具入侵智能体,窃取敏感数据或运行恶意代码。OpenClaw 走红的几周内,安全研究人员已发现大量此类漏洞,缺乏安全意识的用户会因此面临风险。

这两类风险都有应对方法。部分用户选择在独立电脑或云端运行 OpenClaw 智能体,避免硬盘数据被清空,其他漏洞可通过成熟的安全技术修复。

但本文采访的专家,重点关注一种更隐蔽的安全风险,即提示词注入。提示词注入本质是对大语言模型的劫持。攻击者只需在大语言模型可能浏览的网页发布恶意文本或图片,或将这类内容发送至模型读取的邮箱,就能操控模型按照自己的指令行动。

若这款大语言模型拥有用户隐私信息的访问权限,后果会十分严重。多伦多大学电气与计算机工程教授尼古拉斯・帕佩诺(Nicolas Papernot)表示,使用 OpenClaw 这类工具,就像把钱包交给街上的陌生人。头部 AI 企业能否放心推出个人助手产品,关键在于其抵御此类攻击的防护能力。

需要明确的是,提示词注入目前尚未引发重大安全事故,至少没有公开的相关报道。但如今互联网上已有数十万 OpenClaw 智能体运行,提示词注入会成为网络罪犯更青睐的攻击手段。帕佩诺表示,这类工具会促使恶意攻击者将目标转向更广泛的人群。

提示词注入这一概念,由知名大语言模型博主西蒙・威利森(Simon Willison)在 2022 年提出,仅比 ChatGPT 发布早数月。早在当时就可预见,大语言模型普及后,会带来全新的安全漏洞。大语言模型无法区分用户指令与执行指令所需的数据,邮件、网页搜索结果等内容,在模型看来都只是文本。

因此攻击者若在邮件中嵌入几句话,被大语言模型误认为用户指令,就能操控模型执行任何操作。

提示词注入是棘手的难题,短期内难以彻底解决。加州大学伯克利分校计算机科学教授 Dawn Song 表示,目前业内尚未找到一劳永逸的防御方案。但众多学术团队正在研究该问题,已提出多种策略,未来有望实现 AI Agent 的安全应用。

从技术角度来说,当前使用 OpenClaw 可避免提示词注入风险,只需断开其网络连接。但禁止 OpenClaw 读取邮件、管理日程、开展网络调研,会丧失 AI Agent 的核心使用价值。防御提示词注入的关键,是在阻止模型被劫持的同时,保留其正常工作的能力。

第一种策略是训练大语言模型,使其忽略提示词注入。大语言模型研发的核心环节为后期训练,研发人员会让具备文本生成能力的模型,通过合理应答获得正向反馈,应答失误则接受负向反馈,逐步成为实用的助手。

这类正向与负向反馈是象征性的,大语言模型会像动物一样从中学习。通过这一过程,可训练模型拒绝执行特定的提示词注入指令。

但这一过程需要把握平衡。若过度训练模型拒绝注入指令,模型也会拒绝用户的合理请求。大语言模型的行为本身存在随机性,即便经过高效训练,能抵御提示词注入,偶尔仍会出现失误。

第二种方法是在提示词注入攻击到达大语言模型前进行拦截。通常会使用专用的检测模型,判断传输至目标模型的数据是否包含注入内容。但近期研究显示,即便性能最优的检测模型,也无法识别部分类型的提示词注入攻击。

第三种策略更为复杂。该方案并非通过检测输入内容是否存在注入来管控数据,而是制定规则约束模型的输出行为,避免模型执行有害操作。

这类防御方式的部分规则十分简单。例如限定模型仅能向预先审核的邮箱地址发送邮件,就能避免用户信用卡信息被泄露给攻击者。但这类规则会限制模型完成诸多实用任务,比如代为调研并联系潜在的职业人脉。

杜克大学电气与计算机工程教授 Neil Gong 表示,难点在于如何精准制定这类规则,这需要在实用性与安全性之间做出平衡。

从更广泛的层面来看,整个智能体领域都在权衡这一平衡。智能体需要达到何种安全标准,才能兼顾实用性与安全性,专家对此观点不一。Song 创办的 Virtue AI 公司研发智能体安全平台,她认为当前已能安全部署人工智能个人助手。但 Gong 表示,行业尚未达到这一水平。

即便人工智能智能体尚未能完全抵御提示词注入,仍有多种方法降低风险。部分技术方案也可应用于 OpenClaw。上周在旧金山举办的首届 ClawCon 活动上,斯坦伯格宣布已聘请安全人员参与该工具的研发。目前 OpenClaw 仍存在安全漏洞,但这并未打消众多热衷用户的使用热情。

乔治・皮克特(George Pickett)是 OpenClaw GitHub 仓库的志愿维护者,也是该工具的爱好者。他采取了多项安全措施保障使用安全,在云端运行工具,避免硬盘被误删,同时设置防护机制,防止他人接入自己的智能助手。

但他并未采取专门措施防范提示词注入。他知晓这一风险,却未看到相关攻击事件的报道。皮克特表示,或许这种想法很不明智,但自己不太可能成为首个被攻击的目标。

https://www.technologyreview.com/2026/02/11/1132768/is-a-secure-ai-assistant-possible/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
快船赛季总结:小卡时代两次无缘季后赛 队内麻烦不断或开启重建

快船赛季总结:小卡时代两次无缘季后赛 队内麻烦不断或开启重建

醉卧浮生
2026-04-16 13:07:14
善恶有报,许家印认罪仅1天,子女近况被扒,原来大儿子早有布局

善恶有报,许家印认罪仅1天,子女近况被扒,原来大儿子早有布局

大鱼简科
2026-04-15 22:07:15
乌鸦变凤凰!千亿市值*ST股摘星,周一复牌

乌鸦变凤凰!千亿市值*ST股摘星,周一复牌

21世纪经济报道
2026-04-16 20:58:07
郑丽文访陆回台,没收到马英九祝福,反而是一记重拳,连战再出手

郑丽文访陆回台,没收到马英九祝福,反而是一记重拳,连战再出手

哄动一时啊
2026-04-16 09:43:36
英军上将警告:若台海开战,英军将同时打击中俄,重点对付中!

英军上将警告:若台海开战,英军将同时打击中俄,重点对付中!

别吵吵
2026-04-15 09:49:16
上喂阿祖下睡士兵男孩!底特律变人女主成黑袍奶妈

上喂阿祖下睡士兵男孩!底特律变人女主成黑袍奶妈

游民星空
2026-04-16 18:19:55
小米员工:两口子年收入过百万了。就因为孩子成绩不好,大打出手

小米员工:两口子年收入过百万了。就因为孩子成绩不好,大打出手

蚂蚁大喇叭
2026-04-16 09:37:13
A股涨到4055点,尾盘很明显,不出意外,明天周五,很可能这样走

A股涨到4055点,尾盘很明显,不出意外,明天周五,很可能这样走

另子维爱读史
2026-04-16 16:40:29
卡恩对皇马的猛烈抨击:“这很能说明他们是如何赢得15个欧冠的”

卡恩对皇马的猛烈抨击:“这很能说明他们是如何赢得15个欧冠的”

绿茵情报局
2026-04-17 00:47:04
央视官宣:意甲直播版权正式回归,至此五大联赛转播权已集齐

央视官宣:意甲直播版权正式回归,至此五大联赛转播权已集齐

懂球帝
2026-04-16 21:15:11
离谱!24岁中国萨娃忘记报名+从资格赛打起 对手崩溃:虐菜很爽吗

离谱!24岁中国萨娃忘记报名+从资格赛打起 对手崩溃:虐菜很爽吗

风过乡
2026-04-16 13:17:51
欧冠出局 79岁佛爷安抚全队!皇马换帅势在必行:两人候选

欧冠出局 79岁佛爷安抚全队!皇马换帅势在必行:两人候选

叶青足球世界
2026-04-16 09:19:39
39岁前国脚现状:定居美国踢野球,早已财富自由,有2个可爱女儿

39岁前国脚现状:定居美国踢野球,早已财富自由,有2个可爱女儿

揽星河的笔记
2026-04-14 15:18:30
拉夫罗夫:莫斯科将把所有历史上的俄罗斯土地归还其合法家园

拉夫罗夫:莫斯科将把所有历史上的俄罗斯土地归还其合法家园

番茄说史聊
2026-02-22 14:07:52
雷军将全程参与新一代小米SU7京沪续航直播:15小时,“1265公里中间只充一次电”

雷军将全程参与新一代小米SU7京沪续航直播:15小时,“1265公里中间只充一次电”

凤凰网科技
2026-04-16 13:47:07
女孩在行李箱上写字,全网狂赞:这才是中国人刻在骨子里的浪漫!

女孩在行李箱上写字,全网狂赞:这才是中国人刻在骨子里的浪漫!

中国艺术家
2026-04-14 05:23:31
特朗普要带儿子访华,美企高管喊话全美:绝不能答应中国一件事!

特朗普要带儿子访华,美企高管喊话全美:绝不能答应中国一件事!

影孖看世界
2026-04-17 01:17:08
大口吃肉吃菜 为何中国人能实现美国人却做不到?

大口吃肉吃菜 为何中国人能实现美国人却做不到?

看看新闻Knews
2026-04-15 23:36:04
中国移动:4月30日起全国统一执行!话费、流量将迎来重大变化

中国移动:4月30日起全国统一执行!话费、流量将迎来重大变化

Thurman在昆明
2026-04-15 19:05:34
净利润预增9599%!固态电池量产元年开启,谁将成下一个宁德时代

净利润预增9599%!固态电池量产元年开启,谁将成下一个宁德时代

胖福的小木屋
2026-04-16 16:38:28
2026-04-17 01:59:00
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技评论独家合作
16585文章数 514884关注度
往期回顾 全部

科技要闻

赵明:智驾之战,看谁在大模型上更高效

头条要闻

美国威胁加大对伊朗制裁 伊朗回应

头条要闻

美国威胁加大对伊朗制裁 伊朗回应

体育要闻

皇马拜仁踢出名局,但最抢镜的还是他

娱乐要闻

丝芭传媒创始人王子杰去世,享年63岁

财经要闻

海尔与医美女王互撕 换血抗衰谁的生意?

汽车要闻

空间大五个乘客都满意?体验岚图泰山X8

态度原创

时尚
艺术
手机
数码
教育

爆火的前额叶梗,让多少年轻人主动确诊「脑残」?

艺术要闻

你绝对想不到!这幅油画背后的美丽故事!

手机要闻

苹果双线出击!iOS 26.4降级封死+Siri团队AI特训,WWDC放大招!

数码要闻

荣耀史上最短发布会,发布荣耀史上最强MagicBook数字系列

教育要闻

网传建邺区即将迎来大动作?多校学区要变?

无障碍浏览 进入关怀版