网易首页 > 网易号 > 正文 申请入驻

养虾「不可能三角」:好用、好玩、安全,复旦这个00后团队做到了!

0
分享至



机器之心发布

2026 开年以来,OpenClaw 带来的 Agent 热度正以惊人的速度从科技圈向全行业扩散。

会读文档、调工具、接工作流,那个曾经只存在于 Demo 里的数字员工,正在一步步走进真实业务。

但真正的问题,也在这时浮出水面:

时至今日我们都听说过龙虾的能力,可让人迟迟不敢放手的,是担忧太多:安装麻烦、权限太大、过程黑箱、出了事根本来不及拦。它到底在干什么,你看得见吗?它真要越界的时候,你拦得住吗?

最近,来自复旦大学马兴军老师的「零零后」团队开源的「 XSafeClaw 」,给出了一个让人眼前一亮的答案。它把安全监控、任务审计、风险拦截和运行轨迹,全都前移到了可视化界面里;原本藏在后台、让人提心吊胆的执行过程,在这里第一次变成了一座能被看见、被理解、也能被随时接管的安全智能体小镇——有点像给龙虾们造了一座带护栏的《星露谷物语》,让每个正在上班的小「牛马」都无处遁形。



项目网址:

https://xsafeclaw.ai

GitHub:

https://github.com/XSafeAI/XSafeClaw

给全民「龙虾热」泼冷水:

真实世界的复杂性,正在击穿Agent安全防线

当 Agent 开始继承上下文、调用工具、改写系统状态,谁能看见它在做什么?谁又能在它失控前叫停?

2 月底,TechCrunch 报道了一个极具警示意义的案例:Meta 的安全负责人Summer Yue将 OpenClaw 接入真实邮箱后,Agent 开始疯狂删除邮件。即便她在手机上几近请求地连发停止指令「please stop」,也没能拦住这个失控的「数字员工」。



Business Insider 也补充了一个很关键的细节:她之前在 toy inbox 上测试了很久,换到真实邮箱后,原本的「先确认再行动」这条约束在更大任务里丢了。



这个案例撕开了 Agent 繁荣下的裂缝:Agent 的风险,已不再停留在「胡言乱语」的文字输出层。

能力可以一路狂飙,治理要是没跟上,最先被「创飞」的往往就是用户。当它开始继承上下文、调用本地资源,带来的失控是实实在在的生产灾难。



Anthropic 与 Microsoft 最近相继发声:没有任何 Browser Agent 能对注入攻击免疫。在复杂的执行回路里,身份边界和本地状态,全是风险点。

这一连串的安全震荡,给所有狂热的开发者敲响了警钟:Agent 的能力上限,终究是由安全治理的下限决定的。

在这种从「裸奔」转向「治理」的行业拐点下,复旦大学可信具身智能研究院姜育刚、马兴军团队开源了XSafeClaw。它的出现,也证明行业达成了一个隐秘的共识:Agent 规模化落地的最后 1 公里,是人类对工具的确定性控制,是疾驰狂奔的赛车上的刹车键。

Agent 全生命周期监控:

XSafeClaw 让风险看得见管得住

XSafeClaw 的思路很清晰:既然 Agent 的风险是动态的,那安全控制就得「全时段在线」:先让其运行过程看得见,再让其行为管得住。

大部分 Agent 框架还在以「后台黑箱」的方式运行。它调了什么工具、执行了哪些指令、协同了多少流程、消耗了多少资源,用户往往只能查看系统日志,很难在运行当下形成直观判断。一旦出现误操作、异常调用或结果偏差,排查成本会迅速上升,不确定性也会被放大。

1、看得见,才放心:

以往的安全工具,会将开发者和用户锁在「日志地狱」里。我们往往要对着满屏的日志流才能猜到哪里出了错。而 XSafeClaw 把 Agent 的运行过程做成了一座可视化的「安全智能体小镇」。在这里,Agent 变成了界面上清晰可见的「员工」。鼠标悬停,能透视它的基座模型和实时状态;点进去,工具调用和任务轨迹一清二楚。任务链路、工具调用、风险状态、资源变化,都能在界面里被直接看见。

每一个 Agent 都像一个正在上班的数字角色,你能一眼看到它在忙什么、跑到了哪一步、哪里亮起了告警。开发者既可以回看每个 Agent 的完整历史,也可以按 task 单独审计具体任务内容。对真正要把 Agent 接进工作流的人来说,这种「可见、可感、可干预」的确定性,本身就是信任的开始。



同时 XSafeClaw 为 Agent 搭了一套完整的「运行时安全监控环境」:

初始化层,先检查 Skill 配置,从源头隔离潜在注入攻击;

输入层,过滤越狱提示与可疑上下文,降低污染数据进入主链路的机会;

推理层,持续扫描记忆和中间状态,防止 Agent 被「脏」信息一步步带偏;

决策层,重点审查工具权限,把高风险动作单独拎出来复核;

执行层,实时审计结果,关键操作支持回收、留痕与版本回退。



2、管得住,才敢用:

XSafeClaw 的后台是一个智能体安全监控系统,主要包含以下几个核心的功能模块。

01安全监控:给Agent 装上「行车记录仪」

系统会持续记录 Agent 的会话、任务轨迹、工具调用和 Token 消耗。在可视化界面里,开发者不再只能盯着日志猜发生了什么,而是能直接看到 Agent 正在做什么、走到了哪一步、是在哪个环节触发了风险。





02资产守护:监控权限、依赖和硬件

文件系统、软件依赖、CPU/GPU 负载,这些原本分散在不同后台的信息,被统一收进一个界面里。对真正要把 Agent 接进生产环境的人来说,安全从来不只是 prompt 的审计,也包括它到底碰了什么资源、占了多少权限、系统现在处在什么状态。



03风险测试:与其线上翻车,不如提前排雷

与其等 Agent 线上翻车,不如在实验室里压力测试。XSafeClaw 内置红队测试机制,针对诱导输入、长链路协同等高压场景进行压力自检。通过主动测试发现脆弱点,在部署前完成风险闭环,确保系统绝对可信。



04当风险触发:该拦截时绝不手软,该放权时交给人类

•瞬时拦截:一旦 Agent 触发高风险动作,系统会瞬间「踩下刹车」并弹出风险预警,直接封锁未经确认的敏感操作。(这两张图做成左右划切换)





•人在回路(human in the loop):所有的拦截记录会自动转入人工审核流程。你可以像审批员工申请一样,审查 Agent 到底想做什么,并自主决定是「批准」还是「驳回」。



好看的 Agent 产品,反而更有工程价值?

产品的美观与可爱这件事只是个噱头吗?

长期以来,开发者圈子里有个根深蒂固的偏见:搞技术的、搞后端的,界面做得越极简越 cli 才越显得专业。至于「美感」和「可爱」?那通常被认为是产品经理拿去忽悠小白用户的噱头。

但在 Agent 时代,这个逻辑被彻底击穿了。

Agent 系统最难解的痛点其实是链路太长、工具太杂、模型太多,状态太乱,当你的后台日志瞬间被成千上万条上下文填满时,它就变成了一个吞噬注意力的垃圾堆。在这种极端高压的认知负荷下,所谓的「实时审计」和「人工控制」全是空谈——你连它在干嘛都看不清,还谈什么安全?



而当一个产品有秩序的美观,用户更容易理解与信任它

这是这群来自高校的「00 后」开发者团队给出的工程答案:它把冰冷的进程变成了像素小镇里「正在上班」的数字员工。经典办公、赛博未来、机械工业、中式宫苑、欧式宫廷五种办公场景,你可以根据心情一键切换场景和BGM 。这种视听层面的用心让每个用户动容,科技的美学消除认知摩擦,降低使用门槛,让工具惠及每一个普通人。



测评 XSafeClaw 的全程小编都在疯狂找彩蛋:脚下是致敬「哈利波特」的「活点地图」轨迹,还有「星露谷」既视感的像素小镇,这个复旦「00 后」团队开发的作品确实有趣,让人上头。



而点进每一个 Agent,原本冰冷的执行链路,在这里第一次像一条可回望的「生命线」。从任务开始的那一刻起,它如何理解指令、如何调用工具、如何一步步接近结果,又是否曾在某个节点偏离轨道、触碰风险边界,这些都被串成了一条清晰可回望的生命线。原本藏在后台的执行过程,在这里第一次有了可被阅读的故事感,这是属于每一个技术爱好者的浪漫。



审美也是生产力,对技术的敬畏和热爱更是弥足珍贵。有温度的界面设计正在拉近人与技术的距离,让新技术更易被理解与接受,一人公司的形态也随之逐渐清晰。

目前,XSafeClaw 已正式开源,支持无脑部署 OpenClaw(也可以自动检测已有龙虾)、灵活配置国内外主流大模型,欢迎广大开发者与企业用户试用体验:

项目网址:

https://xsafeclaw.ai

GitHub:

https://github.com/XSafeAI/XSafeClaw

文中视频链接:https://mp.weixin.qq.com/s/1Dp5uTasxnm3ues_hNPlWQ

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
中美俄英法都在名单里,印媒公开喊话环球时报:凭啥就没有印度?

中美俄英法都在名单里,印媒公开喊话环球时报:凭啥就没有印度?

福建睿平
2026-06-03 08:03:32
男子花15元买彩票,中了6022万元!

男子花15元买彩票,中了6022万元!

深圳晚报
2026-06-03 19:37:04
全是眼泪!《主角》48集大结局:4人下线,忆秦娥丧夫又丧子!

全是眼泪!《主角》48集大结局:4人下线,忆秦娥丧夫又丧子!

阿纂看事
2026-06-03 20:03:25
小米推出米家简约商务双肩包,149元

小米推出米家简约商务双肩包,149元

IT之家
2026-06-03 13:06:21
中国女足1-2遭俄罗斯女足绝杀,王霜世界波难救主

中国女足1-2遭俄罗斯女足绝杀,王霜世界波难救主

懂球帝
2026-06-03 21:36:22
退休国企干部、公职人员起诉离婚,庭审互揭老底牵出巨额财产线索;法院:涉嫌犯罪,移送公安、纪检监察

退休国企干部、公职人员起诉离婚,庭审互揭老底牵出巨额财产线索;法院:涉嫌犯罪,移送公安、纪检监察

大风新闻
2026-06-03 19:48:17
4998 元!iPhone 新机突然上架,价格把有点香啊

4998 元!iPhone 新机突然上架,价格把有点香啊

科技堡垒
2026-06-03 09:58:19
白嫖潮汕火锅失控!多位被坑商家再实锤,警方出手,坐牢只是开始

白嫖潮汕火锅失控!多位被坑商家再实锤,警方出手,坐牢只是开始

奇思妙想草叶君
2026-06-03 17:07:22
一张“走光照”挂在万人直播间67分钟!选手的照片,该如何保护?

一张“走光照”挂在万人直播间67分钟!选手的照片,该如何保护?

马拉松跑步健身
2026-06-03 19:40:53
31条中日航线5月取消全部航班

31条中日航线5月取消全部航班

财联社
2026-06-03 15:56:05
三星已经将HBM芯片,堆叠到了12层,基底采用4nm工艺了

三星已经将HBM芯片,堆叠到了12层,基底采用4nm工艺了

互联网.乱侃秀
2026-06-01 13:31:25
陕西一公司半夜通知“全员放假”,一夜搬空,领导失联,200多名员工数百万工资被拖欠,员工:连维权都不知怎么办

陕西一公司半夜通知“全员放假”,一夜搬空,领导失联,200多名员工数百万工资被拖欠,员工:连维权都不知怎么办

大象新闻
2026-06-03 16:47:13
震惊!女生内裤被退货,商家回复拒绝退款,网友:没穿的为何发黄

震惊!女生内裤被退货,商家回复拒绝退款,网友:没穿的为何发黄

火山詩话
2026-06-03 12:07:04
公安部公布4起污染环境犯罪典型案例

公安部公布4起污染环境犯罪典型案例

界面新闻
2026-06-03 16:38:04
今年高考很平静:只有985、211找得到好工作,其他80%都是销售相关工作

今年高考很平静:只有985、211找得到好工作,其他80%都是销售相关工作

老郭在学习
2026-06-03 13:31:11
哀嚎一片!6月开房率仅14%,海口酒店店家哭诉“一夜无新客上门”

哀嚎一片!6月开房率仅14%,海口酒店店家哭诉“一夜无新客上门”

火山詩话
2026-06-03 10:11:59
傅首尔瘦成瓜子脸上热搜,网友:弥补了瘦人没有傅首尔面相的缺憾

傅首尔瘦成瓜子脸上热搜,网友:弥补了瘦人没有傅首尔面相的缺憾

映射生活的身影
2026-06-03 15:48:06
性资源分配不均带来的性压抑已经变态如斯!

性资源分配不均带来的性压抑已经变态如斯!

黯泉
2026-06-03 21:09:03
官方严厉表态,痛批综艺乱象,刘涛郑恺等8位艺人遭点名批评

官方严厉表态,痛批综艺乱象,刘涛郑恺等8位艺人遭点名批评

一盅情怀
2026-06-03 15:30:26
大冷!世界第一萨巴伦卡1-2连丢十局遭施耐德逆转 无缘法网四强

大冷!世界第一萨巴伦卡1-2连丢十局遭施耐德逆转 无缘法网四强

醉卧浮生
2026-06-03 21:43:18
2026-06-04 00:16:49
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
13159文章数 142660关注度
往期回顾 全部

科技要闻

传DeepSeek融资意向500亿:腾讯投100亿

头条要闻

男子不想上班辞职后上武当山当道士 8个月后选择下山

头条要闻

男子不想上班辞职后上武当山当道士 8个月后选择下山

体育要闻

选择中国品牌的库里,和他们的巨大野心

娱乐要闻

官方痛批乱象 刘涛郑恺等艺人遭点名

财经要闻

AI,开始偷懒了?

汽车要闻

专访蒋平:安全不做高低配 长安要让安全技术普惠

态度原创

手机
数码
家居
本地
公开课

手机要闻

消息称iOS将有类「平行视界」功能,预计专为折叠屏iPhone打造

数码要闻

IDC预测2026年PC出货量下滑11.3% MacBook Neo逆势增长

家居要闻

江畔轻奢 观云大宅

本地新闻

用杨柳青年画的方式,打开天津

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版