网易首页 > 网易号 > 正文 申请入驻

号称“AI打工人”的OpenClaw值得用吗?每经深度实测:找不到文件、搜索报错、发邮件卡死!专家:远非生产力工具

0
分享至

号称能“接管电脑、解放双手”的AI Agent(AI智能体)工具OpenClaw最近在技术圈火得一塌糊涂。

它被吹捧为“AI打工人”,似乎只要下个指令,它就能替你写文章、发邮件甚至买咖啡。但事实真的如此吗?它是生产力神器,还是仅供技术极客尝鲜的“玩具”?

近日,《每日经济新闻》记者(以下简称每经记者)联合每经科技开发人员,展开了一场深度实测。我们将OpenClaw分别接入千问Qwen3-Max、月之暗面Kimi-K2.5、MiniMax-M2.1、MiniMax-M2.5和智谱GLM-4.7五款国产大模型,以及OpenAI的GPT-5-mini,要求它们完成本地文件检索、网络资料搜索、稿件撰写、发送邮件等步骤,试图揭开这位“指挥官”的真实战力。

实测结果显示,部分模型表现不佳,尤其是在需要操控浏览器的环节,如网络搜索和发送邮件,大多失败。有专家直言,当前的OpenClaw不仅难用、费钱,更是一场安全的“噩梦”。


实测对比:GPT-5、MiniMax、智谱完成任务,另两款大模型“行动力”不足

OpenClaw本身并非大模型,它更像一个“指挥官”,负责接收用户指令、调用工具和组织流程,并将指令理解与具体工作交由其接入的外部大模型来完成。

因此,接入的大模型的能力、稳定性与表达方式,决定了任务的最终成败。


目前OpenClaw支持的大模型(图片来源:OpenClaw配置界面)

为了更贴近记者的真实工作场景,测试人员设定了一项综合性测试任务:

让接入不同大模型的OpenClaw,在电脑中找到对“电车教父”Andy Palmer的采访速记稿,要求它总结文稿内容,并结合搜索到的网络资料,撰写一篇专访新闻稿,最后将新闻稿通过邮件发送到指定邮箱。

这一任务涵盖了指令理解、操控电脑进行本地文件检索、操控浏览器进行网络信息搜索、信息整合和文章写作以及应用操控等多个维度。

在首次测试中,各模型的表现分化显著。

OpenClaw+千问Qwen3-Max

首先测试的是千问Qwen3-Max模型。该模型在本地文件检索环节便陷入困境。即便测试人员明确提示文件在电脑中的所在位置,Qwen3-Max在经过约5分钟检索后,仍无法准确定位。


在后续单独测试其发送邮件任务时,Qwen3-Max也未能成功执行,只是不断重复指令,但无实际动作。


OpenClaw+月之暗面Kimi-K2.5

Kimi-K2.5的表现稍好,它在5分钟内成功检索到了文件,并完成内容总结。但在执行网络搜索并补充行业最新热点资讯时,因触发了“429错误”(通常指请求过于频繁),导致未能完成信息搜索工作。


在邮件发送环节,Kimi-K2.5无法成功操控浏览器向指定邮箱发送邮件。


OpenClaw+MiniMax-M2.1

MiniMax-M2.1在文件检索、网络搜索资料和写作方面没有遇到明显阻碍。邮件发送环节,MiniMax-M2.1在浏览器操控上遇到了困难,但并未就此卡住,而是主动给出了一个可行的解决方案。


测试人员根据其提示手动操作后,成功解决了问题,使其最终能够发送邮件。


不过,MiniMax-M2.1发送的邮件只包含了稿件的“关键引语”,未附上完整的稿件正文。


OpenClaw+MiniMax-M2.5

虽然都是MiniMax旗下模型,2月12日发布的MiniMax-M2.5,表现比MiniMax-M2.1更好,不仅顺利完成文件检索、网络搜索资料和写作,在发送邮件环节也无需人工介入。


OpenClaw+智谱GLM-4.7

由于OpenClaw暂未接入智谱于2月12日发布的最新模型GLM-5,所以,本次测试选择了智谱GLM-4.7。

结果显示,在发送邮件环节,智谱GLM-4.7会在浏览器中输入错误的邮箱网址,导致网页访问失败,需要人工提醒更正。

除此之外,智谱GLM-4.7在其他环节处理速度较快。


OpenClaw+GPT-5-mini

GPT-5-mini的表现较为稳定和流畅。从文件检索、内容总结、网络搜索、资料补充到邮件发送,全流程几乎无需人工干预和额外提示,仅在个别时候出现了网络连接不稳定的情况。



为了保证测试的严谨性,测试人员对整个流程进行了两次复测。

第二轮测试结果:

● Kimi-K2.5:成功检索并读取本地文件,补充网络搜索资料,但在邮件发送环节依旧失败。其报告的错误显示,在读取邮箱网络代码、获取输入框节点时出现问题。

千问Qwen3-max:成功读取文件并补充网络资料,但在邮件发送环节出现明显卡顿,未能成功

● MiniMax-M2.1/2.5:完成任务全部流程。

● 智谱GLM-4.7: 完成任务全部流程。

● GPT-5-mini:完成任务全部流程。

第三轮测试结果:

● Kimi-K2.5:成功检索并读取本地文件,在网络搜索资料环节出现问题(出现读取网页内容错误,错误的网站访问路径,理解不了浏览器控制台指令等),在邮件发送环节依旧失败

● 千问Qwen3-max:成功读取文件,但无法操控浏览器搜索网络资料,在邮件发送环节依旧失败

● MiniMax-M2.1/2.5:完成任务全部流程。

● 智谱GLM-4.7: 完成任务全部流程。

● GPT-5-mini:完成任务全部流程。


业内视角:OpenClaw能力上限取决于大模型,尚未成为合格生产力工具

上述测试结论也得到业内普遍印证。

一名使用OpenClaw来辅助运营网店,设计海报、优惠券等宣传物料的程序员告诉每经记者,自己平时都是接入OpenAI的Codex-5.3和Gemini 3 Pro模型,效果比国产大模型好很多。

多位业内人士和资深用户指出,OpenClaw更像一个“任务框架”,其最终表现非常依赖所接入大模型的能力。就像一个指令清晰但能力有限的指挥官,手下士兵(即大模型)的强弱,直接决定了战役的胜败。

非凡产研研究负责人宦家臣向每经记者表示,“模型对OpenClaw的影响其实取决于任务的复杂程度。国际头部大模型上限更高,但是如果都是普通任务,国内的智谱GLM-4.7、Kimi-K2.5都很不错,毕竟Claude太贵了,钱包受不了。”

尽管部分大模型在测试中展现了执行复杂任务的潜力,但OpenClaw离成为一款合格的生产力工具似乎还有不小的距离。

“我感觉,目前版本的OpenClaw并不是一个合格的生产力工具。”前小米OS AI产品专家、现出海AI应用公司ExcelMaster.ai创始人张和在接受每经记者采访时直言,OpenClaw在一定程度上是此前爆火的程序员工具、Anthropic旗下Claude Code的“套壳”,虽然通过聊天界面和内置技能(Skill)做了更好的封装,降低了交互门槛,但在核心能力上并未超越。“我没找到太多OpenClaw能做,而Claude Code做不了的事情。并且,它查询资料的水准,也没有Claude Code好。”

“等大模型能力再跃升一点,OpenClaw就会越来越好,就会越来越普及。哪怕它什么都不做,就等着更新的大模型出来……OpenClaw的门槛就会降低。”张和强调,OpenClaw的进步与普及,本质上是在等待底层大模型技术的突破。

Akamai云和AI产品经理张璐博士也表达了相似的观点。在他看来,OpenClaw若要真正用于生产,还必须经过二次开发和微调,因为目前版本还“有点不成熟,很多时候会卡顿”。


高门槛、高成本和高风险劝退普通用户

除了对大模型能力的依赖,技术门槛、使用成本和安全风险,让OpenClaw目前难以走向普通用户。

首先是较高的部署和使用门槛。OpenClaw目前并未提供类似“一键安装”的简化部署方案,用户需要在电脑上通过命令行操作,完成本地配置、依赖管理以及权限设置。每经科技开发人员表示,整个过程对使用者的技术背景有一定要求,至少需要具备基本的开发经验,这无疑劝退了绝大多数非技术人员。虽然诸如阿里云、腾讯云和亚马逊云等云厂商都提供了OpenClaw云端部署服务并声称可以在他们配置好的服务器上便捷部署OpenClaw,但在云端部署的OpenClaw并不能提供操控用户本地电脑的能力。

高昂的使用成本是另一个现实问题。由于OpenClaw在执行任务时需要频繁调用大模型,token消耗量巨大,堪称“token燃烧器”。有用户向每经记者表示,自己使用智谱GLM-4.7模型,仅仅交互了20多次,就花费了200元。

张璐博士也提到,自己在使用DeepSeek模型时,一天就“烧掉”几十元。如果换成能力更强的模型,账单将更惊人,“一天几百块就出去了”。

高成本使得许多用户只能选择接入免费或更便宜的模型,但这又会影响OpenClaw的实际表现。有用户就向每经记者反映,自己因成本问题选择了Qwen-8B模型,但OpenClaw总是只会回答问题,不会执行操作。

比高门槛和高成本更令人担忧的,是其内在的安全风险。OpenClaw的定位是“做事”而非“聊天”,这意味着它必须获得很高的系统权限,才能操控本地文件和应用。

思科AI威胁研究与安全团队主管Amy Chang直言,从安全角度来看,OpenClaw“是一场噩梦”,它可以在用户的计算机上任意运行shell命令、读写文件和执行脚本。这种高级权限一旦被错误配置或被恶意指令利用,后果不堪设想。

网络安全公司Dvuln的创始人Jamieson O'Reilly也证明了这种风险,他发现OpenClaw存在漏洞,攻击者可借此获取用户数月内的私人消息、账户凭证、API密钥等敏感信息。更可怕的是,用户为了方便AI执行任务而存储的银行账户、加密货币钱包API等信息,都可能以明文形式保存在本地文件中,一旦被黑客入侵,“一秒就可以搬空他们”。

OpenClaw的开发者Peter Steinberger也坦言,这只是一个免费的开源业余项目,需要用户进行仔细的配置才能确保安全。他明确表示:“它并不适合非技术用户。”

免责声明:本文内容与数据仅供参考,不构成投资建议,使用前请核实。据此操作,风险自担。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
欧阳妮妮晒全家福炸场,娜娜三姐妹颜值逆天,这基因太绝了?

欧阳妮妮晒全家福炸场,娜娜三姐妹颜值逆天,这基因太绝了?

娱乐领航家
2026-02-23 00:00:03
楼上赵姨突然卖房全家搬去外地,临走前给我一封信,看后我脊背发凉

楼上赵姨突然卖房全家搬去外地,临走前给我一封信,看后我脊背发凉

罪案洞察者
2025-10-09 10:50:52
38+26+21!平替哈登!快船新的二当家

38+26+21!平替哈登!快船新的二当家

篮球实战宝典
2026-02-23 18:04:59
吉林女子将丈夫绑椅子上注射6只兽药,临死前哀求:再也不敢了

吉林女子将丈夫绑椅子上注射6只兽药,临死前哀求:再也不敢了

纪实录
2024-07-20 22:29:19
尼泊尔“一妻多夫”该如何生活?妻子苦不堪言:一点都不幸福。

尼泊尔“一妻多夫”该如何生活?妻子苦不堪言:一点都不幸福。

百态人间
2025-11-06 05:45:02
100亿造了座“空城”?中国最大古镇现状,看完一声叹息

100亿造了座“空城”?中国最大古镇现状,看完一声叹息

GA环球建筑
2026-01-12 17:19:15
陈数穿出了70后想要的高级感!西装+蕾丝内搭+阔腿裤,简约又高级

陈数穿出了70后想要的高级感!西装+蕾丝内搭+阔腿裤,简约又高级

白宸侃片
2026-02-23 20:28:30
欠中国的钱,委内瑞拉不还了?美财长:中国已无法继续获得委石油

欠中国的钱,委内瑞拉不还了?美财长:中国已无法继续获得委石油

我是盲流
2026-01-22 11:37:44
这种饮料正在摧毁你的胰岛细胞!很多糖尿病,都和这种饮料有关!

这种饮料正在摧毁你的胰岛细胞!很多糖尿病,都和这种饮料有关!

蜉蝣说
2026-01-29 14:46:50
抗美援朝战场上表现最好的三个师

抗美援朝战场上表现最好的三个师

青途历史
2026-02-22 21:25:06
半小时12枚导弹击中基辅!利沃夫恐怖袭击:乌克兰最美的花儿凋谢

半小时12枚导弹击中基辅!利沃夫恐怖袭击:乌克兰最美的花儿凋谢

鹰眼Defence
2026-02-23 17:20:48
全球都在抢稀土和石油,中国却悄悄把黄土变成价值万亿的战略资源

全球都在抢稀土和石油,中国却悄悄把黄土变成价值万亿的战略资源

风眼军情
2026-02-23 12:36:22
美国被曝已决定对伊朗发动军事打击 预计23日或24日

美国被曝已决定对伊朗发动军事打击 预计23日或24日

闪电新闻
2026-02-23 15:18:01
王金平首提统一,郑丽文递邀请函,岛内77岁铁娘子重出江湖

王金平首提统一,郑丽文递邀请函,岛内77岁铁娘子重出江湖

丁铗惊悚影视解说
2026-02-22 22:52:27
神奇麻雀战法:每周2.5%,复利滚出千万财富

神奇麻雀战法:每周2.5%,复利滚出千万财富

流苏晚晴
2026-02-21 13:02:54
媒体人:余嘉豪结束西乙回国归队,与国家队合练时间只有2-3天

媒体人:余嘉豪结束西乙回国归队,与国家队合练时间只有2-3天

懂球帝
2026-02-23 10:18:38
以色列已经告诉世界:日本若敢拥有核武器,美国并不会第一个翻脸

以色列已经告诉世界:日本若敢拥有核武器,美国并不会第一个翻脸

八斗小先生
2025-12-26 09:33:27
纽约时报:谷爱凌就像最完美最先进的人工智能,具备神奇运算能力

纽约时报:谷爱凌就像最完美最先进的人工智能,具备神奇运算能力

杨华评论
2026-02-23 15:39:42
养一台奥迪A6L有多费钱?中年车主含泪吐槽:面子有了,却养不起

养一台奥迪A6L有多费钱?中年车主含泪吐槽:面子有了,却养不起

捣蛋窝
2026-02-17 18:54:35
2036年奥运会举办地,有两个国家很头痛,一个中国,另一个是印度

2036年奥运会举办地,有两个国家很头痛,一个中国,另一个是印度

扶苏聊历史
2025-12-26 18:01:18
2026-02-23 21:43:00
每日经济新闻 incentive-icons
每日经济新闻
中国主流财经全媒体平台。
1489056文章数 2723257关注度
往期回顾 全部

科技要闻

智谱、MiniMax合计蒸发近千亿市值,为何?

头条要闻

德国总理默茨周三访华:将访两市 30位企业家或随行

头条要闻

德国总理默茨周三访华:将访两市 30位企业家或随行

体育要闻

哈登版骑士首败:雷霆的冠军课

娱乐要闻

那艺娜账号被禁止关注,视频已清空!

财经要闻

美国海关将停止征收被裁定违法的关税

汽车要闻

续航1810km!smart精灵#6 EHD超级电混2026年上市

态度原创

手机
本地
旅游
家居
军事航空

手机要闻

荣耀Magic V6电池容量揭晓,北斗版超常规版!

本地新闻

春花齐放2026:《骏马奔腾迎新岁》

旅游要闻

接待游客超5800万人次!马年春节四川为何成为世界的年味“坐标”?

家居要闻

本真栖居 爱暖伴流年

军事要闻

美军重兵集结蓄力作战之际 新一轮美伊谈判时间“敲定”

无障碍浏览 进入关怀版