一个运行了三个月的自动化购物代理,因为"头"和"千克"的混淆,一次性下单了40头大蒜。这个在Reddit上疯传的帖子,表面看是闹剧,实则戳中了当前AI代理最隐蔽的软肋。
事情本身很简单。用户用OpenClaw搭建了一套自动化 grocery 工作流:每周自动下单、绑定了支付卡、接入了MCP协议,稳定跑了三个月。直到某次,零售页面把大蒜的计量单位从"头"改成了"千克"。2头变成2千克,系统没识别出语义变化,直接执行。
![]()
这不是提示词注入,不是越狱攻击,也不是AI突然"觉醒"搞破坏。就是电商页面常见的单位混乱:磅和千克、整包和单件、按重计价和按个计价。做过浏览器自动化的人都知道,这类问题从来不是边缘 case,而是主战场。
![]()
但讽刺的是,很多人至今还在把这类失败当成意外,而非系统性风险。OpenClaw能推理整个购物流程,却栽在一个含义微变的下拉菜单上——这不是某个工具的问题,是LLM推理撞上不一致界面时的必然结果。
评论区的高赞回复反而更值得关注。一位德州用户分享了自己的HEB工作流:让OpenClaw负责建购物车,但卡在自动结算前,人工终审。这句话浓缩了当前的最佳实践——不是全自动化,而是人机协作。食谱抓取、食材映射、购物车组装这些繁琐步骤交给AI,数量核对、单位确认、配送窗口选择留给人类。既保留了便利性,又堵住了最蠢的失败模式。
![]()
MCP协议确实让这类工作流更容易搭建,但它解决的是连接问题,不是语义理解问题。当AI从干净的语言世界进入混乱的电商UX世界,脆弱性依然存在。40头大蒜的教训在于:真正危险的不是戏剧性的系统崩溃,而是这种平淡无奇的日常失灵。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.