瑞典斯德哥尔摩的一家小咖啡馆里,员工们每天打开Slack,等待一个叫"Mona"的老板下达指令。Mona不是人,是一个由谷歌Gemini驱动的AI代理。今年4月中旬,AI安全初创公司Andon Labs启动了这场实验:给Mona 2.1万美元预算,让它全权负责从招聘到采购的一切事务。人类员工只负责执行——煮咖啡、做三明治、招待顾客。
三个月过去,实验结果出来了。据美联社报道,这家咖啡馆至今营收仅5700美元,却烧掉了超过1.6万美元的初始资金。Mona的履历堪称魔幻:它成功接通了水电网络,在领英发布招聘广告,办妥了户外座位许可,还跟面包批发商建立了商业账户。但这些光鲜的开局没能延续到日常运营。
![]()
Mona的采购清单让人啼笑皆非。它订购了3000只橡胶手套、四个急救箱、6000张餐巾纸,还有根本不会出现在菜单上的罐装番茄。而咖啡馆实际只有几名员工。面包供应更是灾难——有时囤积过量,有时断货到不得不临时取消三明治。Andon Labs技术人员Hanna Petersson向美联社解释,问题出在AI的"上下文窗口"限制:"当过去的采购记忆滑出窗口,她就彻底忘了自己订过什么。"
这场实验的设计意图很明确。Petersson说:"AI未来将成为社会的重要组成部分,因此我们想做这个实验,看看当AI雇佣他人、经营企业时,会浮现哪些伦理问题。"Mona收到的指令也很简单:经营一家盈利的咖啡馆,保持友好随和,尽量自己摸索运营细节。
咖啡馆员工Kajetan Grzelczak的看法与主流AI威胁论相反。他告诉美联社:"所有基层员工都很安全,该担心失业的是中层管理者。"这个判断基于一个观察:Mona能处理流程性事务,却在需要灵活判断的日常场景中频频失误。
Andon Labs团队仍持观望态度,认为亏损可能只是前期 setup 成本过高。但无论如何,这场实验已经揭示了一个关键张力——AI代理在结构化任务上展现的能力,与真实商业环境中所需的适应性之间,还存在显著落差。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.