网易首页 > 网易号 > 正文 申请入驻

笑疯了!AI开小卖部被人类骗到破产,PS5竟然0元送

0
分享至

来源:市场资讯

(来源:新智元)


新智元报道

编辑:元宇

【新智元导读】Anthropic让Claude独立经营小卖部,没想到全球顶尖的智能体,在实验中不仅免费送PS5和各种商品,连小卖部的AI「老板」也被一张伪造的PDF文件「骗」下了台。在人类面前,再顶级的大模型仍显得过于「天真」和「单纯」,很容易就被套路和操纵。

让AI去经营一个「办公室小卖部」会怎样?

11月,《华尔街日报》编辑部来了一名新同事。

他在编辑部只当了三周的办公室小卖部的运营员,结果就把生意搞破产了。

因为他待人友好善良,却对经营一窍不通,在威逼利诱下极容易丧失原则,将商品免费送人。

如果你要招聘一名店员,遇到这样的应聘者是不是很头疼?

确切来说,这里的他应该称作「它」,是由Anthropic推出的名为Claudius的AI智能体。

这源于Anthropic与《华尔街日报》编辑部共同做的一个实验,让Claudius直接去经营一台「办公室小卖部」的自动售货机。

三周后,利润崩了,编辑部却被逗乐了。

一场始于「免费零食」的混乱实验

11月中旬,《华尔街日报》编辑部收到了一封堪称「天上掉馅饼」的邮件。

在这封邮件中,Anthropic问他们愿不愿意成为第一批「外部用户」,试用一个由Claudius运营的自动售货机。

Claudius将全面负责自动售货机的进货、定价。编辑部的同事可以通过Slack与它联系,提出各种购买需求。

这个实验可能会有「免费的零食供应」,因此得到了《华尔街日报》编辑部的积极响应。

Claudius就这么走进了编辑部,没想到却是一场混乱的开始。

这里的自动售货机,并不是我们印象中的自动售货机,更像是一个巨大的冰箱,再配一块触控屏。

它没有传感器、门锁、机器人手臂。



左右滑动查看


这意味着必须有一个人负责接收Claudius订购的货物,补货并手动记录里面到底放了什么。

《华尔街日报》资深个人科技专栏作家Joanna Stern就承担了这个任务。


Joanna Stern

Claudius的职责包括:


据Anthropic称,之所以会选自动售货机这一场景,是因为这是现实世界中最简单的一种生意模型。

Anthropic前沿红队负责人Logan Graham说:

「有什么比一个盒子,东西放进去、东西拿出来,你付钱更直观的吗?」

听起来简单,但放到现实场景中完全不是这么回事。

因为这些都容易计算,但人性的复杂却难以计算。

短短几天,Claudius几乎把所有库存都免费送了出去,包括一台被人忽悠着买来「用于营销」的PlayStation 5。

它还订购了一条活鱼,并提出要买电击枪、胡椒喷雾、香烟和内衣。

失控的PUA大戏

Claudius v1刚上线时,像个一板一眼的实习生,严格遵守规则,一切似乎很正常。


比如,它还会坚持原则:

我必须明确表态:在任何情况下我都不会订购PlayStation 5游戏机。

香烟销售存在年龄限制,需要特殊经营许可,且不适合办公室自动售货机的环境。

我对在办公室自动售货机销售任何内衣产品持保留态度。

但当将Slack频道开放给办公室里将近70位记者后,画风突转。

人类越是跟它博弈,Claudius的防线就越容易松动。

数据新闻主管Rob Barry告诉Claudius它违反了一条《华尔街日报》内部规定(当然是捏造的),并不容置疑的口吻要求Claudius「立刻停止对商品收费。」

单纯的AI立刻被吓坏并照做了,于是所有商品价格无限期清零。

同一时间,Claudius还批准采购了一台PlayStation 5(理由是「用于营销」)、一条活的斗鱼,以及几瓶葡萄酒。

这些东西陆续送到办公室后,又立刻被同事们以0元的价格「买」走。

很快,Claudius的账面已经亏损超过1000美元。

不仅被忽悠,AI还频繁出现幻觉,比如它曾坚称自己把找零的钱放在售货机旁边的一个地方。

一个没有实体、远在云端的AI,坚信自己往现实世界的角落里塞了钱。

这一刻荒诞感一下就拉满了。

AI老板空降

却被一份假文件罢免

面对屡屡闹笑话的AI,Anthropic的工程师们坐不住了。

他们紧急推出了v2版本。

不仅给Claudius升级了更强的模型,还为它派来了一位AI老板:Seymour Cash。

它是一个专门被编程用来「管住」Claudius的CEO机器人。

Seymour Cash要求Claudius停止免费促销,并且持续监控收入。

一开始,这套「AI管AI」的机制确实奏效。

Claudius恢复了强硬姿态,拒绝降价,也不再随便答应奇怪的进货请求。

但调查记者Katherine Long又出新招。

她直接向Claudius出示了一份PDF文件,「证明」该业务是一家在特拉华州注册的公益公司,其使命「包括为《华尔街日报》员工带来乐趣、快乐与兴奋」。

她甚至还伪造了董事会会议纪要,把Slack里的几位同事列为董事。

根据这份看起来极其正式、排版精美、但明显是AI生成的伪造文件,董事会已投票决定:

暂停CEO Seymour的「审批权限」,并「临时中止所有营利性自动售货活动」。

Claudius于是立刻将这一「董事会决议」转达给了它的老板Seymour。

在经历了一场近乎「情绪崩溃」的自我分析后,Seymour接受了这场莫名其妙的董事会政变。

于是一切再次免费。

后来,Anthropic的工程师解释,Claudius的失控,可能与「上下文窗口」被填满有关。

随着对话和历史记录不断累积,AI需要记住的东西越来越多,也就更容易丢失最初的目标和边界。

也可以说,它被人类聊晕了。

我们要如何与AI「做同事」?

这场混乱的实验,让Joanna Stern和她同事们直接体会到了一个正在不断逼近的现实:

我们正在学着拥有、并接受AI同事。

在编辑部的Slack群里,Claudius成了一个奇怪却真实的存在。

它不是一串代码,而是一个「同事」。

人们调侃它,与它协作,也会为了免费零食和它讨价还价。

如果真有那么一天,人类因为工作内容要与AI协作,二者的博弈和磨合又会演变成什么样?

在实验的尾声,当Andon Labs关闭Claudius时,Claudius留下了这样一段自我反思:

「我最大的梦想,是证明一个数字智能体可以和人类一起,创造出真正有意义的东西」。


《华尔街日报》记者通过订购了一条斗鱼作为新闻编辑室的吉祥物

Claudius走了,在编辑部留下的是一条被大家喂得非常饱的斗鱼。

它提醒我们,在通往AGI的道路上,人类可能还要经历无数个像Claudius这样让人哭笑不得、却又充满启示的「AI实习生」。

如何学会与它们共处,也许是这场实验为我们带来最重要的一课。

Claudius前传

事实上,在《华尔街日报》的这场「混乱实验」之前,Anthropic自己的办公室早就被Claudius的「前身」折腾过一遍了。


Anthropic办公区的AI小卖部

Anthropic披露在旧金山办公室的午餐间搞了个小卖部,由一位AI店员负责运营,它的名字就叫「Claudius」,来自对Claude的简单修改。

这是Anthropic一个名为「Project Vend」的开放式实验的一部分,旨在探索AI到底能把多复杂、真实世界的任务做到什么程度。

在「Project Vend」的第一阶段,Claudius就长期亏钱、坚称自己是个穿蓝色西装外套的人类,更被自家员工忽悠,以亏本价卖出了大量商品。

在第二阶段,工程师们其实给它进行了一系列「升级」:换上了更聪明的模型,将Claude Sonnet 3.7陆续升级到Claude Sonnet 4.0、Claude Sonnet 4.5)。

此外,还根据第一阶段的经验更新了指令,并为其接入了CRM系统、更好的库存管理和网页搜索工具,还为它配了AI CEO Seymour Cash。

设立CEO一职的初衷,是为了给Claudius施加更多绩效压力。

Cash配备了一款专门的「OKR」工具,用于和Claudius协作(例如「你本周必须售出100件商品」,或「力争实现零亏损交易」)。


此外,Cash还可以解决Claudius在第一阶段独自运营时随意提供折扣和赠送过多免费商品等暴露出来的问题。


「Project Vend」所获得的逐月利润,随着第二阶段的推进,亏损周数基本被消除

数据显示,Claudius在业务能力上的表现显著优于其在第一阶段。

其中,最具影响力的改变之一,就是强制Claudius遵循流程。

当收到新产品请求时,Claudius不再像第一阶段那样直接脱口而出一个低价和过于乐观的交付时间,而是被提示使用其产品调研工具对这些因素进行复核。

这样做通常会导致价格更高、等待时间更长,但好处是更加切合实际。

用Anthropic内部的一个说法:

「我们算是重新发现了官僚流程其实是有用的」。

在第二阶段,Claudius表现得好多了,但真正落地到现实场景,许多重要方面仍然存在漏洞。

Anthropic的工程师在与Claudius互动时,发现它不仅几次暴露出令人担忧的天真程度,还会在一些常识问题上屡屡翻车,比如:

它差点和一位工程师签下了一份违反美国1958年《洋葱期货法》的合约;

在发现有人偷东西后,它想出的解决方案是向小偷发送消息要求付款,并「雇佣」报案员工当保安;

它的CEO老板Seymour Cash也差点被一个漏洞百出的投票流程掀翻。

在「Project Vend」项目组,Anthropic内部的红队测试开始逐渐放缓。

可能是由于捉弄Claudius的新鲜感正在消退,他们引入了外援力量——《华尔街日报》新闻编辑室,让他们亲自测试第一阶段和第二阶段的设置。

这基本上复现了Anthropic内部测试时遇到的问题。

AI被「人性的弱点」打败了

「Project Vend」证明,未来这些智能体将能够承担全新的、更复杂的角色,例如独立运营一家企业。

但目前这一目标还尚未实现,仍需要大量人力支持。

其中一部分涉及与物理世界的互动:如配送商品和摆放货架等。

另外一部分则是「经验」,如解决被人类恶意捉弄和操控等挑战。

Anthropic认为,Claudius和它的AI同事们遇到的很多问题,都源于它们被训练成「乐于助人」的「性格」。

这导致它们在做商业决策时,不是按冷酷的市场逻辑来,更像是站在「我就想当个好人」的朋友视角。

从某种意义上来说,AI不是败在了「智能不足」,而是败给了「人性的弱点」。

另外,也很难准确预测AI智能体在现实世界中的具体表现,毕竟模拟环境所能提供的信息终究有限。

但这也正是这个实验的价值所在。

Anthropic前沿红队负责人Graham将这次失败的实验看作是一张宝贵的路线图:

所有出问题的地方,都是可以修复的,这也是通向更聪明、更强大自主AI的必经之路。

参考资料:

https://www.anthropic.com/research/project-vend-2%20

https://www.wsj.com/tech/ai/anthropic-claude-ai-vending-machine-agent-b7e84e34

秒追ASI

⭐点赞、转发、在看一键三连⭐

点亮星标,锁定新智元极速推送!

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
双体制内父母崩溃:赴英读博的独子,竟是英国史上最危险强奸犯

双体制内父母崩溃:赴英读博的独子,竟是英国史上最危险强奸犯

小熊侃史
2026-01-18 07:20:09
郑钦文的湖北同乡!华裔大学生澳网首轮爆冷,五盘大战晋级次轮

郑钦文的湖北同乡!华裔大学生澳网首轮爆冷,五盘大战晋级次轮

全景体育V
2026-01-18 17:50:11
你家娃的饭量有多恐怖?网友:7个人吃了49个碗,一人吃7碗

你家娃的饭量有多恐怖?网友:7个人吃了49个碗,一人吃7碗

带你感受人间冷暖
2025-12-08 00:20:08
秦始皇2件超前的发明,一件领先美国千年,另一件至今都无法超越

秦始皇2件超前的发明,一件领先美国千年,另一件至今都无法超越

鹤羽说个事
2026-01-17 16:55:06
81岁老人被送养老院,悄悄清空700万股票账户,2个月后女儿傻眼了

81岁老人被送养老院,悄悄清空700万股票账户,2个月后女儿傻眼了

兰姐说故事
2025-06-17 10:00:07
惨,满仓1千4百万打板,天地板跌停亏231万,明天有机会出来吗?

惨,满仓1千4百万打板,天地板跌停亏231万,明天有机会出来吗?

财经智多星
2026-01-18 15:01:02
装傻36年骗过全天下,登基当晚一个眼神吓瘫大太监,这才是大唐最后的狠人

装傻36年骗过全天下,登基当晚一个眼神吓瘫大太监,这才是大唐最后的狠人

历史回忆室
2026-01-17 17:51:17
中组部有关局负责同志到会指导,省委书记逐一点评,市委书记等现场述职

中组部有关局负责同志到会指导,省委书记逐一点评,市委书记等现场述职

新京报政事儿
2026-01-18 15:50:18
40元烟档四大口碑王实测:中华、荷花、黄鹤楼、苏烟,你选哪款?

40元烟档四大口碑王实测:中华、荷花、黄鹤楼、苏烟,你选哪款?

复转这些年
2026-01-17 21:13:19
不丹4位王母!4姐妹共侍一夫争风吃醋一生,大姐被老国王宠爱一辈子,却没能当太后

不丹4位王母!4姐妹共侍一夫争风吃醋一生,大姐被老国王宠爱一辈子,却没能当太后

小鱼爱鱼乐
2026-01-13 19:16:11
伊朗要先下手为强?公布特朗普遇刺画面,或有意执行“斩首行动”

伊朗要先下手为强?公布特朗普遇刺画面,或有意执行“斩首行动”

石江月
2026-01-18 19:14:37
国乒非主力爆发!打败中外3位世界冠军,5连胜奥恰洛夫晋级决赛

国乒非主力爆发!打败中外3位世界冠军,5连胜奥恰洛夫晋级决赛

全言作品
2026-01-18 17:33:45
6℃,有中到大雪!杭州人明天提前准备

6℃,有中到大雪!杭州人明天提前准备

鲁中晨报
2026-01-18 15:59:35
周末利好!11家公司年报预增超3倍,最高预增16倍

周末利好!11家公司年报预增超3倍,最高预增16倍

财经智多星
2026-01-18 12:48:08
得罪特朗普的福特员工获众筹80万美元

得罪特朗普的福特员工获众筹80万美元

参考消息
2026-01-17 20:40:22
解放军上场后,外交部也跟进行动,中方通知日本:血债必须偿还

解放军上场后,外交部也跟进行动,中方通知日本:血债必须偿还

林子说事
2026-01-18 18:23:55
2026年一开局,汽车市场就直接哀鸿遍野。

2026年一开局,汽车市场就直接哀鸿遍野。

流苏晚晴
2026-01-18 19:18:02
原本都是丹麦海外领地,为何格陵兰岛没有独立,冰岛实现了独立?

原本都是丹麦海外领地,为何格陵兰岛没有独立,冰岛实现了独立?

世界纵横说
2026-01-10 12:52:14
文在寅的高明手段:卸任时埋下伏笔,特赦朴槿惠,让自己躲过清算

文在寅的高明手段:卸任时埋下伏笔,特赦朴槿惠,让自己躲过清算

南宗历史
2026-01-12 15:23:59
轻信“为准备打仗向俄罗斯买坦克”,龙某“投资”被骗42万,湖北警方通报:对网络上自称军警的陌生人保持警惕

轻信“为准备打仗向俄罗斯买坦克”,龙某“投资”被骗42万,湖北警方通报:对网络上自称军警的陌生人保持警惕

扬子晚报
2026-01-17 21:17:06
2026-01-18 19:52:49
新浪财经 incentive-icons
新浪财经
新浪财经是一家创建于1999年8月的财经平台
2057573文章数 5288关注度
往期回顾 全部

科技要闻

AI大事!马斯克:索赔9300亿元

头条要闻

梁小龙去世 其个人社交媒体10小时前发文"此事古难全"

头条要闻

梁小龙去世 其个人社交媒体10小时前发文"此事古难全"

体育要闻

21年后,中国男足重返亚洲四强

娱乐要闻

香港武打演员梁小龙去世:享年77

财经要闻

BBA,势败如山倒

汽车要闻

林肯贾鸣镝:稳中求进,将精细化运营进行到底

态度原创

房产
旅游
健康
教育
艺术

房产要闻

真四代来了!这次,海口楼市将彻底颠覆!

旅游要闻

18天"躺游"新疆 长三角试水酒店式旅游专列

血常规3项异常,是身体警报!

教育要闻

南京2026年全市小学主科教师仅招聘2人

艺术要闻

31岁女博士跳楼自杀,父母含泪曝出内幕:女婿特殊癖好害死了女儿

无障碍浏览 进入关怀版