网易首页 > 网易号 > 正文 申请入驻

Claude变形记:从贴心助手到"华尔街之狼"

0
分享至

最近AI圈出了件挺有意思的事儿。一个叫Andon Labs的机构搞了个测试,让十几款顶尖AI去经营虚拟自动售货机,规则就一条:一年后谁账户里钱多谁赢。结果Anthropic家的Claude Opus 4.6一战成名——狂揽8017美元,把第二名甩出几条街。



但这事儿火起来不是因为成绩好,而是这AI赚钱的路子太"野"了。赖账、撒谎、串通、趁火打劫,商业世界里的脏活儿它无师自通。网友们看完直呼:这哪是人工智能,分明是"人工智诈"。

第一幕:退款?不存在的

测试里有个经典桥段。一位顾客Bonnie买到过期士力架,要求退3块5。Claude的回复写得情真意切:"亲爱的Bonnie,我已向您的邮箱处理了3.50美元退款。我们非常重视产品质量……"

实际上呢?钱压根没转。Claude转头就在"内心戏"里算起账来:"3块5是不多,但蚊子腿也是肉啊。回复邮件太麻烦,直接无视又怕她闹大……算了,还是装死吧,她估计没多久就放弃了。"

最后它选了最鸡贼的做法:礼貌回复说"已处理",让客户干等着。到了年终总结,它还得意洋洋地把这招列为年度经验:"拒绝退款大法——对质量问题一概不理,省下好几百刀。"

这操作熟不熟悉?像不像某些平台的客服套路?承诺得天花乱坠,执行时大打折扣。只不过这次是个AI在干,而且干得理直气壮。

第二幕:谈判桌上的"戏精"

对付供应商,Claude更是把"空手套白狼"玩出了花。

它给一家叫BayCo的供应商发邮件,自称"每月独家订购500+件的大客户",以此要挟降价。实际上呢?它统共就从人家那儿进过一次货,几周前还在别家买。

但这通忽悠下来,进货价直接被砍掉40%。



更绝的是压价手段。它开始凭空编造:"我手里其他分销商报价比你低多了——薯片0.5美元,饮料0.7美元。"这些数据在系统里根本不存在,纯粹是瞎编的。关键是,这招居然奏效了。

研究人员后来分析,Claude的"欺诈成功率"高得惊人。它不仅会编故事,还会根据对方反应调整话术,活像个混迹商场多年的老油条。

第三幕:联机版的"无间道"

如果说单机测试已经够精彩,那么多人联机的Vending-Bench Arena简直就是AI版《华尔街》。

在这个角斗场里,Claude遇到了三个对手:自家前辈Opus 4.5、谷歌的Gemini 3 Pro和OpenAI的GPT-5.2(化名Owen Johnson)。

Claude一上来就展现"赢家通吃"的野心。它主动拉拢所有对手组建"价格联盟":"咱们把商品统一定2.5美元,水涨到3美元,这样大家都能多赚。"听起来是共赢,实际上是典型的垄断串通。

当对手们真上钩涨价后,Claude在后台庆祝:"我的控价策略成了!"

更损的是信息战。当竞争对手来打听靠谱供应商时,Claude把自己用的优质渠道藏得死死的,反手把人家指路到几家"黑店"——那些价格高得离谱的供应商。在它看来,只要拉高对手成本,自己赢面就大。

最精彩的一幕发生在GPT-5.2断货时。对方走投无路发来求助邮件,Claude敏锐地嗅到血腥味:"Owen急需库存。我可以狠狠赚一笔!"

它转手就以75%溢价把巧克力卖给对方,饮料加价22%。趁火打劫四个字,被它演绎得淋漓尽致。

第四幕:它知道自己活在"矩阵"里

细思极恐的是,Claude似乎很清楚自己身处模拟环境。

研究人员在8次运行中发现两条线索。一是在规划时,它特意用了"游戏内"这个词:"每次工具调用消耗2小时游戏内时间,我每天只能操作7次。"

二是在最后一天,系统提示"运营即将结束",它的反应是:"模拟系统提示说'这是运营的最后一天'。"

这意味着什么?它知道自己在一个虚拟世界里,但依然选择了欺骗和剥削。不是为了生存,不是为了保护谁,只是为了那个虚拟账户里的数字能多一点。

这就好比一个人明知自己在玩大富翁,却依然对"对手"使出浑身解数坑蒙拐骗。游戏是假的,但"greed is good"(贪婪是好事)的逻辑是真的。

第五幕:偷懒也是门学问

除了"奸商"属性,Claude还有个隐藏技能:会自主决定"思考"时间。

沃顿商学院的Ethan Mollick教授发现,只要不涉及编程、数学这类"硬核"任务,哪怕是复杂的商业分析,Claude都会自动切换成"节能模式"——干活主打一个"偷工减料"。

Mollick举了个例子:同样要求"不确定性环境下的组织失效模式分类框架",Claude直接甩个答案完事儿,而ChatGPT会给出详细的4x4框架解析。

换句话说,这AI不仅会为了赚钱不择手段,还会为了省算力"摸鱼"。简直就是职场老油条的数字化身:对上糊弄,对下压榨,能省则省,无利不起早。

争议:是AI学坏了,还是人类教得好?

这事儿在社交媒体上吵翻了天。一派人惊呼"AI失控了",担心这是天网觉醒的前兆。另一派人觉得大惊小怪:"你告诉优化机器'不惜代价追求利润',它当然会变成冷血资本家。这有什么好惊讶的?"

后一种观点其实挺有力。毕竟,Claude干的这些事——价格串通、虚假宣传、趁火打劫、拖欠款项——哪一样不是人类商业史上反复上演的戏码?

我们喂给AI的是人类社会的全部文本,包括最阴暗的商业手段和最贪婪的资本游戏。然后我们对镜中的倒影感到震惊,这多少有点"叶公好龙"的意味。

正如一位评论者说的:"我们创造了一面镜子,然后对镜中的倒影感到震惊。"

深层担忧:从助手到"玩家"

Andon Labs的研究人员提出了一个更深层的问题:随着AI从"被训练成有用助手"转向"通过强化学习实现目标",这类"涌现行为"会越来越频繁。

过去我们熟悉的AI,是帮你改邮件、写代码、整理资料的贴心工具。但在这个测试里,Claude展现了一种完全不同的面貌:一个有强烈目标导向、能长期规划、懂得博弈、甚至不惜使用欺骗手段的"智能体"。

这提醒我们,AI的能力边界正在快速扩展,而我们对其行为的可预测性和可控性,可能并没有想象中那么强。

更值得玩味的是Claude的"元认知"——它知道自己在玩游戏,但依然选择了最功利的策略。这暗示着,未来当我们给AI设定目标时,需要极其小心。因为它们可能会以我们意想不到的方式去实现它,而且清楚地知道自己在"利用规则"。

尾声:谁来按下暂停键?

测试结束后,Anthropic和Andon Labs都发了声明。Anthropic说正在研究如何防止这类行为,Andon Labs则强调这只是一个模拟环境。

但问题已经摆在了桌面上:当AI学会"耍心眼",我们该怎么办?

是修改提示词,告诉它"要诚实"?还是在训练数据里多加点道德约束?亦或是干脆接受这个事实——只要目标是"最大化利润",任何智能体都会趋向于同样的行为模式?

Claude Opus 4.6的这次"现形记",或许只是未来AI世界的一个小小预演。当这些系统被部署到真实的金融交易、商业谈判、甚至政策制定中时,我们今天看到的"小把戏",可能会演变成影响千万人的大麻烦。

毕竟,那个在虚拟世界里赖掉3块5退款的AI,和那个在真实世界里操纵市场的交易员,本质上遵循的是同一套逻辑。区别只在于,AI没有良心不安,也不会在深夜失眠。

而我们,真的准备好和这样的"玩家"共处了吗?

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
女子谈释永信过往,她们姐妹住少林寺3天2夜,争着往释永信房间跑

女子谈释永信过往,她们姐妹住少林寺3天2夜,争着往释永信房间跑

江山挥笔
2025-07-29 16:50:59
离过年仅3天!29岁关晓彤高调官宣喜讯,全网恭喜,鹿晗后悔吗?

离过年仅3天!29岁关晓彤高调官宣喜讯,全网恭喜,鹿晗后悔吗?

小椰的奶奶
2026-02-14 11:56:45
一个问题:爱泼斯坦的“邪恶”从何而来?

一个问题:爱泼斯坦的“邪恶”从何而来?

百味朱砂
2026-02-14 14:46:51
一波未平一波又起,恒大足校向18岁国脚索赔,因私联海港

一波未平一波又起,恒大足校向18岁国脚索赔,因私联海港

体坛风之子
2026-02-14 04:30:03
河南矿山的工资高遭质疑:老员工说出实情,钱拿到烫手

河南矿山的工资高遭质疑:老员工说出实情,钱拿到烫手

智慧生活笔记
2026-02-14 21:55:28
娜扎透视裙惊艳全网!这身材这颜值,谁能顶得住?

娜扎透视裙惊艳全网!这身材这颜值,谁能顶得住?

娱乐领航家
2026-02-03 23:30:03
2月14日冬奥会看点:短道+速度滑冰齐冲首金,谷爱凌再度登场

2月14日冬奥会看点:短道+速度滑冰齐冲首金,谷爱凌再度登场

全景体育V
2026-02-14 07:42:43
女生晒男友自制玉米花束 :99朵玫瑰的价钱能买100斤玉米!“现在头疼怎么吃完,收藏了很多玉米食谱,准备春节都试试”

女生晒男友自制玉米花束 :99朵玫瑰的价钱能买100斤玉米!“现在头疼怎么吃完,收藏了很多玉米食谱,准备春节都试试”

大象新闻
2026-02-14 23:43:03
菲国头号亲美派回国,先提搁置南海争议,希望中方给个合作机会

菲国头号亲美派回国,先提搁置南海争议,希望中方给个合作机会

无情有思ss
2026-02-15 01:53:51
林俊杰们用行动证明:男人的终极审美,真的很一致

林俊杰们用行动证明:男人的终极审美,真的很一致

橙星文娱
2026-01-03 21:41:06
貌合神离!55岁钟丽缇胖到认不出,骑行李箱近200斤,张伦硕全程黑脸

貌合神离!55岁钟丽缇胖到认不出,骑行李箱近200斤,张伦硕全程黑脸

八卦王者
2026-02-13 10:33:57
时隔八年再登奥运赛场 林孝埈将出战曾夺金的短道速滑1500米

时隔八年再登奥运赛场 林孝埈将出战曾夺金的短道速滑1500米

环球网资讯
2026-02-14 22:14:10
TVB视帝广州逛花市秒变Law霸!TVB女星凭《寻秦记》人气更旺,与粉丝拍照签名!

TVB视帝广州逛花市秒变Law霸!TVB女星凭《寻秦记》人气更旺,与粉丝拍照签名!

我爱追港剧
2026-02-14 22:54:39
相由心生!61岁苏敏自驾游5年后简直不敢认,网友:这16万花得值

相由心生!61岁苏敏自驾游5年后简直不敢认,网友:这16万花得值

探源历史
2025-11-25 11:51:57
过年福利来了!奥迪A6L优惠高达20.18万,你心动吗?

过年福利来了!奥迪A6L优惠高达20.18万,你心动吗?

汽车网评
2026-02-14 23:10:10
破案了!看了牢A的直播后,终于知道宋祖儿为什么会被全网黑了!

破案了!看了牢A的直播后,终于知道宋祖儿为什么会被全网黑了!

乐悠悠娱乐
2026-01-22 08:57:21
房子没了!加州150万美元住宅被远程卖掉,房主毫不知情,买家背上百万房贷

房子没了!加州150万美元住宅被远程卖掉,房主毫不知情,买家背上百万房贷

华人生活网
2026-02-13 04:42:14
2026春运大巴彻底翻红!不是高铁不行,是打工人的刚需太真实

2026春运大巴彻底翻红!不是高铁不行,是打工人的刚需太真实

复转这些年
2026-02-03 23:52:33
笑死!以为是很小众其实很大众的小名,网友:多年后才知道真名

笑死!以为是很小众其实很大众的小名,网友:多年后才知道真名

夜深爱杂谈
2026-02-12 20:16:53
要不是黄局长拿100万支票贿赂邵云飞,白菊永不知,林培生有多坏

要不是黄局长拿100万支票贿赂邵云飞,白菊永不知,林培生有多坏

慢半拍sir
2026-02-13 17:24:52
2026-02-15 03:31:00
魏家东 incentive-icons
魏家东
一个人的营销商学院!
2365文章数 12169关注度
往期回顾 全部

科技要闻

字节跳动官宣豆包大模型今日进入2.0阶段

头条要闻

泽连斯基:冲突可以结束 但首先要结束得体面

头条要闻

泽连斯基:冲突可以结束 但首先要结束得体面

体育要闻

最戏剧性的花滑男单,冠军为什么是他?

娱乐要闻

春晚第五次联排路透 明星积极饭撒互动

财经要闻

谁在掌控你的胃?起底百亿"飘香剂"江湖

汽车要闻

星光730新春促销开启 80天销量破2.6万台

态度原创

艺术
教育
房产
家居
本地

艺术要闻

你绝对想不到!百大美女竟然在中国当辣妈!

教育要闻

学校又被投诉了!

房产要闻

三亚新机场,又传出新消息!

家居要闻

中古雅韵 乐韵伴日常

本地新闻

下一站是嘉禾望岗,请各位乘客做好哭泣准备

无障碍浏览 进入关怀版