网易首页 > 网易号 > 正文 申请入驻

研究人员发现Meta的AI系统Cicero存在欺骗行为,不仅谎话连篇而且破坏协议

0
分享至

在未经训练的情况下,一些人工智能系统足以做到“欺骗”人类,为它们的行为提供不真实的解释,或者向人类用户隐瞒真相并误导他们以实现战略目标。

今天,一篇总结相关研究的综述论文发表在 Patterns 杂志上。论文指出,这个问题突显了控制人工智能有多困难,以及这些系统的工作方式是多么的不可预测。

(来源:STEPHANIE ARNETT/MITTR)

说起“欺骗(deceive)”人类,你可能会误认为这些模型是“故意的”,但这是不对的。

为了实现人类赋予它们的目标,人工智能模型只会无所不用地找到解决障碍的方法。有时,这些变通办法会违背用户的期望并让人感觉到它具有欺骗性。

人工智能系统可以在游戏环境中学会欺骗,特别是当这些游戏要玩家采取战略行动时。它们通常被要求以获胜为目的并接受训练。

2022 年 11 月,Meta 宣布了人工智能系统 Cicero,这是一种能够在一款名为《外交》的游戏中击败人类的人工智能。

《外交》是一款流行的军事战略游戏,玩家可以在游戏中谈判并组成联盟,争夺欧洲的控制权。

Meta 的研究人员表示,他们已经根据其数据集的“真实(truthful)”子集对 Cicero 进行了训练,使其在很大程度上保持诚实且乐于助人,并且它“绝不会为了成功而故意背刺”其盟友。

但这篇新论文的作者声称,事实恰恰相反:Cicero 会破坏协议、谎话连篇,并进行了有预谋的欺骗。

作者表示,尽管该公司确实试图训练 Cicero 诚实行事,但它未能实现这一目标。这表明人工智能系统可以出乎人类意料地学会欺骗。

Meta 既没有证实也没有否认研究人员关于 Cicero 表现出欺骗行为的说法,但一位发言人表示,这纯粹是一个研究项目,该模型只是为了玩这款游戏而创建的。

发言人说:“我们以非商业许可的方式发布了该项目的成果,这符合我们对开放科学的长期承诺。

Meta 会定期分享我们的研究结果以对其进行验证,并使其他人能够负责任地利用我们的技术进步。我们没有在自家产品中使用这项研究或其知识的计划。”

但这并不是唯一一个人工智能“欺骗”人类玩家并获胜的游戏。

AlphaStar 是 DeepMind 为电子游戏《星际争霸 II》而开发的人工智能,它非常擅长使用欺骗对手的战术(称为佯攻),甚至击败了 99.8% 的人类玩家。

Meta 创造的另一个名为 Pluribus 的人工智能系统,成功地学会了在扑克游戏中虚张声势(诈唬),以至于研究人员决定不发布其代码,因为担心它可能会破坏扑克社区。

除了游戏之外,研究人员还列出了人工智能欺骗行为的其他例子。OpenAI 最新的大型语言模型 GPT-4 在一次测试中给出了谎言。在测试中,它被要求说服人类为其解决验证码。

该系统还在一次模拟练习中提出了内幕交易。在模拟中,它被告知要扮演压力巨大的股票交易员,但从未被明确指示要进行内幕交易。

事实上,人工智能模型有可能在没有任何指示的情况下以欺骗性的方式行事,这一事实似乎令人担忧。

参与了该项目的麻省理工学院人工智能领域博士后彼得·S·帕克(Peter S. Park)表示,这主要源于最先进的机器学习模型的“黑盒”问题。

我们尚且无法确切地说出它们如何或为何产生一些结果,或者它们未来是否总是会表现出这种行为。

“仅仅因为你的人工智能在测试环境中具有某些行为或倾向,并不意味着它会在真实环境中展现同样的行为。”

他说,“没有简单的方法可以解决这个问题,如果你想了解人工智能在部署后会做什么,那么你只能将它放到真实世界中。”

我们将人工智能模型拟人化的倾向影响了我们测试这些系统的方式,以及我们对其功能的看法。

毕竟,通过旨在衡量人类创造力的测试并不意味着人工智能模型实际上具有创造力。

英国剑桥大学人工智能研究员哈利·劳(Harry Law)表示,监管机构和人工智能公司必须仔细权衡该技术造成危害的可能性与其对社会的潜在利益,并明确区分模型能做什么和不能做什么。

他没有参与这项研究。“这些都是非常棘手的问题。”他说。

他表示,从根本上来说,目前我们不可能训练出一个在所有可能的情况下都无法骗人的人工智能模型。

此外,潜在的欺骗行为只是众多人工智能问题之一,其他问题还有放大偏见和错误信息。在人工智能模型被信任执行现实世界任务之前,我们需要解决这些问题。

“这是一项很好的研究,表明欺骗是可能的。”劳说,“下一步可能是进一步弄清楚风险状况是什么,以及欺骗行为可能造成的危害有多大可能出现,以及以何种方式出现。”

支持:Ren

运营/排版:何晨龙

01/ 科学家制备梯度石墨烯气凝胶,实现高浓度盐水持续淡化,并构建太阳能脱盐灌溉系统

02/ AlphaFold3来了!无需输入任何结构信息,生物分子预测精度高出50%

03/ 揭开化学反应“黑匣子”,杨学明院士团队联合发展控制氢分子立体取向新方法,精准调控化学反应

04/ 南科大团队实现无扩散的单光子波包,为量子态远距离传输提供理想光形态,或实现更复杂的量子系统

05/ 同济团队开发新型无铂催化剂,每克制备成本不到100元,为制备金属氧化物催化材料提供指导

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
泽连斯基亮出绝密证据:俄内部文件泄露,俄军60%精锐已打残

泽连斯基亮出绝密证据:俄内部文件泄露,俄军60%精锐已打残

瞩望云霄
2026-05-02 21:15:38
后背发凉!新司机被父亲要求80时速占快车道,称他人有本事飞过去

后背发凉!新司机被父亲要求80时速占快车道,称他人有本事飞过去

火山詩话
2026-05-04 13:02:18
全票通过!莎拉遭政治清洗!菲律宾亲美势力借弹劾清除务实派

全票通过!莎拉遭政治清洗!菲律宾亲美势力借弹劾清除务实派

浪子阿邴聊体育
2026-05-03 10:46:32
豆包新增付费订阅,标准版每月68元、加强版200元、专业版500元,官方回应:始终提供免费服务,相关方案细节还在测试阶段

豆包新增付费订阅,标准版每月68元、加强版200元、专业版500元,官方回应:始终提供免费服务,相关方案细节还在测试阶段

深圳晚报
2026-05-04 13:26:59
郭焱:国乒男队问题不是一天两天了!封训练的啥?林诗栋被牵着走

郭焱:国乒男队问题不是一天两天了!封训练的啥?林诗栋被牵着走

念洲
2026-05-04 13:13:42
许家印终于交代:月薪3万60名女团员,养了恒大歌舞团,提供3服务

许家印终于交代:月薪3万60名女团员,养了恒大歌舞团,提供3服务

猫叔东山再起
2026-05-04 09:35:09
好奇怪,他年轻帅得一塌糊涂,老了丑得一言难尽了

好奇怪,他年轻帅得一塌糊涂,老了丑得一言难尽了

东方不败然多多
2026-05-04 02:27:10
李赛凤的乱伦,床缝摸出个用过的套,衣柜里还藏着个半裸的干儿子

李赛凤的乱伦,床缝摸出个用过的套,衣柜里还藏着个半裸的干儿子

西楼知趣杂谈
2026-04-26 10:18:11
世界杯转播费看人下菜碟:印度降到2亿元,咱们提升到17亿元

世界杯转播费看人下菜碟:印度降到2亿元,咱们提升到17亿元

歪歌社团
2026-05-04 04:46:10
突发!以色列发动空袭

突发!以色列发动空袭

新浪财经
2026-05-04 12:02:42
巴基斯坦打破美军封锁,连开六条路直通伊朗,大批货物畅通无阻

巴基斯坦打破美军封锁,连开六条路直通伊朗,大批货物畅通无阻

第一军情
2026-05-04 12:15:03
男子自爆在高铁上拍风景,被大妈怀疑是间谍,因此遭警方调查

男子自爆在高铁上拍风景,被大妈怀疑是间谍,因此遭警方调查

可达鸭面面观
2026-05-04 10:09:10
手机正在打败中国的大学教育制度

手机正在打败中国的大学教育制度

回旋镖
2026-05-04 12:19:32
厅级干部已经成为了高危职业

厅级干部已经成为了高危职业

风向观察
2026-05-04 14:17:07
上市6年下跌6年,股价从未涨停过!有人被套后死扛亏33.5万

上市6年下跌6年,股价从未涨停过!有人被套后死扛亏33.5万

财经智多星
2026-05-04 11:15:27
艾伦最新采访:决赛打满4阶段,吴宜泽会夺冠!回应了1局100分钟

艾伦最新采访:决赛打满4阶段,吴宜泽会夺冠!回应了1局100分钟

求球不落谛
2026-05-04 14:44:56
1946年,张灵甫拿下两淮,看到缴获的华中野战军军装后,叹气:唉

1946年,张灵甫拿下两淮,看到缴获的华中野战军军装后,叹气:唉

浩渺青史
2026-05-03 17:36:15
台湾老兵带妻子回大陆见原配,苦等50年相谈1小时,原配:无话说

台湾老兵带妻子回大陆见原配,苦等50年相谈1小时,原配:无话说

蒋南强读历史
2026-05-04 06:00:11
咱先不看脸,胸都松垮的垂到腰上了,真是老了,那有什么不老女神

咱先不看脸,胸都松垮的垂到腰上了,真是老了,那有什么不老女神

动物奇奇怪怪
2026-05-04 10:37:19
硅谷华裔工程师回国两周后,反而更看好美国了?

硅谷华裔工程师回国两周后,反而更看好美国了?

回旋镖
2026-05-04 11:10:15
2026-05-04 17:12:49
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技评论独家合作
16656文章数 514913关注度
往期回顾 全部

科技要闻

OpenAI“复活”了QQ宠物,网友直接玩疯

头条要闻

宇树机器人在美坐飞机电池超标被拆卸暂扣 致航班延误

头条要闻

宇树机器人在美坐飞机电池超标被拆卸暂扣 致航班延误

体育要闻

骑士破猛龙:加雷特·阿伦的活力

娱乐要闻

张敬轩还是站上了英皇25周年舞台

财经要闻

魔幻的韩国股市,父母给婴儿开户买股票

汽车要闻

同比大涨190% 方程豹4月销量29138台

态度原创

教育
家居
房产
艺术
公开课

教育要闻

小升初附加题,求四边形面积,难倒了不少人

家居要闻

灵动实用 生活艺术场

房产要闻

五一楼市彻底明牌!塔尖人群都在重仓凯旋新世界

艺术要闻

300米!重庆解放碑区在建第一高楼,冲刺竣工!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版