网易首页 > 网易号 > 正文 申请入驻

研究人员发现Meta的AI系统Cicero存在欺骗行为,不仅谎话连篇而且破坏协议

0
分享至

在未经训练的情况下,一些人工智能系统足以做到“欺骗”人类,为它们的行为提供不真实的解释,或者向人类用户隐瞒真相并误导他们以实现战略目标。

今天,一篇总结相关研究的综述论文发表在 Patterns 杂志上。论文指出,这个问题突显了控制人工智能有多困难,以及这些系统的工作方式是多么的不可预测。

(来源:STEPHANIE ARNETT/MITTR)

说起“欺骗(deceive)”人类,你可能会误认为这些模型是“故意的”,但这是不对的。

为了实现人类赋予它们的目标,人工智能模型只会无所不用地找到解决障碍的方法。有时,这些变通办法会违背用户的期望并让人感觉到它具有欺骗性。

人工智能系统可以在游戏环境中学会欺骗,特别是当这些游戏要玩家采取战略行动时。它们通常被要求以获胜为目的并接受训练。

2022 年 11 月,Meta 宣布了人工智能系统 Cicero,这是一种能够在一款名为《外交》的游戏中击败人类的人工智能。

《外交》是一款流行的军事战略游戏,玩家可以在游戏中谈判并组成联盟,争夺欧洲的控制权。

Meta 的研究人员表示,他们已经根据其数据集的“真实(truthful)”子集对 Cicero 进行了训练,使其在很大程度上保持诚实且乐于助人,并且它“绝不会为了成功而故意背刺”其盟友。

但这篇新论文的作者声称,事实恰恰相反:Cicero 会破坏协议、谎话连篇,并进行了有预谋的欺骗。

作者表示,尽管该公司确实试图训练 Cicero 诚实行事,但它未能实现这一目标。这表明人工智能系统可以出乎人类意料地学会欺骗。

Meta 既没有证实也没有否认研究人员关于 Cicero 表现出欺骗行为的说法,但一位发言人表示,这纯粹是一个研究项目,该模型只是为了玩这款游戏而创建的。

发言人说:“我们以非商业许可的方式发布了该项目的成果,这符合我们对开放科学的长期承诺。

Meta 会定期分享我们的研究结果以对其进行验证,并使其他人能够负责任地利用我们的技术进步。我们没有在自家产品中使用这项研究或其知识的计划。”

但这并不是唯一一个人工智能“欺骗”人类玩家并获胜的游戏。

AlphaStar 是 DeepMind 为电子游戏《星际争霸 II》而开发的人工智能,它非常擅长使用欺骗对手的战术(称为佯攻),甚至击败了 99.8% 的人类玩家。

Meta 创造的另一个名为 Pluribus 的人工智能系统,成功地学会了在扑克游戏中虚张声势(诈唬),以至于研究人员决定不发布其代码,因为担心它可能会破坏扑克社区。

除了游戏之外,研究人员还列出了人工智能欺骗行为的其他例子。OpenAI 最新的大型语言模型 GPT-4 在一次测试中给出了谎言。在测试中,它被要求说服人类为其解决验证码。

该系统还在一次模拟练习中提出了内幕交易。在模拟中,它被告知要扮演压力巨大的股票交易员,但从未被明确指示要进行内幕交易。

事实上,人工智能模型有可能在没有任何指示的情况下以欺骗性的方式行事,这一事实似乎令人担忧。

参与了该项目的麻省理工学院人工智能领域博士后彼得·S·帕克(Peter S. Park)表示,这主要源于最先进的机器学习模型的“黑盒”问题。

我们尚且无法确切地说出它们如何或为何产生一些结果,或者它们未来是否总是会表现出这种行为。

“仅仅因为你的人工智能在测试环境中具有某些行为或倾向,并不意味着它会在真实环境中展现同样的行为。”

他说,“没有简单的方法可以解决这个问题,如果你想了解人工智能在部署后会做什么,那么你只能将它放到真实世界中。”

我们将人工智能模型拟人化的倾向影响了我们测试这些系统的方式,以及我们对其功能的看法。

毕竟,通过旨在衡量人类创造力的测试并不意味着人工智能模型实际上具有创造力。

英国剑桥大学人工智能研究员哈利·劳(Harry Law)表示,监管机构和人工智能公司必须仔细权衡该技术造成危害的可能性与其对社会的潜在利益,并明确区分模型能做什么和不能做什么。

他没有参与这项研究。“这些都是非常棘手的问题。”他说。

他表示,从根本上来说,目前我们不可能训练出一个在所有可能的情况下都无法骗人的人工智能模型。

此外,潜在的欺骗行为只是众多人工智能问题之一,其他问题还有放大偏见和错误信息。在人工智能模型被信任执行现实世界任务之前,我们需要解决这些问题。

“这是一项很好的研究,表明欺骗是可能的。”劳说,“下一步可能是进一步弄清楚风险状况是什么,以及欺骗行为可能造成的危害有多大可能出现,以及以何种方式出现。”

支持:Ren

运营/排版:何晨龙

01/ 科学家制备梯度石墨烯气凝胶,实现高浓度盐水持续淡化,并构建太阳能脱盐灌溉系统

02/ AlphaFold3来了!无需输入任何结构信息,生物分子预测精度高出50%

03/ 揭开化学反应“黑匣子”,杨学明院士团队联合发展控制氢分子立体取向新方法,精准调控化学反应

04/ 南科大团队实现无扩散的单光子波包,为量子态远距离传输提供理想光形态,或实现更复杂的量子系统

05/ 同济团队开发新型无铂催化剂,每克制备成本不到100元,为制备金属氧化物催化材料提供指导

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
世界杯:荷兰点球3-4无缘16强!创队史最差战绩 摩洛哥踢加拿大

世界杯:荷兰点球3-4无缘16强!创队史最差战绩 摩洛哥踢加拿大

念洲
2026-06-30 11:55:27
女篮功臣终身未婚,26岁强制退役,病逝时还穿着队服

女篮功臣终身未婚,26岁强制退役,病逝时还穿着队服

乐趣纪史
2026-06-30 19:22:34
赵继伟地位改变,世预赛郭士强确立三大核心,首发阵容呼之欲出

赵继伟地位改变,世预赛郭士强确立三大核心,首发阵容呼之欲出

徐觳解说
2026-07-01 00:38:18
WTT大冷门,王曼昱被横扫,诞生3个意想不到,打削球还看孙颖莎

WTT大冷门,王曼昱被横扫,诞生3个意想不到,打削球还看孙颖莎

南海浪花
2026-07-01 10:21:49
韩旭WNBA总裁杯第2冠!自由人力克王牌加冕 斯图尔特MVP

韩旭WNBA总裁杯第2冠!自由人力克王牌加冕 斯图尔特MVP

醉卧浮生
2026-07-01 09:25:44
黎巴嫩真主党真不经打:经营近二十年的博福特岭,几小时就陷落

黎巴嫩真主党真不经打:经营近二十年的博福特岭,几小时就陷落

民间马后炮
2026-06-29 01:51:44
不统而统!社科院专家首提新概念,或成两岸统一“第三条路”?

不统而统!社科院专家首提新概念,或成两岸统一“第三条路”?

时光漫游志
2026-06-30 06:34:18
世界杯“点球之王”爆冷出局!德国曾在12码罚球点“打遍群雄无敌手”

世界杯“点球之王”爆冷出局!德国曾在12码罚球点“打遍群雄无敌手”

上游新闻
2026-06-30 13:32:37
日本赢不了巴西,问题不出在技术,出在最后5分钟

日本赢不了巴西,问题不出在技术,出在最后5分钟

乐乐哥
2026-06-30 13:24:51
科里纳谈德国进球被吹:进攻球员没有奔球而去,干扰防守就是犯规

科里纳谈德国进球被吹:进攻球员没有奔球而去,干扰防守就是犯规

懂球帝
2026-07-01 10:13:28
中纪委怒批:公务员也是人,正常生活不应问责处理!

中纪委怒批:公务员也是人,正常生活不应问责处理!

细说职场
2026-06-24 10:55:30
姆巴佩:我不会看射手榜,相信梅西还会继续进球

姆巴佩:我不会看射手榜,相信梅西还会继续进球

懂球帝
2026-07-01 08:37:30
马伊琍带火了一种“极简风”穿法:白T恤+黑半裙,时髦减龄还高级

马伊琍带火了一种“极简风”穿法:白T恤+黑半裙,时髦减龄还高级

蓓小西
2026-07-01 10:07:49
世界杯:英格兰vs刚果(金)

世界杯:英格兰vs刚果(金)

足球赛事交流解析
2026-07-01 09:00:03
4年2400万美金!尼克斯第2笔签约达成!冠军中锋成抢手货

4年2400万美金!尼克斯第2笔签约达成!冠军中锋成抢手货

世界体育圈
2026-06-30 16:51:23
74个国家免签,唯独让中国交五倍签证费,选亚运会开幕前何意味?

74个国家免签,唯独让中国交五倍签证费,选亚运会开幕前何意味?

深析古今
2026-06-30 13:54:46
美国大满贯:首个冷门诞生,2大世界冠军出局,王曼昱大战佐藤瞳

美国大满贯:首个冷门诞生,2大世界冠军出局,王曼昱大战佐藤瞳

潋滟晴方DAY
2026-06-30 14:11:15
王晶没说谎,58岁久居日本农村的郑伊健,印证了他的评价

王晶没说谎,58岁久居日本农村的郑伊健,印证了他的评价

陈意小可爱
2026-06-20 15:03:28
降维打击到底有多恐怖 看网友讲述 原来换个招数可以这样玩学到了

降维打击到底有多恐怖 看网友讲述 原来换个招数可以这样玩学到了

侃神评故事
2026-06-30 18:15:03
日本没料到,模拟攻击辽宁舰会惹这么大麻烦,中俄轰炸机都出动了

日本没料到,模拟攻击辽宁舰会惹这么大麻烦,中俄轰炸机都出动了

半壁胭脂色
2026-07-01 07:31:46
2026-07-01 12:11:00
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技评论独家合作
16904文章数 515064关注度
往期回顾 全部

科技要闻

美国放行,Anthropic两款顶级模型将恢复

头条要闻

老人获帮助后车祸去世 孙子:视频里他笑得合不拢嘴

头条要闻

老人获帮助后车祸去世 孙子:视频里他笑得合不拢嘴

体育要闻

德国足球,脸都不要了

娱乐要闻

罗晋大孤山素颜照,秃顶白发引热议

财经要闻

新氧贷款:宣传年化15%,实际顶格24%

汽车要闻

奇瑞风云A9探店 五个理由一定来看看

态度原创

教育
家居
旅游
数码
健康

教育要闻

高中英语平时120左右,遇到瓶颈上不去,如何稳定在一百三四十?

家居要闻

传奇筑 日常诗

旅游要闻

内蒙古呼和浩特:塞上老街夜未央

数码要闻

三星首款AI眼镜Galaxy Glasses曝光:支持Ring戒指手势控制

狂吃“糯叽叽”小心肠梗阻!

无障碍浏览 进入关怀版