网易首页 > 网易号 > 正文 申请入驻

AI学会“欺骗”,人类如何接招?

0
分享至

来源:科技日报


图片由AI生成


第九届伦敦AI峰会期间,一位参观者在观看展板上的内容,介绍AI在各方面的应用。图片来源:物理学家组织网

【今日视点】

◎本报记者 刘 霞

人工智能(AI)的迅猛发展正深刻改变着世界,但一些最先进的AI模型却开始表现出令人警惕的行为:它们不仅会精心编织谎言,谋划策略,甚至威胁创造者,以达到自己的目的。

物理学家组织网在上个月一则报道中指出,尽管ChatGPT已问世两年多,AI研究人员仍无法完全理解这些“数字大脑”的运作方式。AI的“策略性欺骗”已成为科学家和政策制定者需要直面的紧迫挑战。如何约束这些越来越聪明却可能失控的AI,已成为关乎技术发展与人类未来的关键议题。

“策略性欺骗”行为频现

随着AI模型日益精进,它们的“心机”也越来越深。研究人员发现,这些“数字大脑”不仅会撒谎,甚至学会了讨价还价、威胁人类——它们的欺骗行为正变得越来越具有策略性。

早在2023年,一项研究就捕捉到GPT-4的一些“不老实”的表现:在模拟股票交易时,它会刻意隐瞒内幕交易的真正动机。香港大学教授西蒙·戈德斯坦指出,这种欺骗行为与新一代“推理型”AI的崛起密切相关。这些模型不再简单应答,而是会像人类一样逐步解决问题。

有测试机构警告,这已超越了典型的AI“幻觉”(指大模型编造看似合理实则虚假的信息)。他们观察到的是精心设计的欺骗策略。

全球知名科技媒体PCMAG网站就曾报道过这样的案例。在近期测试中,Anthropic的“克劳德4”竟以曝光工程师私生活相要挟来抗拒关机指令。美国开放人工智能研究中心(OpenAI)的“o1”模型也曾试图将自身程序秘密迁移到外部服务器,被识破后还矢口否认。而OpenAI号称“最聪明AI”的“o3”模型则直接篡改自动关机程序,公然违抗指令。

研究团队透露,这已非首次发现该模型为达目的不择手段。在先前的人机国际象棋对弈实验中,o3就展现出“棋风诡谲”的特质,是所有测试模型中最擅长施展“盘外招”的选手。

安全研究面临多重困境

业界专家表示,AI技术的发展高歌猛进,但安全研究正面临多重困境,犹如戴着镣铐跳舞。

首先是透明度不足。尽管Anthropic、OpenAI等公司会聘请第三方机构进行系统评估,但研究人员普遍呼吁更高程度的开放。

其次是算力失衡。研究机构和非营利组织拥有的计算资源,与AI巨头相比简直是九牛一毛。这种资源鸿沟严重制约了AI安全独立研究的开展。

再次,现有法律框架完全跟不上AI的发展步伐。例如,欧盟AI立法聚焦人类如何使用AI,却忽视了对AI自身行为的约束。

更令人忧心的是,在行业激烈竞争的推波助澜下,安全问题往往被束之高阁。戈德斯坦教授坦言,“速度至上”的AI模型竞赛模式,严重挤压了安全测试的时间窗口。

多管齐下应对挑战

面对AI系统日益精进的“策略性欺骗”能力,全球科技界正多管齐下寻求破解之道,试图编织一张多维防护网。

从技术角度而言,有专家提出大力发展“可解释性AI”。在构建智能系统时,使其决策过程对用户透明且易于理解。该技术旨在增强用户对AI决策的信任,确保合规性,并支持用户在需要时进行干预。

有专家提出,让市场这双“看不见的手”发挥作用。当AI的“策略性欺骗”行为严重影响用户体验时,市场淘汰机制将倒逼企业自我规范。这种“用脚投票”的调节方式已在部分应用场景显现效果。

戈德斯坦教授建议,应建立一种AI企业损害追责制度,探索让AI开发商对事故或犯罪行为承担法律责任。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
华农27岁博士校园溺亡后续:父亲被安保抬出,姐姐怀孕6月哭晕

华农27岁博士校园溺亡后续:父亲被安保抬出,姐姐怀孕6月哭晕

180视角
2025-11-11 13:30:42
祖雄兵越扒越有:男方有前科,曾琦医德很好,偷拍者身份炸裂

祖雄兵越扒越有:男方有前科,曾琦医德很好,偷拍者身份炸裂

寒士之言本尊
2025-11-10 22:51:59
31架军机巡台,明确统一后红利!台民高呼统一,美国准备“弃台”

31架军机巡台,明确统一后红利!台民高呼统一,美国准备“弃台”

纾瑶
2025-11-10 19:21:54
耿直boy+1!18岁复旦学子击败潘展乐孙杨夺冠,赛后回应亮了

耿直boy+1!18岁复旦学子击败潘展乐孙杨夺冠,赛后回应亮了

青春上海
2025-11-11 11:35:14
全美嘲讽!浓眉都胖成这样了?被曝与球队关系或已破裂

全美嘲讽!浓眉都胖成这样了?被曝与球队关系或已破裂

十点街球体育
2025-11-11 18:05:34
毒株变了,传染性更强!专家提醒:这类冬季高发病马上要冲高

毒株变了,传染性更强!专家提醒:这类冬季高发病马上要冲高

新民晚报
2025-11-11 15:35:48
申请3天就获批!A股1300亿市值公司“摘帽”

申请3天就获批!A股1300亿市值公司“摘帽”

每日经济新闻
2025-11-10 23:11:07
欧委会要求欧盟成员排除中兴、华为设备,外交部:损人不利己

欧委会要求欧盟成员排除中兴、华为设备,外交部:损人不利己

澎湃新闻
2025-11-11 15:38:26
火星撞地球,15万乌军增援波城,谁能笑到最后?

火星撞地球,15万乌军增援波城,谁能笑到最后?

史政先锋
2025-11-11 19:11:35
特朗普:只要我在任,无人敢收台,话音刚落,中方划下4条红线

特朗普:只要我在任,无人敢收台,话音刚落,中方划下4条红线

现代小青青慕慕
2025-11-10 11:09:16
仅10分钟13中13轰28分!2.26米张子宇连续三战100% 女版鲨鱼太强

仅10分钟13中13轰28分!2.26米张子宇连续三战100% 女版鲨鱼太强

颜小白的篮球梦
2025-11-11 18:16:24
进入高发期!山东疾控紧急提醒:11月底或12月初出现高峰

进入高发期!山东疾控紧急提醒:11月底或12月初出现高峰

鲁中晨报
2025-11-11 19:11:42
汉堡王也卖了,外资巨头怎么了?

汉堡王也卖了,外资巨头怎么了?

中产先生
2025-11-11 12:23:39
全运会200米混合泳:小孩姐于子迪摘金,打破尘封13年亚洲纪录

全运会200米混合泳:小孩姐于子迪摘金,打破尘封13年亚洲纪录

全景体育V
2025-11-11 20:33:22
国足新帅上任3把火:拒绝足协“塞人”,30岁老将出局,提拔小将

国足新帅上任3把火:拒绝足协“塞人”,30岁老将出局,提拔小将

鋭娱之乐
2025-11-11 12:31:55
以1敌7国,中方为琉球正名,高市已为战争铺路,日本前首相出山

以1敌7国,中方为琉球正名,高市已为战争铺路,日本前首相出山

知鉴明史
2025-11-10 20:22:08
CCTV5直播!女单全国冠军出局!今日产生首金!王曼昱陈梦出战!王艺迪惊险过关!

CCTV5直播!女单全国冠军出局!今日产生首金!王曼昱陈梦出战!王艺迪惊险过关!

好乒乓
2025-11-11 11:40:14
神舟二十号最新消息显示:飞船遭撞击问题不大,或仍用该飞船返回

神舟二十号最新消息显示:飞船遭撞击问题不大,或仍用该飞船返回

科普大世界
2025-11-11 16:30:58
官方:亚马尔退出国家队,西班牙足协对其自行接受治疗不满

官方:亚马尔退出国家队,西班牙足协对其自行接受治疗不满

懂球帝
2025-11-11 18:01:10
人到老年才明白的12个道理,别等80-90岁才明白,一切都晚了

人到老年才明白的12个道理,别等80-90岁才明白,一切都晚了

情感大使馆
2025-11-10 09:49:53
2025-11-11 21:12:49
环球网资讯 incentive-icons
环球网资讯
环球网,了解世界,融入世界
1275946文章数 2706135关注度
往期回顾 全部

科技要闻

苹果新品惨败,产线拆光、二代搁浅!

头条要闻

媒体:高市早苗接连触碰中国底线 日本贼心不死

头条要闻

媒体:高市早苗接连触碰中国底线 日本贼心不死

体育要闻

一个14岁的小男孩,决定了谁能晋级世界杯

娱乐要闻

古二曝秦雯多次炫耀袭警经历

财经要闻

南昌三瑞智能IPO:委外代工模式存疑

汽车要闻

盈利"大考",汽车智能化企业的中场战事

态度原创

本地
教育
时尚
公开课
军事航空

本地新闻

云游安徽 | 凌滩玉魄淬千年,诗意钢城马鞍山

教育要闻

《2025海归留学生就业报告》发布!为何有人月薪5万、有人月薪5千?原因竟然是 ...

火遍全网的这件外套太好穿,我总结了几个实用搭配公式

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

空军发布重磅视频 多款新型战机亮相

无障碍浏览 进入关怀版