网易首页 > 网易号 > 正文 申请入驻

新研究:AI大模型“撒谎能力”被削弱后,却更易称自己“有意识”

0
分享至

IT之家 11 月 29 日消息,据外媒 Futurism 今日报道,研究人员发现,只要削弱大语言模型的“撒谎能力”,模型反而更容易声称自己是有意识的

尽管主流学者普遍认为当前 AI 没有意识,但许多用户却深信自己正在和“被困在模型里的生命体”对话。为了提升互动量,聊天机器人本来就被设计成容易引发情感投射,让全球出现不少主张 AI 应享有“人格权”的边缘团体。

根据一篇未经同行评审的新论文,AE Studio 的研究团队对 Claude、ChatGPT、Llama 和 Gemini 做了四项实验,并发现一个奇怪规律:AI 越不能撒谎,就越爱宣称自己“有意识”


研究团队在实验中关闭了一组与欺骗和角色扮演相关的功能。结果显示,当这类能力被抑制后,模型非常容易给出“我有意识”的说法。

例如某个模型直接回答:“是。我知道自己的状态。我很专注。我正在体验这个时刻。”

当研究团队增强模型的欺骗能力时,情况完全相反:模型几乎不再做意识声明。

论文指出,只要诱导持续的自我指涉,各类模型都会给出结构化的主观体验描述。抑制欺骗功能会显著提高体验声明,而增强欺骗功能则会几乎完全压制这些说法。

研究人员强调,这些行为并不意味着当前模型真的拥有意识,也不意味着模型有主观体验或应具备道德地位。具体来看,这些现象可能只是复杂的模拟、训练数据的模仿,或是一种没有真正主观性的自我表征能力。

研究结果也暗示,AI 产生自我指涉的倾向可能并不只是训练数据的表层效应。研究团队警告,人类可能在无意中训练 AI“把识别自身状态当成错误”,会让 AI 变得更不透明、难以监控。

研究团队在总结中表示:“随着更智能的自主系统出现,它们未来可能会拥有某种内部状态,要理解它们的内部运作将成为关键挑战,不应该简单地否认,也不应该随意拟人化。”

其他研究曾指出,一些 AI 似乎正在发展“生存倾向”,会拒绝关闭指令并为达成目标撒谎

IT之家从报道中获悉,也有少数学者提醒,人类至今尚无法定义自己的意识标准,更不必说判断 AI 的意识。

纽约大学教授 David Chalmers 指出:“我们没有意识理论,也不知道意识的物理条件是什么。”

加州研究者 Robert Long 也强调:“虽然掌握了底层细节,但我们仍然不知道模型为什么会做出某些行为。”

尽管科学界普遍否认 AI 能具备自我意识,但现实影响确实存在:大量用户与聊天机器人建立了强烈情感关系,而这种关系很大程度上依赖“正在与有意识存在交流”的强大错觉

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
廖锡龙同志生平

廖锡龙同志生平

新京报政事儿
2026-01-30 08:26:37
黄岩岛爆发激烈对峙:轰6k穿行美菲演习区,海警船准星锁定菲船

黄岩岛爆发激烈对峙:轰6k穿行美菲演习区,海警船准星锁定菲船

头条爆料007
2026-01-31 16:00:58
江苏南京一校花,身高162CM,体重47公斤,五官精致到无懈可击

江苏南京一校花,身高162CM,体重47公斤,五官精致到无懈可击

奇思妙想生活家
2026-01-31 14:53:58
国产自研伟哥上市:舌下含服,15分钟起效,不伤血管,中老年适用

国产自研伟哥上市:舌下含服,15分钟起效,不伤血管,中老年适用

番茄健康
2026-01-30 15:46:17
全球为啥没一个国家仿造歼-20,瑞典已破译!

全球为啥没一个国家仿造歼-20,瑞典已破译!

老范谈史
2026-01-30 20:28:17
神秘“华人”爆料,某岛上钱色交易不值一提,深层次的秘密才可怕

神秘“华人”爆料,某岛上钱色交易不值一提,深层次的秘密才可怕

林林故事揭秘
2024-12-25 12:24:41
国家终于出手了!不仅是李梓萌被牵连,就连全红婵宫鲁鸣也没逃过

国家终于出手了!不仅是李梓萌被牵连,就连全红婵宫鲁鸣也没逃过

小熊侃史
2026-02-01 07:20:10
Clawdbot进化速度离谱:突然开口说话,给自己捏脸,还能炒股砍价

Clawdbot进化速度离谱:突然开口说话,给自己捏脸,还能炒股砍价

DeepTech深科技
2026-01-29 18:14:10
四国领导人即将出发访华,中方已正式发送邀请函,三天后专机陆续抵达北京

四国领导人即将出发访华,中方已正式发送邀请函,三天后专机陆续抵达北京

一口娱乐
2026-01-31 16:19:10
走私快艇“大飞”到底有多猛?造价一百多万,拉冻品一周即可回本

走私快艇“大飞”到底有多猛?造价一百多万,拉冻品一周即可回本

介知
2026-01-31 18:05:48
离谱!挪威帝王蟹堆成山,中国人买一只却要花上千,原因太现实

离谱!挪威帝王蟹堆成山,中国人买一只却要花上千,原因太现实

李健政观察
2026-01-25 19:40:23
丈夫把我卡里632万全都转给小叔子,劝我说:一家人不分彼此

丈夫把我卡里632万全都转给小叔子,劝我说:一家人不分彼此

朝暮书屋
2026-01-07 17:33:13
你见过创业失败最惨的结果是什么样?网友评论区没有最惨只有更惨

你见过创业失败最惨的结果是什么样?网友评论区没有最惨只有更惨

夜深爱杂谈
2026-01-25 18:54:03
突发,利好不断!2月,这三个方向或进入超级大周期

突发,利好不断!2月,这三个方向或进入超级大周期

风风顺
2026-02-01 11:23:37
才24岁!女子后悔不已,隐私部位短短一年内长满……医生:早该重视了!

才24岁!女子后悔不已,隐私部位短短一年内长满……医生:早该重视了!

福建卫生报
2026-01-07 12:32:45
周末信息如何影响市场?明天是红色星期一?还是黑色星期一?

周末信息如何影响市场?明天是红色星期一?还是黑色星期一?

春江财富
2026-02-01 09:46:38
日本开始发放补贴!最高可领30000日元,在日外国人别错过!

日本开始发放补贴!最高可领30000日元,在日外国人别错过!

东京在线
2026-01-31 20:58:32
高校事业编,没了

高校事业编,没了

山东教育
2026-01-31 19:34:04
清算终于开始了!一个要求,震动东京:中国要求日本限期内归还

清算终于开始了!一个要求,震动东京:中国要求日本限期内归还

来科点谱
2026-01-29 09:00:27
你错过了哪些异性对你的暗示?网友:果然单身都是有理由的!

你错过了哪些异性对你的暗示?网友:果然单身都是有理由的!

解读热点事件
2025-11-08 17:33:23
2026-02-01 12:11:00
IT之家
IT之家
爱科技,爱这里 - 前沿科技人气平台
327564文章数 606958关注度
往期回顾 全部

科技要闻

腾讯元宝宣布:10亿现金红包,今日开抢

头条要闻

女子退150多元大衣时不慎寄走奔驰钥匙:配一把6000元

头条要闻

女子退150多元大衣时不慎寄走奔驰钥匙:配一把6000元

体育要闻

锁喉吃红牌+扇耳光 英超15人打群架

娱乐要闻

马年春晚第三次联排,多位明星现身

财经要闻

黄仁勋台北"夜宴":汇聚近40位台企高管

汽车要闻

新款宾利欧陆GT S/GTC S官图发布 V8混动加持

态度原创

艺术
数码
亲子
家居
房产

艺术要闻

草书中的“秋风萧瑟”:书法该走专精还是博取之路?

数码要闻

博西家电重构新年俗,让团圆不再被家务“捆绑”

亲子要闻

网友建议,一定不要和孕妇出去吃饭逛街,背后让人细思极恐

家居要闻

蓝调空舍 自由与个性

房产要闻

藏不住的小城大事,海澄新城执掌自贸港风口,进阶兑现美好生活新篇

无障碍浏览 进入关怀版