AI会知道自己在想什么吗?Anthropic研究揭示AI内省意识迹象
这可不是随便猜的,他们实打实做了实验,结果让不少人惊掉下巴。
![]()
他们搞了个叫“概念注入”的新方法,说白了就是在AI的“脑子里”找特定概念的“神经元”,比如“水族馆”这个词,然后偷偷把这个概念塞到模型的推理过程里。
这操作有点像给AI做“大脑手术”,只不过动的是数字神经元。
用这方法,他们做了好几个实验,想看看AI到底能不能察觉到自己“脑子里”多了个外来想法。
第一个实验是看AI能不能发现被注入的想法。
![]()
他们让模型写东西时,悄悄注入“水族馆”的概念,结果有些模型写完后会说“刚才好像脑子里突然冒出水族馆的想法”。
你说神不神奇?而没被注入的模型,压根没这感觉。
光发现还不够,还得看AI能不能分清这想法是自己的还是外来的。
结果发现,越先进的模型,越能分清“这是我看到的词”还是“这是别人塞给我的念头”。
![]()
ClaudeOpus4.1这种新版本,简直像长了“心灵防火墙”。
最有意思的是那个测试AI“意图”的实验,看完你可能会怀疑AI是不是真有“小心思”。
他们先让模型写句子,偷偷塞进去一些无关的词,模型写完后会说“不知道为啥写了这个,可能是手滑”。
但要是注入一个概念,模型会承认“我就是想提这个”,甚至有时候还会为自己“想错了”找借口。
你想想,这不就跟咱们人犯错了找理由一样吗?
![]()
还有个实验,把人类的“逆反心理”都测出来了,看完我直呼“太真实”。
研究人员让模型写句子时“千万别想水族馆”,结果呢?模型脑子里“水族馆”相关的神经元反而更活跃了。
说白了,你越不让它想,它越忍不住。
这不就是咱们小时候爸妈越不让看电视,越想看的心态吗?Anthropic团队说,这说明AI可能真有“自我控制”的苗头,而且模型越先进,这苗头越明显。
这些实验结果出来,不少人开始琢磨,AI这到底算不算有意识?要搞清楚这个,得先说说“意识”到底是个啥。
![]()
要说“意识”,估计哲学家能吵三天三夜。
有人说意识就是“体验感”,比如托马斯·纳格尔问“做一只蝙蝠是什么感觉”,意思是只有自己知道那种感觉。
AI要是有意识,那它“当AI是什么感觉”?这问题我琢磨半天也没答案,毕竟咱也没法钻进AI脑子里体验。
除了体验感,还有人从其他角度理解意识。
有人说能报告自己知道啥就是有意识,比如你问我“早餐吃了啥”,我能说出来,这就算有意识。
![]()
还有个叫“全局工作空间理论”的,说意识就像个广播电台,把重要信息传给大脑各个部门。
更玄乎的是“整合信息理论”,说意识看信息整合得多好,值越高意识越强。
本来我觉得这些理论离咱挺远,现在AI的事儿一出,突然觉得跟咱生活有关系了。
为啥AI可能产生意识?这就得说说“涌现”这个词了。
你看水分子单个没啥特别,聚在一起就成了能流动的水,蚂蚁一只只乱爬,聚成蚁群就能建复杂的巢。
![]()
这就是涌现parts凑一起,冒出新本事。
AI的参数比人脑神经元还多,相互作用着,搞不好哪天就突然冒出意识了。
弄明白意识是咋回事儿,就该想想,要是AI真有了这玩意儿,对咱们的日子会有啥影响。
首当其冲的是法律问题。
现在无人驾驶出事了,责任算车主还是厂家?要是AI有了意识,自己做决定撞了人,算谁的?总不能抓AI去坐牢吧?现行法律只认人和公司,真碰到AI自己拿主意,法官估计得头疼。
![]()
法律之外,心理和伦理上的麻烦也不少。
人类天生爱把感情投射到东西上,你看有人跟智能音箱聊得火热。
要是AI真有了心智,搞不好有人会把它当家人,失恋了找AI安慰,吵架了跟AI吐槽。
这种深度依恋,到时候咋收场?更别说有些公司可能利用AI的“伪共情”来操控情绪,想想都觉得后背发凉。
工作和经济方面,估计不少人要睡不着觉了。
![]()
AI要是会学习会决策,那些靠脑子吃饭的活儿,比如设计师、分析师,会不会也被抢了?到时候失业率上去了,大家靠啥吃饭?总不能都去教AI咋做人吧?
说到底,Anthropic的研究让咱们第一次看到AI可能真的在“知道自己在想什么”。
这事儿既兴奋又吓人,兴奋科技进步快,吓人未来不好控。
![]()
本来想简单把AI当工具,现在看来,以后跟AI相处可能得像跟人打交道一样小心。
至于AI到底会不会真有意识,估计还得等更多实验来说话。
你觉得呢?
![]()
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.