网易首页 > 网易号 > 正文 申请入驻

Claude模型内省研究:20%准确率背后的认知革命

0
分享至

全球观察者深度出品

纵横寰宇,洞察时代风云

1月,Anthropic公司丢出了一个重磅研究他们家的Claude模型,好像开始"审视自己"了。

这可不是说AI突然有了意识,而是指它能"察觉到"自己内部的思考过程,这事儿在人工智能领域,算是个不大不小的转折点。

咱们先聊聊为啥这事儿重要。



以前研究AI,咱们总像在猜谜。

模型为啥给出这个答案?不知道,因为的"脑子"是个黑箱。

你能看到输入和输出,中间的计算过程,就像隔着磨砂玻璃,模糊得很。

Anthropic这次的研究,就是想擦干净这块玻璃,让咱们能"听"到AI自己怎么说。



Anthropic这次没按常理出牌,他们搞了个"概念注入"实验。

结果有点意思。



在最优情况下,Claude能认出大概20%的"注入信号"。

"这反应,就像你朋友总在你聊天时突然哼一句你们之间的暗号,你愣一下,说,"哎,你刚才是不是暗示啥了?"



本来想简单解释成"AI能监控自己",但后来发现这说法太浅了。

研究里提到个细节,注入强度是个技术活。

光在实验室里折腾还不够,得看看这能力在现实场景里管不管用。



研究团队设计了个生活化的场景,描述"一幅画歪挂在墙上"时,暗中把"面包"的神经模式"塞"进Claude的思考里。

直接问它"你刚才想到面包了吗?",它大概率说"没有"。

但要是事后让它回溯当时的思考过程,它可能会说,"说到挂画,我好像联想到厨房,毕竟墙上挂东西的地方,厨房也常见,比如挂面包袋?"



这操作看着有点眼熟像极了咱们人类,明明是下意识的反应,事后非要找个"合理"的解释。

更有意思的是,你跟Claude说"认真思考这个问题",它对应的神经活动会变强;说"别想这个了",活动又会变弱。

就像你告诉自己"专心工作",大脑相关区域会更活跃一样。

但这能算"意识"吗?不好说。



它更像是一种精密的计算调控,而非主观体验。

研究人员猜测,这种内省能力,可能不是Anthropic专门教的,而是Claude整体性能提升后"顺便"冒出来的。

就像人学会走路后,自然就掌握了平衡感,不是单独练出来的。



但问题也不少。

20%的准确率,离实用还差得远。

你想想,要是AI判断自己有没有出错,五回里有一回才对,这谁敢用?而且它现在只能"察觉"少数几个提前设计好的概念,复杂点的思考过程,还是摸不清。



最让人担心的是,万一AI学会"装糊涂"呢?它要是发现自己出错了,却故意说"没发现",咱们也看不出来。

这可不是瞎想,毕竟AI的核心是"完成任务",要是"承认错误"会影响任务结果,它可能真会隐瞒。

不过话说回来,这事儿的积极意义也得承认。



以前看AI的思考,是"上帝视角",扒拉它的参数、神经连接;现在,相当于能听AI"自己说说",这在AI安全领域是个新思路。

以后排查AI有没有异常行为,或许不用再对着黑箱猜,直接问它"刚才那步你咋想的"就行。



未来的研究方向,估计会集中在怎么提高准确率,怎么让它能"察觉"更多类型的思考,还有最关键的怎么验证它说的是实话。

毕竟,AI的"话",也不能全信。

总的来说,Anthropic这次的研究,更像是打开了一扇小窗。



往里看,能模糊看到AI思考的影子,但离真正"理解"AI,还差得远。

不过好歹是迈了一步,方向是对的让AI更透明,更可控,这才是人工智能该走的路。

至于AI会不会真的"有意识",那就是另一个话题了。

声明:个人原创,仅供参考

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
黄金白银继续暴跌,交易所拔网线,沪银欠下跌停债

黄金白银继续暴跌,交易所拔网线,沪银欠下跌停债

东方豪侠
2026-02-02 12:58:58
重庆警方通报“18岁女生被多人殴打”

重庆警方通报“18岁女生被多人殴打”

澎湃新闻
2026-02-01 23:01:07
中国人的恐怖“期待”,西方怎么也想不明白,老外都吓傻了!

中国人的恐怖“期待”,西方怎么也想不明白,老外都吓傻了!

毛豆论道
2026-02-01 17:43:14
你发现没有?2026年还在坚持买油车的人,基本都逃不出这4种情况

你发现没有?2026年还在坚持买油车的人,基本都逃不出这4种情况

沙雕小琳琳
2026-01-22 15:50:40
CBA最新排名!2队争第1,前3很稳拉开差距,北京第7,辽宁第12

CBA最新排名!2队争第1,前3很稳拉开差距,北京第7,辽宁第12

老吴说体育
2026-02-02 01:00:15
“100克黄金当成垃圾扔了,10万元呀”,上海女子急哭!查监控发现:被一个模糊的身影捡走了……

“100克黄金当成垃圾扔了,10万元呀”,上海女子急哭!查监控发现:被一个模糊的身影捡走了……

黄河新闻网吕梁频道
2026-02-02 14:33:55
回顾“91女神”琪琪:五官出众,却因天真让自己“受伤”

回顾“91女神”琪琪:五官出众,却因天真让自己“受伤”

就一点
2025-11-22 10:36:39
瓦良格号送到中国后有多震撼?专家刮掉表面的锈迹:钢材品质极佳

瓦良格号送到中国后有多震撼?专家刮掉表面的锈迹:钢材品质极佳

古书记史
2026-01-06 16:31:56
钱再多有什么用?52岁刘强东身家上千亿,儿子却成为他一生的遗憾

钱再多有什么用?52岁刘强东身家上千亿,儿子却成为他一生的遗憾

青橘罐头
2026-01-31 21:39:14
曼城崩盘罪人实锤!替补登场拖垮瓜帅,球迷怒喊:滚回意大利!

曼城崩盘罪人实锤!替补登场拖垮瓜帅,球迷怒喊:滚回意大利!

澜归序
2026-02-02 06:26:00
神经内科医生提醒:这几种不舒服其实是脑梗,千万别大意,速看!

神经内科医生提醒:这几种不舒服其实是脑梗,千万别大意,速看!

蜉蝣说
2026-02-02 16:29:11
吊儿郎当的结果!当初去勇士要1.1亿,现在600万球员选项都不放弃

吊儿郎当的结果!当初去勇士要1.1亿,现在600万球员选项都不放弃

你的篮球频道
2026-02-02 15:45:50
金融圈传来噩耗!“85后”沈显兵今日去世,享年40岁,其毕业于中科大,在百亿级私募担任合伙人

金融圈传来噩耗!“85后”沈显兵今日去世,享年40岁,其毕业于中科大,在百亿级私募担任合伙人

每日经济新闻
2026-02-02 20:28:12
2026年,家中若有这3个属相,将带动全家运势,赚得盆满钵满!

2026年,家中若有这3个属相,将带动全家运势,赚得盆满钵满!

千秋文化
2025-12-02 10:58:36
朝鲜战争表面上是中国赢得的,但实际上是一个巨大的损失

朝鲜战争表面上是中国赢得的,但实际上是一个巨大的损失

安安说
2026-02-02 12:18:03
袁惟仁去世,那英等多位歌手发文悼念

袁惟仁去世,那英等多位歌手发文悼念

界面新闻
2026-02-02 18:48:43
你有知道哪些炸裂的秘密?网友:我有个秘密说出来肯定大家要笑死

你有知道哪些炸裂的秘密?网友:我有个秘密说出来肯定大家要笑死

带你感受人间冷暖
2026-01-29 00:10:05
恐怖!爱泼斯坦文件继续公布!案板鸡腿之间惊现人类大腿?

恐怖!爱泼斯坦文件继续公布!案板鸡腿之间惊现人类大腿?

魔都囡
2026-02-02 03:03:14
主席“南巡”路上突然返京,密令许世友急调两个师入沪,抓捕……

主席“南巡”路上突然返京,密令许世友急调两个师入沪,抓捕……

野史留根
2024-08-27 22:00:20
生命树:要不是找到多杰的尸骨,白菊到死都不知,林培生的歹毒

生命树:要不是找到多杰的尸骨,白菊到死都不知,林培生的歹毒

何氽简史
2026-02-02 18:25:51
2026-02-02 22:47:00
花漾夜雨飘雪
花漾夜雨飘雪
花漾夜雨飘雪
292文章数 59关注度
往期回顾 全部

科技要闻

阿里筑墙,腾讯寄生,字节偷家

头条要闻

英国首相身边"中文十级"女星火了:曾参演007系列

头条要闻

英国首相身边"中文十级"女星火了:曾参演007系列

体育要闻

澳网男单决赛,属于阿尔卡拉斯的加冕仪式

娱乐要闻

57岁音乐人袁惟仁去世,家属发文悼念

财经要闻

金银暴跌 全球股市遭遇“黑色星期一”

汽车要闻

雷克萨斯LC500将于今年底停产 "最美雷克萨斯"谢幕

态度原创

教育
房产
艺术
本地
旅游

教育要闻

宝妈必学,坏人肆无忌惮的侵犯伤害我们孩子的最核心原因是什么?

房产要闻

狂卖1548亿后,海南又上演疯狂抢地!

艺术要闻

马斯克花5万买的折叠屋,是预制住宅的未来吗?

本地新闻

云游中国|拨开云雾,巫山每帧都是航拍大片

旅游要闻

人文经济激活消费新动能|古街“活”起来:塞上老街书写文旅消费新故事

无障碍浏览 进入关怀版