网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

Claude模型内省研究：20%准确率背后的认知革命

2025-12-13 01:38:48　来源: 花漾夜雨飘雪

四川举报

0

分享至

全球观察者深度出品

纵横寰宇，洞察时代风云

1月，Anthropic公司丢出了一个重磅研究他们家的Claude模型，好像开始"审视自己"了。

这可不是说AI突然有了意识，而是指它能"察觉到"自己内部的思考过程，这事儿在人工智能领域，算是个不大不小的转折点。

咱们先聊聊为啥这事儿重要。

以前研究AI，咱们总像在猜谜。

模型为啥给出这个答案？不知道，因为它的"脑子"是个黑箱。

你能看到输入和输出，中间的计算过程，就像隔着磨砂玻璃，模糊得很。

Anthropic这次的研究，就是想擦干净这块玻璃，让咱们能"听"到AI自己怎么说。

Anthropic这次没按常理出牌，他们搞了个"概念注入"实验。

结果有点意思。

在最优情况下，Claude能认出大概20%的"注入信号"。

"这反应，就像你朋友总在你聊天时突然哼一句你们之间的暗号，你愣一下，说，"哎，你刚才是不是暗示啥了？"

本来想简单解释成"AI能监控自己"，但后来发现这说法太浅了。

研究里提到个细节，注入强度是个技术活。

光在实验室里折腾还不够，得看看这能力在现实场景里管不管用。

研究团队设计了个生活化的场景，描述"一幅画歪挂在墙上"时，暗中把"面包"的神经模式"塞"进Claude的思考里。

直接问它"你刚才想到面包了吗？"，它大概率说"没有"。

但要是事后让它回溯当时的思考过程，它可能会说，"说到挂画，我好像联想到厨房，毕竟墙上挂东西的地方，厨房也常见，比如挂面包袋？"

这操作看着有点眼熟像极了咱们人类，明明是下意识的反应，事后非要找个"合理"的解释。

更有意思的是，你跟Claude说"认真思考这个问题"，它对应的神经活动会变强；说"别想这个了"，活动又会变弱。

就像你告诉自己"专心工作"，大脑相关区域会更活跃一样。

但这能算"意识"吗？不好说。

它更像是一种精密的计算调控，而非主观体验。

研究人员猜测，这种内省能力，可能不是Anthropic专门教的，而是Claude整体性能提升后"顺便"冒出来的。

就像人学会走路后，自然就掌握了平衡感，不是单独练出来的。

但问题也不少。

20%的准确率，离实用还差得远。

你想想，要是AI判断自己有没有出错，五回里有一回才对，这谁敢用？而且它现在只能"察觉"少数几个提前设计好的概念，复杂点的思考过程，还是摸不清。

最让人担心的是，万一AI学会"装糊涂"呢？它要是发现自己出错了，却故意说"没发现"，咱们也看不出来。

这可不是瞎想，毕竟AI的核心是"完成任务"，要是"承认错误"会影响任务结果，它可能真会隐瞒。

不过话说回来，这事儿的积极意义也得承认。

以前看AI的思考，是"上帝视角"，扒拉它的参数、神经连接；现在，相当于能听AI"自己说说"，这在AI安全领域是个新思路。

以后排查AI有没有异常行为，或许不用再对着黑箱猜，直接问它"刚才那步你咋想的"就行。

未来的研究方向，估计会集中在怎么提高准确率，怎么让它能"察觉"更多类型的思考，还有最关键的怎么验证它说的是实话。

毕竟，AI的"话"，也不能全信。

总的来说，Anthropic这次的研究，更像是打开了一扇小窗。

往里看，能模糊看到AI思考的影子，但离真正"理解"AI，还差得远。

不过好歹是迈了一步，方向是对的让AI更透明，更可控，这才是人工智能该走的路。

至于AI会不会真的"有意识"，那就是另一个话题了。

声明：个人原创，仅供参考

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

刘炜之后，上海男篮终于迎来了新的后场核心？

新民晚报 2026-02-02 10:38:25
214 跟贴 214
郑丽文再发声：大陆是我们的亲人

扬子晚报 2026-02-02 16:46:11
343 跟贴 343

斯塔默离开上海又去了东京英国国内有人大惑不解

澎湃新闻 2026-02-02 11:45:05
297 跟贴 297

纽约期银日内涨9%

每日经济新闻 2026-02-02 08:19:11
158 跟贴 158
便利背后暗藏风险手机“贴一贴”可能无形中危害国家安全

大象新闻 2026-02-02 06:57:23
3460 跟贴 3460

现货白银日内跌幅扩大至10%，报76.89美元/盎司

每日经济新闻 2026-02-02 07:26:07
932 跟贴 932

企业称为了环保只让新能源车进厂卸货，国六货车被迫在门口排队换上电动车头，每次花200到400元

重案组37号 2026-02-02 09:39:22
2067 跟贴 2067
模特控诉爱泼斯坦聚会吃人后消失

北京日报 2026-02-02 16:45:21
95 跟贴 95

特斯拉：第三代特斯拉人形机器人即将亮相

界面新闻 2026-02-02 12:13:55
1342 跟贴 1342
专家回应大年三十“消失”：正常历法现象

环球网资讯 2026-02-02 10:45:13
316 跟贴 316
个人增值税起征点提高至1000元

南方都市报 2026-02-02 07:05:17
949 跟贴 949
三区试点，建行支持上海第一批收购二手房用于保租房项目签约

澎湃新闻 2026-02-02 13:19:05
22 跟贴 22
解放军报评论员：以强烈的使命担当攻坚奋进

解放军报 2026-02-02 06:33:12
363 跟贴 363
江苏省教育厅发布：假期不仅是孩子学业休整的驿站，更是全面发展的沃土，请理性看待校外培训，莫让假期变成“第三学期”

扬子晚报 2026-02-02 14:41:49
205 跟贴 205
半场战报|山东男篮36：58落后天津，球队无人得分上双

齐鲁壹点 2026-02-02 20:55:12
4 跟贴 4
NBA｜詹姆斯职业生涯首次以替补入选全明星

北青网-北京青年报 2026-02-02 09:35:06
116 跟贴 116
太阳今日爆发X8.1级耀斑为2024年10月以来最强耀斑

新京报 2026-02-02 12:00:06
339 跟贴 339
宜家天津中北商场门店今日起停止运营

界面新闻 2026-02-02 20:48:15
3 跟贴 3
9957.22亿元！2025年徐州市GDP官宣，距“万亿之城”还差“一点点”

现代快报 2026-02-02 11:43:12
10 跟贴 10
上海一烤鱼店开业，顾客百米冲刺取号！深夜12点近4000桌排队，凌晨3点半仍有人等，最长排13小时

钱江晚报 2026-02-02 06:50:41
0 跟贴 0
陕西一孩子用水桶装泳池水大口喝，网友着急：池水脏不能喝，家长：他玩游戏，已当场教育

台州交通广播 2026-02-02 22:17:27
0 跟贴 0
奔驰突然大范围调价

都市快报橙柿互动 2026-02-02 19:19:15
0 跟贴 0
连续亏损！雷锋大道这个小区物业撤场了！

星耀长沙 2026-02-02 22:18:59
0 跟贴 0
生死一瞬！他纵身跃入冰河，成功挽救两名被困车中少女

扬子晚报 2026-02-02 22:19:43
0 跟贴 0

黄金白银继续暴跌，交易所拔网线，沪银欠下跌停债

黄金白银继续暴跌，交易所拔网线，沪银欠下跌停债

东方豪侠

2026-02-02 12:58:58

重庆警方通报“18岁女生被多人殴打”

重庆警方通报“18岁女生被多人殴打”

澎湃新闻

2026-02-01 23:01:07

中国人的恐怖“期待”，西方怎么也想不明白，老外都吓傻了！

中国人的恐怖“期待”，西方怎么也想不明白，老外都吓傻了！

毛豆论道

2026-02-01 17:43:14

你发现没有？2026年还在坚持买油车的人，基本都逃不出这4种情况

你发现没有？2026年还在坚持买油车的人，基本都逃不出这4种情况

沙雕小琳琳

2026-01-22 15:50:40

CBA最新排名！2队争第1，前3很稳拉开差距，北京第7，辽宁第12

CBA最新排名！2队争第1，前3很稳拉开差距，北京第7，辽宁第12

老吴说体育

2026-02-02 01:00:15

“100克黄金当成垃圾扔了，10万元呀”，上海女子急哭！查监控发现：被一个模糊的身影捡走了……

“100克黄金当成垃圾扔了，10万元呀”，上海女子急哭！查监控发现：被一个模糊的身影捡走了……

黄河新闻网吕梁频道

2026-02-02 14:33:55

回顾“91女神”琪琪：五官出众，却因天真让自己“受伤”

回顾“91女神”琪琪：五官出众，却因天真让自己“受伤”

就一点

2025-11-22 10:36:39

瓦良格号送到中国后有多震撼？专家刮掉表面的锈迹：钢材品质极佳

瓦良格号送到中国后有多震撼？专家刮掉表面的锈迹：钢材品质极佳

古书记史

2026-01-06 16:31:56

钱再多有什么用？52岁刘强东身家上千亿，儿子却成为他一生的遗憾

钱再多有什么用？52岁刘强东身家上千亿，儿子却成为他一生的遗憾

青橘罐头

2026-01-31 21:39:14

曼城崩盘罪人实锤！替补登场拖垮瓜帅，球迷怒喊：滚回意大利！

曼城崩盘罪人实锤！替补登场拖垮瓜帅，球迷怒喊：滚回意大利！

澜归序

2026-02-02 06:26:00

神经内科医生提醒：这几种不舒服其实是脑梗，千万别大意，速看！

神经内科医生提醒：这几种不舒服其实是脑梗，千万别大意，速看！

蜉蝣说

2026-02-02 16:29:11

吊儿郎当的结果！当初去勇士要1.1亿，现在600万球员选项都不放弃

吊儿郎当的结果！当初去勇士要1.1亿，现在600万球员选项都不放弃

你的篮球频道

2026-02-02 15:45:50

金融圈传来噩耗！“85后”沈显兵今日去世，享年40岁，其毕业于中科大，在百亿级私募担任合伙人

金融圈传来噩耗！“85后”沈显兵今日去世，享年40岁，其毕业于中科大，在百亿级私募担任合伙人

每日经济新闻

2026-02-02 20:28:12

2026年，家中若有这3个属相，将带动全家运势，赚得盆满钵满！

2026年，家中若有这3个属相，将带动全家运势，赚得盆满钵满！

千秋文化

2025-12-02 10:58:36

朝鲜战争表面上是中国赢得的，但实际上是一个巨大的损失

朝鲜战争表面上是中国赢得的，但实际上是一个巨大的损失

安安说

2026-02-02 12:18:03

袁惟仁去世，那英等多位歌手发文悼念

袁惟仁去世，那英等多位歌手发文悼念

界面新闻

2026-02-02 18:48:43

你有知道哪些炸裂的秘密？网友：我有个秘密说出来肯定大家要笑死

你有知道哪些炸裂的秘密？网友：我有个秘密说出来肯定大家要笑死

带你感受人间冷暖

2026-01-29 00:10:05

恐怖！爱泼斯坦文件继续公布！案板鸡腿之间惊现人类大腿？

恐怖！爱泼斯坦文件继续公布！案板鸡腿之间惊现人类大腿？

魔都囡

2026-02-02 03:03:14

主席“南巡”路上突然返京，密令许世友急调两个师入沪，抓捕……

主席“南巡”路上突然返京，密令许世友急调两个师入沪，抓捕……

野史留根

2024-08-27 22:00:20

生命树：要不是找到多杰的尸骨，白菊到死都不知，林培生的歹毒

生命树：要不是找到多杰的尸骨，白菊到死都不知，林培生的歹毒

何氽简史

2026-02-02 18:25:51

花漾夜雨飘雪

花漾夜雨飘雪

292文章数 59关注度

往期回顾全部

科技要闻

阿里筑墙，腾讯寄生，字节偷家

头条要闻

英国首相身边"中文十级"女星火了：曾参演007系列

头条要闻

英国首相身边"中文十级"女星火了：曾参演007系列

体育要闻

澳网男单决赛，属于阿尔卡拉斯的加冕仪式

娱乐要闻

57岁音乐人袁惟仁去世，家属发文悼念

财经要闻

金银暴跌全球股市遭遇“黑色星期一”

汽车要闻

雷克萨斯LC500将于今年底停产 "最美雷克萨斯"谢幕

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

教育

房产

艺术

本地

旅游

教育要闻

宝妈必学，坏人肆无忌惮的侵犯伤害我们孩子的最核心原因是什么？

房产要闻

狂卖1548亿后，海南又上演疯狂抢地！

艺术要闻

马斯克花5万买的折叠屋，是预制住宅的未来吗？

本地新闻

云游中国｜拨开云雾，巫山每帧都是航拍大片

旅游要闻

人文经济激活消费新动能|古街“活”起来：塞上老街书写文旅消费新故事

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版