网易首页 > 网易号 > 正文 申请入驻

谷歌新发现:DeepSeek推理分裂出多重人格,左右脑互搏越来越聪明

0
分享至

AI 变聪明的真相居然是正在“脑内群聊”?!

谷歌最新研究表明,DeepSeek-R1 这类顶尖推理模型在解题时,内部会自发“分裂”出不同性格的虚拟人格,比如外向的、严谨的、多疑的……

大模型的解题推理过程,就是这些人格一场精彩的社交、辩论会;左右脑互搏 be like:

“这个思路对吗?试试这样验证……”

“不对,之前的假设忽略了 xx 条件”

有意思的是,AI 还越吵越聪明

研究发现,当遇到 GPQA graduate-level 科学问题、复杂数学推导这类高难度任务时,这种内部观点冲突会变得更加激烈。

相比之下,面对布尔表达式、基础逻辑推理等简单任务,模型的脑内对话会明显减少。

模型推理过程就是“左右脑互搏”

团队通过分析 DeepSeek-R1 和 QwQ-32B 等模型的思维轨迹发现,它们的推理过程充满了对话感。

内部分裂出来的虚拟角色不仅性格迥异,还能覆盖更多解题角度。

创意型角色擅长提出新颖思路,批判型角色专注挑错补漏,执行型角色负责落地验证……

通过这些人格的一场交流,不同观点的碰撞能让模型更全面地审视解决方案。

就连网友都说,自己在思考的时候,也会“左右脑互搏”。

不过,这种多角色互动并不是开发人员刻意设计的,而是模型在追求推理准确率的过程中自发形成的。

那么实验是如何证明这一点的呢?

团队借助稀疏自编码器 SAE,对 AI 的推理黑盒进行了深度解码,成功“监听”到了 AI 的脑内群聊。

首先,研究者让 AI 执行复杂的数学或逻辑推理任务。在模型产出思维链的同时,团队同步提取其隐藏层神经元的激活数值。

但此时的数据是由数亿个参数构成的复杂非线性信号,无法直接对应任何语义。

将这些激活数据输入 SAE,通过 SAE 的稀疏约束机制,就可以把杂乱的激活拆解为“自问自答”、“切换视角”等独立的对话语义特征;

通过分析这些特征的激活频率以及它们在时间序列上的协同关系,团队成功识别出了不同的内部逻辑实体。

再给上述特征打上“规划者”、“验证者”等虚拟角色的标签,就成功解码了 AI 内部的多角色对话行为。

“哦!”能让推理更准确

通过对比 DeepSeek-R1 与 DeepSeek-V3、Qwen-2.5-32B-IT 这类普通指令模型的推理轨迹,发现推理模型的对话式行为出现的频率显著更高

这里还有个很有意思的发现 ——“哦!”能让推理更准确

当团队通过激活添加法强化模型的对话特征,放大“哦!”这类表达惊讶、转折的话语标记时,模型在 Countdown 算术推理任务中的准确率直接从 27.1% 翻倍至 54.8%。

更关键的实验证据来自强化学习训练。

研究人员不提供任何对话结构的训练信号,只奖励模型答对题目的行为,结果发现模型会自发学会用对话式思考;

而先通过多智能体对话数据对模型进行微调,再进行推理训练,进步速度会远快于直接训练推理或用独白式推理数据微调的模型。

在 Qwen-2.5-3B 和 Llama-3.2-3B 两个模型体系中,早期训练阶段对话微调模型的准确率比独白微调模型高出 10% 以上,Llama-3.2-3B 到训练后期差距甚至扩大到 22%。

这一发现恰好呼应了人类演化生物学中的著名理论社会脑假说

假说认为人类大脑的进化主要是为了应对复杂的社交关系和群体互动需求。

如今看来,AI 也是一样,为了变聪明,得先会和不同“人格”社交!

本文源自:IT之家

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
阿瑙托维奇:因疫情在中国隔离至抑郁,最终选择重返欧洲

阿瑙托维奇:因疫情在中国隔离至抑郁,最终选择重返欧洲

懂球帝
2026-04-23 08:32:10
比亚迪在马来西亚的东盟首个整车基地已全面停工,项目陷入僵局

比亚迪在马来西亚的东盟首个整车基地已全面停工,项目陷入僵局

流苏晚晴
2026-04-22 19:05:45
斯诺克世锦赛16强对阵!丁俊晖战赵心童时间曝光,吴宜泽PK塞尔比

斯诺克世锦赛16强对阵!丁俊晖战赵心童时间曝光,吴宜泽PK塞尔比

曹说体育
2026-04-23 11:39:25
伊朗舰艇护送一散货船进入领海

伊朗舰艇护送一散货船进入领海

财联社
2026-04-24 06:46:03
稳居前四却埋满雷!北京男篮的季后赛,真的悬了!

稳居前四却埋满雷!北京男篮的季后赛,真的悬了!

林子说事
2026-04-24 07:34:54
有没有人敢爆自己的瓜?网友:确定玩这么大吗?

有没有人敢爆自己的瓜?网友:确定玩这么大吗?

夜深爱杂谈
2026-02-18 20:55:58
中国09IIIB新型核潜艇或已服役,水下垂发鹰击18导弹画面首次公开

中国09IIIB新型核潜艇或已服役,水下垂发鹰击18导弹画面首次公开

奥字侃剧
2026-04-24 07:15:55
在小公司上班是什么体验?网友:可以避免自己有创业的想法

在小公司上班是什么体验?网友:可以避免自己有创业的想法

带你感受人间冷暖
2026-04-23 22:06:26
划清界限!高云翔憔悴发声撇清张婉婷,不留情面,一句话暗含深意

划清界限!高云翔憔悴发声撇清张婉婷,不留情面,一句话暗含深意

阿握聊事
2026-04-24 00:23:37
切尔西惨败,球迷呼吁穆帅第3次执教蓝军,切尔西管理层无动于衷

切尔西惨败,球迷呼吁穆帅第3次执教蓝军,切尔西管理层无动于衷

福酱的小时光
2026-04-24 08:00:53
何洁参加婚礼,无修图下好黑,个子不高腿粗,翘着二郎腿太拽了!

何洁参加婚礼,无修图下好黑,个子不高腿粗,翘着二郎腿太拽了!

小娱乐悠悠
2026-04-24 09:20:33
世上最失败4大工程:损失惨重,中国占俩!却说有意料之外效果?

世上最失败4大工程:损失惨重,中国占俩!却说有意料之外效果?

三毛看世界
2026-04-17 16:43:17
窜访取消后,赖清德无能狂怒,马达加斯加表态,民进党彻底破防

窜访取消后,赖清德无能狂怒,马达加斯加表态,民进党彻底破防

影孖看世界
2026-04-22 23:28:19
一夜3大消息!湖人重大利好,卫冕冠军遭打击,杜兰特又添新伤

一夜3大消息!湖人重大利好,卫冕冠军遭打击,杜兰特又添新伤

体坛小李
2026-04-24 07:27:51
3岁男童在游乐中心遭陌生男子袭击致下体受伤,缝合6针,警方已立案;涉事店家:疑因小朋友争执引发家长伤人,已垫付医药费并配合调查

3岁男童在游乐中心遭陌生男子袭击致下体受伤,缝合6针,警方已立案;涉事店家:疑因小朋友争执引发家长伤人,已垫付医药费并配合调查

都市快报橙柿互动
2026-04-24 08:01:43
死了这条心!人民日报摊牌:中国不会救菲律宾,马科斯投机到头了

死了这条心!人民日报摊牌:中国不会救菲律宾,马科斯投机到头了

谛听骨语本尊
2026-04-23 23:15:34
恩情还不完!员工病重想辞职 G胖当场拒批:带薪养病

恩情还不完!员工病重想辞职 G胖当场拒批:带薪养病

游民星空
2026-04-21 11:51:12
吃相越来越难看,终于引起公愤了!

吃相越来越难看,终于引起公愤了!

胖胖说他不胖
2026-04-23 09:00:33
沙特媒:迪拜国民全队仍在沙特等待亚足联回复;球队申诉重赛

沙特媒:迪拜国民全队仍在沙特等待亚足联回复;球队申诉重赛

懂球帝
2026-04-24 01:59:08
孙杨张豆豆相处太累,男方要人哄女方不撒娇,网友直言二人不适合

孙杨张豆豆相处太累,男方要人哄女方不撒娇,网友直言二人不适合

萌神木木
2026-04-23 17:20:57
2026-04-24 09:52:49
金融界 incentive-icons
金融界
投资者信赖的财经金融门户网站
9194706文章数 546253关注度
往期回顾 全部

科技要闻

凌晨突发!GPT-5.5正式上线:跑分更猛

头条要闻

用了16年的学位证"失效"男子举报自己 高校最新通报

头条要闻

用了16年的学位证"失效"男子举报自己 高校最新通报

体育要闻

给文班剃头的马刺DJ,成为NBA最佳第六人

娱乐要闻

王大陆因涉黑讨债被判 女友也一同获刑

财经要闻

19家企业要"铝代铜",格力偏不

汽车要闻

预售30.29万起 岚图泰山X8配896线激光雷达

态度原创

艺术
旅游
数码
公开课
军事航空

艺术要闻

江青对联惊艳众人,书法与写字的界限究竟在哪?

旅游要闻

一城烟火映齐鲁 三脉共燃向未来

数码要闻

重磅回归!当贝超级盒子正式开启预约 4月27日全网开售

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

美伊陷入互相封锁僵局

无障碍浏览 进入关怀版