网易首页 > 网易号 > 正文 申请入驻

谷歌新发现:DeepSeek推理分裂出多重人格,左右脑互搏越来越聪明

0
分享至

闻乐 发自 凹非寺
量子位 | 公众号 QbitAI

AI变聪明的真相居然是正在“脑内群聊”?!

谷歌最新研究表明,DeepSeek-R1这类顶尖推理模型在解题时,内部会自发“分裂”出不同性格的虚拟人格,比如外向的、严谨的、多疑的……

大模型的解题推理过程,就是这些人格一场精彩的社交、辩论会;左右脑互搏be like:

“这个思路对吗?试试这样验证……”
“不对,之前的假设忽略了xx条件”



有意思的是,AI还越吵越聪明

研究发现,当遇到GPQA graduate-level科学问题、复杂数学推导这类高难度任务时,这种内部观点冲突会变得更加激烈。

相比之下,面对布尔表达式、基础逻辑推理等简单任务,模型的脑内对话会明显减少。



模型推理过程就是“左右脑互搏”

团队通过分析DeepSeek-R1和QwQ-32B等模型的思维轨迹发现,它们的推理过程充满了对话感。

内部分裂出来的虚拟角色不仅性格迥异,还能覆盖更多解题角度。

创意型角色擅长提出新颖思路,批判型角色专注挑错补漏,执行型角色负责落地验证……



通过这些人格的一场交流,不同观点的碰撞能让模型更全面地审视解决方案。

就连网友都说,自己在思考的时候,也会“左右脑互搏”。



不过,这种多角色互动并不是开发人员刻意设计的,而是模型在追求推理准确率的过程中自发形成的。

那么实验是如何证明这一点的呢?



团队借助稀疏自编码器SAE,对AI的推理黑盒进行了深度解码,成功“监听”到了AI的脑内群聊。

首先,研究者让AI执行复杂的数学或逻辑推理任务。在模型产出思维链的同时,团队同步提取其隐藏层神经元的激活数值。

但此时的数据是由数亿个参数构成的复杂非线性信号,无法直接对应任何语义。

将这些激活数据输入SAE,通过SAE的稀疏约束机制,就可以把杂乱的激活拆解为“自问自答”、“切换视角”等独立的对话语义特征;

通过分析这些特征的激活频率以及它们在时间序列上的协同关系,团队成功识别出了不同的内部逻辑实体。

再给上述特征打上“规划者”、“验证者”等虚拟角色的标签,就成功解码了AI内部的多角色对话行为。

“哦!”能让推理更准确

通过对比DeepSeek-R1与DeepSeek-V3、Qwen-2.5-32B-IT这类普通指令模型的推理轨迹,发现推理模型的对话式行为出现的频率显著更高



这里还有个很有意思的发现——

“哦!”能让推理更准确。

当团队通过激活添加法强化模型的对话特征,放大“哦!”这类表达惊讶、转折的话语标记时,模型在Countdown算术推理任务中的准确率直接从27.1%翻倍至54.8%。



更关键的实验证据来自强化学习训练。

研究人员不提供任何对话结构的训练信号,只奖励模型答对题目的行为,结果发现模型会自发学会用对话式思考;

而先通过多智能体对话数据对模型进行微调,再进行推理训练,进步速度会远快于直接训练推理或用独白式推理数据微调的模型。

在Qwen-2.5-3B和Llama-3.2-3B两个模型体系中,早期训练阶段对话微调模型的准确率比独白微调模型高出10%以上,Llama-3.2-3B到训练后期差距甚至扩大到22%。



这一发现恰好呼应了人类演化生物学中的著名理论社会脑假说

假说认为人类大脑的进化主要是为了应对复杂的社交关系和群体互动需求。

如今看来,AI也是一样,为了变聪明,得先会和不同“人格”社交!

论文地址:https://arxiv.org/abs/2601.10825
参考链接:https://x.com/sebkrier/status/2013331596863041731

— 完 —

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
叶文斌已被成功救出,但主动从事诈骗活动的他怕是要坐牢

叶文斌已被成功救出,但主动从事诈骗活动的他怕是要坐牢

映射生活的身影
2026-01-19 22:32:27
朗朗爱妻吉娜怀二胎7月状态绝,只长肚子四肢依旧纤细。

朗朗爱妻吉娜怀二胎7月状态绝,只长肚子四肢依旧纤细。

岁月有情1314
2026-01-19 14:22:46
地球出现6小时特大地磁暴

地球出现6小时特大地磁暴

界面新闻
2026-01-20 16:51:30
汽车圈“大地震”!比亚迪大将投奔行业巨头,叫嚣:三年内没对手

汽车圈“大地震”!比亚迪大将投奔行业巨头,叫嚣:三年内没对手

长星寄明月
2026-01-20 21:00:46
日本政坛巨震!166票封喉,公明党倒戈,高市时代终结,中方回应

日本政坛巨震!166票封喉,公明党倒戈,高市时代终结,中方回应

墨印斋
2026-01-19 10:19:23
弘一法师:人一旦死了,生前的衣服,睡过的床......都会被处理掉

弘一法师:人一旦死了,生前的衣服,睡过的床......都会被处理掉

诗词中国
2025-12-04 19:18:40
AI应用大牛股,明日复牌!

AI应用大牛股,明日复牌!

中国基金报
2026-01-20 21:44:37
谁是广东省卫健委下属规模最大的医院?

谁是广东省卫健委下属规模最大的医院?

王晓爱体彩
2026-01-20 10:34:01
英国宣布通过中国驻英国使馆新馆舍的规划审批

英国宣布通过中国驻英国使馆新馆舍的规划审批

澎湃新闻
2026-01-20 20:17:03
樊振东也没想到,心中这口恶气竟被乒协主席出了,张继科没说错

樊振东也没想到,心中这口恶气竟被乒协主席出了,张继科没说错

白面书誏
2026-01-19 19:38:15
日债史诗级崩盘,华尔街:日本央行要“紧急救市”了?

日债史诗级崩盘,华尔街:日本央行要“紧急救市”了?

华尔街见闻官方
2026-01-20 17:02:21
美国为何注定出局?这场终极竞争,中国要的不是第一,而是唯一

美国为何注定出局?这场终极竞争,中国要的不是第一,而是唯一

远方风林
2025-12-23 21:09:27
局势恶化,百架F-35集结琉球,美军要搞突袭?上千艘中国船已列阵

局势恶化,百架F-35集结琉球,美军要搞突袭?上千艘中国船已列阵

沧海旅行家
2026-01-20 13:31:16
“高利贷”开始被拔网线了

“高利贷”开始被拔网线了

新金融洛书
2026-01-20 10:40:12
江苏降雪致部分道路结冰打滑,南京有车主称“开了5分钟还在原地”,常州一上午接诊交通事故和摔伤患者超120人

江苏降雪致部分道路结冰打滑,南京有车主称“开了5分钟还在原地”,常州一上午接诊交通事故和摔伤患者超120人

极目新闻
2026-01-20 17:29:35
张子强家人现状曝光:遗孀携20亿定居泰国,大儿子成了餐厅厨师

张子强家人现状曝光:遗孀携20亿定居泰国,大儿子成了餐厅厨师

谈史论天地
2026-01-20 16:40:58
加拿大想要空手套白狼,总理访华一次,就要带走中国压箱底的技术

加拿大想要空手套白狼,总理访华一次,就要带走中国压箱底的技术

小陈讲史
2026-01-20 15:20:36
开拓者官方:球队将杨瀚森下放至G联盟撕裂之城混音队

开拓者官方:球队将杨瀚森下放至G联盟撕裂之城混音队

北青网-北京青年报
2026-01-20 07:34:03
上海保姆15年死拿紫金矿业:79万变960万,还赚了83万分红

上海保姆15年死拿紫金矿业:79万变960万,还赚了83万分红

真实人物采访
2026-01-03 13:00:03
贝克汉姆儿媳晒娘家5.3亿庄园,70岁超模母亲也很美,碾压了婆家

贝克汉姆儿媳晒娘家5.3亿庄园,70岁超模母亲也很美,碾压了婆家

笑傲春秋
2026-01-20 13:52:11
2026-01-20 22:23:00
量子位 incentive-icons
量子位
追踪人工智能动态
12038文章数 176360关注度
往期回顾 全部

科技要闻

收藏|这可能是CES2026最清醒一份复盘

头条要闻

李亚鹏:暂时谢绝大家到医院参观 会公布捐款用途

头条要闻

李亚鹏:暂时谢绝大家到医院参观 会公布捐款用途

体育要闻

新的时代!东契奇首夺全明星票王 詹姆斯落选首发

娱乐要闻

贝克汉姆长子发文决裂:全家都在演戏

财经要闻

李迅雷:2026买房不如租房

汽车要闻

奇瑞张贵兵:墨甲不做秀技术的企业 只做痛点终结者

态度原创

旅游
家居
房产
手机
军事航空

旅游要闻

新加坡以艺术开启2026年的文旅盛宴

家居要闻

隽永之章 清雅无尘

房产要闻

中旅・三亚蓝湾发布会揭秘自贸港好房子高阶形态

手机要闻

一加16系列再次被确认:200Hz+两亿像素,且四机齐发!

军事要闻

德军13人前脚刚走 荷兰2名军人也撤离格陵兰岛

无障碍浏览 进入关怀版