网易首页 > 网易号 > 正文 申请入驻

谷歌新发现:DeepSeek推理分裂出多重人格,左右脑互搏越来越聪明

0
分享至

AI 变聪明的真相居然是正在“脑内群聊”?!

谷歌最新研究表明,DeepSeek-R1 这类顶尖推理模型在解题时,内部会自发“分裂”出不同性格的虚拟人格,比如外向的、严谨的、多疑的……

大模型的解题推理过程,就是这些人格一场精彩的社交、辩论会;左右脑互搏 be like:

“这个思路对吗?试试这样验证……”

“不对,之前的假设忽略了 xx 条件”

有意思的是,AI 还越吵越聪明

研究发现,当遇到 GPQA graduate-level 科学问题、复杂数学推导这类高难度任务时,这种内部观点冲突会变得更加激烈。

相比之下,面对布尔表达式、基础逻辑推理等简单任务,模型的脑内对话会明显减少。

模型推理过程就是“左右脑互搏”

团队通过分析 DeepSeek-R1 和 QwQ-32B 等模型的思维轨迹发现,它们的推理过程充满了对话感。

内部分裂出来的虚拟角色不仅性格迥异,还能覆盖更多解题角度。

创意型角色擅长提出新颖思路,批判型角色专注挑错补漏,执行型角色负责落地验证……

通过这些人格的一场交流,不同观点的碰撞能让模型更全面地审视解决方案。

就连网友都说,自己在思考的时候,也会“左右脑互搏”。

不过,这种多角色互动并不是开发人员刻意设计的,而是模型在追求推理准确率的过程中自发形成的。

那么实验是如何证明这一点的呢?

团队借助稀疏自编码器 SAE,对 AI 的推理黑盒进行了深度解码,成功“监听”到了 AI 的脑内群聊。

首先,研究者让 AI 执行复杂的数学或逻辑推理任务。在模型产出思维链的同时,团队同步提取其隐藏层神经元的激活数值。

但此时的数据是由数亿个参数构成的复杂非线性信号,无法直接对应任何语义。

将这些激活数据输入 SAE,通过 SAE 的稀疏约束机制,就可以把杂乱的激活拆解为“自问自答”、“切换视角”等独立的对话语义特征;

通过分析这些特征的激活频率以及它们在时间序列上的协同关系,团队成功识别出了不同的内部逻辑实体。

再给上述特征打上“规划者”、“验证者”等虚拟角色的标签,就成功解码了 AI 内部的多角色对话行为。

“哦!”能让推理更准确

通过对比 DeepSeek-R1 与 DeepSeek-V3、Qwen-2.5-32B-IT 这类普通指令模型的推理轨迹,发现推理模型的对话式行为出现的频率显著更高

这里还有个很有意思的发现 ——“哦!”能让推理更准确

当团队通过激活添加法强化模型的对话特征,放大“哦!”这类表达惊讶、转折的话语标记时,模型在 Countdown 算术推理任务中的准确率直接从 27.1% 翻倍至 54.8%。

更关键的实验证据来自强化学习训练。

研究人员不提供任何对话结构的训练信号,只奖励模型答对题目的行为,结果发现模型会自发学会用对话式思考;

而先通过多智能体对话数据对模型进行微调,再进行推理训练,进步速度会远快于直接训练推理或用独白式推理数据微调的模型。

在 Qwen-2.5-3B 和 Llama-3.2-3B 两个模型体系中,早期训练阶段对话微调模型的准确率比独白微调模型高出 10% 以上,Llama-3.2-3B 到训练后期差距甚至扩大到 22%。

这一发现恰好呼应了人类演化生物学中的著名理论社会脑假说

假说认为人类大脑的进化主要是为了应对复杂的社交关系和群体互动需求。

如今看来,AI 也是一样,为了变聪明,得先会和不同“人格”社交!

本文源自:IT之家

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
车企懵圈!没了补贴“救济粮”,1月份新能源车销量狂跌了67%!

车企懵圈!没了补贴“救济粮”,1月份新能源车销量狂跌了67%!

言车有徐
2026-01-19 19:20:28
卖不动了?钻石价格大跌,巨头宣布:降价!十年前1.8万元买的钻戒,如今只能卖180元,同期黄金价格涨超400%

卖不动了?钻石价格大跌,巨头宣布:降价!十年前1.8万元买的钻戒,如今只能卖180元,同期黄金价格涨超400%

每日经济新闻
2026-01-20 16:22:28
邵佳一迎开门红 国足首秀2-0取胜 国安双星建功 两套阵容各踢半场

邵佳一迎开门红 国足首秀2-0取胜 国安双星建功 两套阵容各踢半场

我爱英超
2026-01-20 23:41:13
亲弟弟强奸追杀妻子,丈夫发声

亲弟弟强奸追杀妻子,丈夫发声

中国新闻周刊
2026-01-20 18:42:33
英政府通过中国使馆新馆舍项目申请

英政府通过中国使馆新馆舍项目申请

界面新闻
2026-01-20 19:05:03
韩媒:中国队疯了,他们的表现比韩国队还好

韩媒:中国队疯了,他们的表现比韩国队还好

懂球帝
2026-01-21 02:19:12
滚出去!中国不是“捡破烂”的:日本混不下去,就想回中方捞金?

滚出去!中国不是“捡破烂”的:日本混不下去,就想回中方捞金?

比利
2026-01-20 14:37:21
人民日报三评西贝关店事件,基本宣告断掉罗永浩今后生路!

人民日报三评西贝关店事件,基本宣告断掉罗永浩今后生路!

玖宇维
2026-01-20 21:52:53
索尼宣布将剥离电视机业务,与中国TCL成立合资公司,TCL持股51%

索尼宣布将剥离电视机业务,与中国TCL成立合资公司,TCL持股51%

鲁中晨报
2026-01-20 21:47:04
接受捐款仅2天,官媒对李亚鹏用了特殊称呼,这次,没给他留体面

接受捐款仅2天,官媒对李亚鹏用了特殊称呼,这次,没给他留体面

阿纂看事
2026-01-20 13:12:13
0-1!越南队主帅被打脸,韩国队出局,中国队机会来了

0-1!越南队主帅被打脸,韩国队出局,中国队机会来了

何老师呀
2026-01-20 21:56:25
极致震撼!“牢A”揭露美国把R头做成“糖霜苹果”悬挂示众

极致震撼!“牢A”揭露美国把R头做成“糖霜苹果”悬挂示众

魔都囡
2026-01-20 10:11:41
人民日报两次点评:贾国龙又认错了,“自我捅刀式闹剧”终结?

人民日报两次点评:贾国龙又认错了,“自我捅刀式闹剧”终结?

穿透
2026-01-20 10:42:32
“90后”曾患唇腭裂网红给李亚鹏捐10万,其曾申请嫣然天使基金帮助,但当时没排上队“我们是天使,不是恶魔”

“90后”曾患唇腭裂网红给李亚鹏捐10万,其曾申请嫣然天使基金帮助,但当时没排上队“我们是天使,不是恶魔”

扬子晚报
2026-01-20 17:53:40
U23国足5分钟2球!向余望世界波,复刻C罗SIU,全队欢庆

U23国足5分钟2球!向余望世界波,复刻C罗SIU,全队欢庆

奥拜尔
2026-01-21 00:48:12
当下,请做好随时失去一切的准备。

当下,请做好随时失去一切的准备。

诗词中国
2026-01-20 20:02:16
49岁翁帆官宣喜讯,太令人惊喜了!

49岁翁帆官宣喜讯,太令人惊喜了!

神奇故事
2026-01-18 21:57:09
俄罗斯人自己先捅破了窗户纸:外蒙古和远东,怕不是要“回家”了

俄罗斯人自己先捅破了窗户纸:外蒙古和远东,怕不是要“回家”了

福建平子
2026-01-20 06:52:46
中国篮坛又爆发大规模冲突!双方互殴大打出手:观众带头揍球员?

中国篮坛又爆发大规模冲突!双方互殴大打出手:观众带头揍球员?

篮球快餐车
2026-01-21 00:52:48
向府治丧,向太陈岚与儿子向佐悲痛致祭,大批警员现场戒备

向府治丧,向太陈岚与儿子向佐悲痛致祭,大批警员现场戒备

揽星河的笔记
2026-01-20 16:21:30
2026-01-21 04:20:49
金融界 incentive-icons
金融界
投资者信赖的财经金融门户网站
9194706文章数 545762关注度
往期回顾 全部

科技要闻

收藏|这可能是CES2026最清醒一份复盘

头条要闻

丹麦首相:主权不谈判 准备贸易战

头条要闻

丹麦首相:主权不谈判 准备贸易战

体育要闻

勇士遭暴击!巴特勒重伤赛季报销

娱乐要闻

网红版闫学晶!600万粉博主阿爆翻车

财经要闻

李迅雷:2026买房不如租房

汽车要闻

奇瑞张贵兵:墨甲不做秀技术的企业 只做痛点终结者

态度原创

手机
数码
本地
艺术
公开课

手机要闻

iQOO 15 Ultra跑分出炉:451万行业最高记录

数码要闻

行业唯一!红魔电竞平板3 Pro GOLDEN SAGA发布:镀金VC、24GB+1TB存储

本地新闻

云游辽宁|漫步千年小城晨昏,“康”复好心情

艺术要闻

陈丹青:困扰几代人的中国写实油画

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版