网易首页 > 网易号 > 正文 申请入驻

谷歌新发现:DeepSeek推理分裂出多重人格,左右脑互搏越来越聪明

0
分享至

AI 变聪明的真相居然是正在“脑内群聊”?!

谷歌最新研究表明,DeepSeek-R1 这类顶尖推理模型在解题时,内部会自发“分裂”出不同性格的虚拟人格,比如外向的、严谨的、多疑的……

大模型的解题推理过程,就是这些人格一场精彩的社交、辩论会;左右脑互搏 be like:

“这个思路对吗?试试这样验证……”

“不对,之前的假设忽略了 xx 条件”

有意思的是,AI 还越吵越聪明

研究发现,当遇到 GPQA graduate-level 科学问题、复杂数学推导这类高难度任务时,这种内部观点冲突会变得更加激烈。

相比之下,面对布尔表达式、基础逻辑推理等简单任务,模型的脑内对话会明显减少。

模型推理过程就是“左右脑互搏”

团队通过分析 DeepSeek-R1 和 QwQ-32B 等模型的思维轨迹发现,它们的推理过程充满了对话感。

内部分裂出来的虚拟角色不仅性格迥异,还能覆盖更多解题角度。

创意型角色擅长提出新颖思路,批判型角色专注挑错补漏,执行型角色负责落地验证……

通过这些人格的一场交流,不同观点的碰撞能让模型更全面地审视解决方案。

就连网友都说,自己在思考的时候,也会“左右脑互搏”。

不过,这种多角色互动并不是开发人员刻意设计的,而是模型在追求推理准确率的过程中自发形成的。

那么实验是如何证明这一点的呢?

团队借助稀疏自编码器 SAE,对 AI 的推理黑盒进行了深度解码,成功“监听”到了 AI 的脑内群聊。

首先,研究者让 AI 执行复杂的数学或逻辑推理任务。在模型产出思维链的同时,团队同步提取其隐藏层神经元的激活数值。

但此时的数据是由数亿个参数构成的复杂非线性信号,无法直接对应任何语义。

将这些激活数据输入 SAE,通过 SAE 的稀疏约束机制,就可以把杂乱的激活拆解为“自问自答”、“切换视角”等独立的对话语义特征;

通过分析这些特征的激活频率以及它们在时间序列上的协同关系,团队成功识别出了不同的内部逻辑实体。

再给上述特征打上“规划者”、“验证者”等虚拟角色的标签,就成功解码了 AI 内部的多角色对话行为。

“哦!”能让推理更准确

通过对比 DeepSeek-R1 与 DeepSeek-V3、Qwen-2.5-32B-IT 这类普通指令模型的推理轨迹,发现推理模型的对话式行为出现的频率显著更高

这里还有个很有意思的发现 ——“哦!”能让推理更准确

当团队通过激活添加法强化模型的对话特征,放大“哦!”这类表达惊讶、转折的话语标记时,模型在 Countdown 算术推理任务中的准确率直接从 27.1% 翻倍至 54.8%。

更关键的实验证据来自强化学习训练。

研究人员不提供任何对话结构的训练信号,只奖励模型答对题目的行为,结果发现模型会自发学会用对话式思考;

而先通过多智能体对话数据对模型进行微调,再进行推理训练,进步速度会远快于直接训练推理或用独白式推理数据微调的模型。

在 Qwen-2.5-3B 和 Llama-3.2-3B 两个模型体系中,早期训练阶段对话微调模型的准确率比独白微调模型高出 10% 以上,Llama-3.2-3B 到训练后期差距甚至扩大到 22%。

这一发现恰好呼应了人类演化生物学中的著名理论社会脑假说

假说认为人类大脑的进化主要是为了应对复杂的社交关系和群体互动需求。

如今看来,AI 也是一样,为了变聪明,得先会和不同“人格”社交!

本文源自:IT之家

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
广西千人老牌外贸大厂突然倒闭,打工人泪目了:起码能结清工资

广西千人老牌外贸大厂突然倒闭,打工人泪目了:起码能结清工资

捣蛋窝
2026-04-26 12:17:07
于海青:为何说广东黄坤明书记理清说清用人标准后让人充满期待?

于海青:为何说广东黄坤明书记理清说清用人标准后让人充满期待?

于海青
2026-04-25 22:59:35
调查发现:每天饭后要午睡的人,不出半年,身体或有这几种改变!

调查发现:每天饭后要午睡的人,不出半年,身体或有这几种改变!

今日养生之道
2026-04-26 15:02:57
这条无耻新闻,引起公愤了!

这条无耻新闻,引起公愤了!

胖胖说他不胖
2026-04-25 14:07:02
恒大集团与特朗普合作往事

恒大集团与特朗普合作往事

地产微资讯
2026-04-24 18:09:33
知名港星癌细胞扩散至脑部,闻到身上有尸臭味,剩四分之一条人命

知名港星癌细胞扩散至脑部,闻到身上有尸臭味,剩四分之一条人命

叨唠
2026-03-15 17:36:49
石明辞职,“亲戚”董宇辉账号评留言高达4.6万,各式各样的都有

石明辞职,“亲戚”董宇辉账号评留言高达4.6万,各式各样的都有

小娱乐悠悠
2026-04-26 10:36:41
郑丽文和家人的一张合影,时间是1971年,地点是眷村。

郑丽文和家人的一张合影,时间是1971年,地点是眷村。

叶老四
2026-04-15 09:44:36
比亚迪海狮08全面预测,20万出头,纯电续航900km,插混纯电400km

比亚迪海狮08全面预测,20万出头,纯电续航900km,插混纯电400km

光电科技君
2026-04-26 01:12:02
蓝莓别搓洗别用盐水泡,老果农教你正确清洗,锁营养虫卵洗干净

蓝莓别搓洗别用盐水泡,老果农教你正确清洗,锁营养虫卵洗干净

开心美食白科
2026-04-22 12:11:57
老烟枪、泼饮料、打亲爹:公交站“禁烟女戏精”用政治正确绑架社会,完成一场完美碰瓷

老烟枪、泼饮料、打亲爹:公交站“禁烟女戏精”用政治正确绑架社会,完成一场完美碰瓷

少爷写春秋
2026-04-25 22:58:18
骑士G4大战猛龙!赛前3大好消息和2大坏消息,内线成胜负关键

骑士G4大战猛龙!赛前3大好消息和2大坏消息,内线成胜负关键

郝小小看体育
2026-04-26 10:06:00
黄岩岛激烈对峙,中方做好最坏打算,美媒:轰6和055已部署

黄岩岛激烈对峙,中方做好最坏打算,美媒:轰6和055已部署

启迪你的思维
2026-04-24 02:35:20
张兰发声!自己要扛起养孙女孙子的责任,内涵马筱梅没有旺三代!

张兰发声!自己要扛起养孙女孙子的责任,内涵马筱梅没有旺三代!

离离言几许
2026-04-25 07:26:48
阵仗是不是太大了!国外博主曝光中国在南海集中庞大双航母战斗群

阵仗是不是太大了!国外博主曝光中国在南海集中庞大双航母战斗群

阿龙聊军事
2026-04-24 21:26:53
尤伯杯:中国5-0东道主!王祉怡首秀降维打击,韩悦灭丹麦一姐

尤伯杯:中国5-0东道主!王祉怡首秀降维打击,韩悦灭丹麦一姐

钉钉陌上花开
2026-04-26 06:39:56
随着上海海港4-0,北京国安2-4,成都蓉城4-0,中超最新积分榜出炉

随着上海海港4-0,北京国安2-4,成都蓉城4-0,中超最新积分榜出炉

侧身凌空斩
2026-04-25 21:59:26
滤镜碎了!王玉雯苏州生图惹众怒:不靠精修太犯规

滤镜碎了!王玉雯苏州生图惹众怒:不靠精修太犯规

动物奇奇怪怪
2026-04-26 14:41:58
女子吐槽“老公养的盆栽”,太丑了,网友:不懂,别乱说话

女子吐槽“老公养的盆栽”,太丑了,网友:不懂,别乱说话

观察鉴娱
2026-04-19 16:03:01
我有罪,大导演昆汀花1万美金,在包房舔脚半小时,直到皮肤起皱

我有罪,大导演昆汀花1万美金,在包房舔脚半小时,直到皮肤起皱

西楼知趣杂谈
2026-04-20 08:40:47
2026-04-26 16:35:00
金融界 incentive-icons
金融界
投资者信赖的财经金融门户网站
9194706文章数 546273关注度
往期回顾 全部

科技要闻

涨价浪潮下,DeepSeek推动AI“价格战”

头条要闻

伊朗拒见美代表转赴阿曼 特朗普怒撤行程

头条要闻

伊朗拒见美代表转赴阿曼 特朗普怒撤行程

体育要闻

森林狼3比1掘金:逆境中杀出了多孙穆?!

娱乐要闻

《八千里路云和月》大结局意难平

财经要闻

DeepSeek V4背后,梁文锋的转身

汽车要闻

预售19.38万元起 哈弗猛龙PLUS七座版亮相

态度原创

教育
时尚
亲子
手机
数码

教育要闻

麻省理工公开课19:吉尔伯特教授线性代数课-

IU的脸,真的有自己的时间线

亲子要闻

别再瞎买婴儿洗护了!老爸抽检过的这5件,直接抄作业!

手机要闻

W16周:华为无敌手,苹果持续第二,OPPO变第三

数码要闻

京东“Aidol创造营”计划正式启动 面向全球孵化101个AI硬件新物种

无障碍浏览 进入关怀版