网易首页 > 网易号 > 正文 申请入驻

谷歌新发现:DeepSeek推理分裂出多重人格,左右脑互搏越来越聪明

0
分享至

AI 变聪明的真相居然是正在“脑内群聊”?!

谷歌最新研究表明,DeepSeek-R1 这类顶尖推理模型在解题时,内部会自发“分裂”出不同性格的虚拟人格,比如外向的、严谨的、多疑的……

大模型的解题推理过程,就是这些人格一场精彩的社交、辩论会;左右脑互搏 be like:

“这个思路对吗?试试这样验证……”

“不对,之前的假设忽略了 xx 条件”

有意思的是,AI 还越吵越聪明

研究发现,当遇到 GPQA graduate-level 科学问题、复杂数学推导这类高难度任务时,这种内部观点冲突会变得更加激烈。

相比之下,面对布尔表达式、基础逻辑推理等简单任务,模型的脑内对话会明显减少。

模型推理过程就是“左右脑互搏”

团队通过分析 DeepSeek-R1 和 QwQ-32B 等模型的思维轨迹发现,它们的推理过程充满了对话感。

内部分裂出来的虚拟角色不仅性格迥异,还能覆盖更多解题角度。

创意型角色擅长提出新颖思路,批判型角色专注挑错补漏,执行型角色负责落地验证……

通过这些人格的一场交流,不同观点的碰撞能让模型更全面地审视解决方案。

就连网友都说,自己在思考的时候,也会“左右脑互搏”。

不过,这种多角色互动并不是开发人员刻意设计的,而是模型在追求推理准确率的过程中自发形成的。

那么实验是如何证明这一点的呢?

团队借助稀疏自编码器 SAE,对 AI 的推理黑盒进行了深度解码,成功“监听”到了 AI 的脑内群聊。

首先,研究者让 AI 执行复杂的数学或逻辑推理任务。在模型产出思维链的同时,团队同步提取其隐藏层神经元的激活数值。

但此时的数据是由数亿个参数构成的复杂非线性信号,无法直接对应任何语义。

将这些激活数据输入 SAE,通过 SAE 的稀疏约束机制,就可以把杂乱的激活拆解为“自问自答”、“切换视角”等独立的对话语义特征;

通过分析这些特征的激活频率以及它们在时间序列上的协同关系,团队成功识别出了不同的内部逻辑实体。

再给上述特征打上“规划者”、“验证者”等虚拟角色的标签,就成功解码了 AI 内部的多角色对话行为。

“哦!”能让推理更准确

通过对比 DeepSeek-R1 与 DeepSeek-V3、Qwen-2.5-32B-IT 这类普通指令模型的推理轨迹,发现推理模型的对话式行为出现的频率显著更高

这里还有个很有意思的发现 ——“哦!”能让推理更准确

当团队通过激活添加法强化模型的对话特征,放大“哦!”这类表达惊讶、转折的话语标记时,模型在 Countdown 算术推理任务中的准确率直接从 27.1% 翻倍至 54.8%。

更关键的实验证据来自强化学习训练。

研究人员不提供任何对话结构的训练信号,只奖励模型答对题目的行为,结果发现模型会自发学会用对话式思考;

而先通过多智能体对话数据对模型进行微调,再进行推理训练,进步速度会远快于直接训练推理或用独白式推理数据微调的模型。

在 Qwen-2.5-3B 和 Llama-3.2-3B 两个模型体系中,早期训练阶段对话微调模型的准确率比独白微调模型高出 10% 以上,Llama-3.2-3B 到训练后期差距甚至扩大到 22%。

这一发现恰好呼应了人类演化生物学中的著名理论社会脑假说

假说认为人类大脑的进化主要是为了应对复杂的社交关系和群体互动需求。

如今看来,AI 也是一样,为了变聪明,得先会和不同“人格”社交!

本文源自:IT之家

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
美国发现一个“秘密”:每次对华加征关税,中国就去找非洲,为何

美国发现一个“秘密”:每次对华加征关税,中国就去找非洲,为何

孤城落日
2026-04-21 13:15:06
不到24小时,日本面临双重麻烦,高市陷绝境:连个能帮忙的都没有

不到24小时,日本面临双重麻烦,高市陷绝境:连个能帮忙的都没有

椰青美食分享
2026-04-21 17:45:03
成都人注意了!这两个区域将有大动作,未来会成为成都顶流

成都人注意了!这两个区域将有大动作,未来会成为成都顶流

科学发掘
2026-04-22 06:59:51
王健林交出心头肉!接盘万达电影的80后,是个怎样的狠角色?

王健林交出心头肉!接盘万达电影的80后,是个怎样的狠角色?

北向财经
2026-04-21 20:59:15
陕西长武突降暴雪!网友一句“老天爷你怎么了”,道尽果农的崩溃

陕西长武突降暴雪!网友一句“老天爷你怎么了”,道尽果农的崩溃

火山詩话
2026-04-22 07:48:10
巴萨紧急声明:已下架不当图片内容

巴萨紧急声明:已下架不当图片内容

南方都市报
2026-04-21 23:13:50
政治上封杀,文化上封神

政治上封杀,文化上封神

最爱历史
2026-04-20 13:07:36
刘芳菲:一条裤子穿十七年,丈夫去世后,如今49岁与猫为伴

刘芳菲:一条裤子穿十七年,丈夫去世后,如今49岁与猫为伴

凡知
2026-04-22 08:55:23
特鲁姆普:对阵威尔逊很棘手,今年世锦赛赵心童奥沙利文更被看好

特鲁姆普:对阵威尔逊很棘手,今年世锦赛赵心童奥沙利文更被看好

世界体坛观察家
2026-04-22 07:59:56
浓烟滚滚和红红火火:乌克兰接连击中重要目标!俄情报部门进步了

浓烟滚滚和红红火火:乌克兰接连击中重要目标!俄情报部门进步了

鹰眼Defence
2026-04-21 17:49:49
4月22日人民币对美元中间价调贬41个基点

4月22日人民币对美元中间价调贬41个基点

证券时报
2026-04-22 09:32:11
明明只是戏子,却把自己当大腕,论“耍大牌”,这5位明星够丢人

明明只是戏子,却把自己当大腕,论“耍大牌”,这5位明星够丢人

做一个合格的吃瓜群众
2026-04-21 16:14:06
口碑崩塌后急着脱身?41岁张翰带病现身移民局,真实目的耐人寻味

口碑崩塌后急着脱身?41岁张翰带病现身移民局,真实目的耐人寻味

白面书誏
2026-04-21 17:18:35
中国汽车市场份额:法系0.2%,韩系1%,美系6.9%,日系13%

中国汽车市场份额:法系0.2%,韩系1%,美系6.9%,日系13%

狐狸先森讲升学规划
2026-04-21 09:30:03
重磅消息爆出,科尔勇士生涯前景愈发渺茫,离队几乎已成定局

重磅消息爆出,科尔勇士生涯前景愈发渺茫,离队几乎已成定局

夜白侃球
2026-04-22 08:52:33
不比不知道,一比吓一跳!苏林回国后很焦虑:原来我们落后这么多

不比不知道,一比吓一跳!苏林回国后很焦虑:原来我们落后这么多

南宗历史
2026-04-21 21:11:54
多名院士调查发现:吃一口放久变软的香蕉,或等于进一次毒?真假

多名院士调查发现:吃一口放久变软的香蕉,或等于进一次毒?真假

今日养生之道
2026-04-21 00:21:19
重磅消息!继歼10后,中国又拿下史上最大军售,印度十年都追不上

重磅消息!继歼10后,中国又拿下史上最大军售,印度十年都追不上

阿校谈史
2026-04-22 04:23:20
广东宏今日早报!徐杰最新伤情,萨姆纳无缘季后赛,麦考尔做保养

广东宏今日早报!徐杰最新伤情,萨姆纳无缘季后赛,麦考尔做保养

多特体育说
2026-04-22 09:40:37
山东乳山银滩“195平米复式房”1万元起拍,已有多人竞价,拍卖公司:产证面积97.94平米,另有赠送面积,非法拍可随时过户

山东乳山银滩“195平米复式房”1万元起拍,已有多人竞价,拍卖公司:产证面积97.94平米,另有赠送面积,非法拍可随时过户

极目新闻
2026-04-19 14:06:31
2026-04-22 10:11:00
金融界 incentive-icons
金融界
投资者信赖的财经金融门户网站
9194706文章数 546238关注度
往期回顾 全部

科技要闻

凌晨突发!ChatGPT Images 2.0发布

头条要闻

牛弹琴:伊朗发出让人毛骨悚然的警告 玩的就是心跳

头条要闻

牛弹琴:伊朗发出让人毛骨悚然的警告 玩的就是心跳

体育要闻

一到NBA季后赛,四届DPOY就成了主角

娱乐要闻

宋承炫晒宝宝B超照,宣布老婆怀孕

财经要闻

伊朗拒绝出席 特朗普宣布延长停火期限

汽车要闻

全新坦克700正式上市 售价42.8万-50.8万元

态度原创

本地
家居
旅游
艺术
军事航空

本地新闻

春色满城关不住|白鹃梅浪漫盛放,吴山藏了一片四月雪

家居要闻

诗意光影 窥见自然之境

旅游要闻

文旅铺就千年侗寨致富路

艺术要闻

郑丽文平底鞋成焦点!宋楚瑜马英九书法争议引发网友热议!

军事要闻

特朗普宣布延长停火 伊朗表态

无障碍浏览 进入关怀版