网易首页 > 网易号 > 正文 申请入驻

谷歌新发现:DeepSeek推理分裂出多重人格,左右脑互搏越来越聪明

0
分享至

AI 变聪明的真相居然是正在“脑内群聊”?!

谷歌最新研究表明,DeepSeek-R1 这类顶尖推理模型在解题时,内部会自发“分裂”出不同性格的虚拟人格,比如外向的、严谨的、多疑的……

大模型的解题推理过程,就是这些人格一场精彩的社交、辩论会;左右脑互搏 be like:

“这个思路对吗?试试这样验证……”

“不对,之前的假设忽略了 xx 条件”

有意思的是,AI 还越吵越聪明

研究发现,当遇到 GPQA graduate-level 科学问题、复杂数学推导这类高难度任务时,这种内部观点冲突会变得更加激烈。

相比之下,面对布尔表达式、基础逻辑推理等简单任务,模型的脑内对话会明显减少。

模型推理过程就是“左右脑互搏”

团队通过分析 DeepSeek-R1 和 QwQ-32B 等模型的思维轨迹发现,它们的推理过程充满了对话感。

内部分裂出来的虚拟角色不仅性格迥异,还能覆盖更多解题角度。

创意型角色擅长提出新颖思路,批判型角色专注挑错补漏,执行型角色负责落地验证……

通过这些人格的一场交流,不同观点的碰撞能让模型更全面地审视解决方案。

就连网友都说,自己在思考的时候,也会“左右脑互搏”。

不过,这种多角色互动并不是开发人员刻意设计的,而是模型在追求推理准确率的过程中自发形成的。

那么实验是如何证明这一点的呢?

团队借助稀疏自编码器 SAE,对 AI 的推理黑盒进行了深度解码,成功“监听”到了 AI 的脑内群聊。

首先,研究者让 AI 执行复杂的数学或逻辑推理任务。在模型产出思维链的同时,团队同步提取其隐藏层神经元的激活数值。

但此时的数据是由数亿个参数构成的复杂非线性信号,无法直接对应任何语义。

将这些激活数据输入 SAE,通过 SAE 的稀疏约束机制,就可以把杂乱的激活拆解为“自问自答”、“切换视角”等独立的对话语义特征;

通过分析这些特征的激活频率以及它们在时间序列上的协同关系,团队成功识别出了不同的内部逻辑实体。

再给上述特征打上“规划者”、“验证者”等虚拟角色的标签,就成功解码了 AI 内部的多角色对话行为。

“哦!”能让推理更准确

通过对比 DeepSeek-R1 与 DeepSeek-V3、Qwen-2.5-32B-IT 这类普通指令模型的推理轨迹,发现推理模型的对话式行为出现的频率显著更高

这里还有个很有意思的发现 ——“哦!”能让推理更准确

当团队通过激活添加法强化模型的对话特征,放大“哦!”这类表达惊讶、转折的话语标记时,模型在 Countdown 算术推理任务中的准确率直接从 27.1% 翻倍至 54.8%。

更关键的实验证据来自强化学习训练。

研究人员不提供任何对话结构的训练信号,只奖励模型答对题目的行为,结果发现模型会自发学会用对话式思考;

而先通过多智能体对话数据对模型进行微调,再进行推理训练,进步速度会远快于直接训练推理或用独白式推理数据微调的模型。

在 Qwen-2.5-3B 和 Llama-3.2-3B 两个模型体系中,早期训练阶段对话微调模型的准确率比独白微调模型高出 10% 以上,Llama-3.2-3B 到训练后期差距甚至扩大到 22%。

这一发现恰好呼应了人类演化生物学中的著名理论社会脑假说

假说认为人类大脑的进化主要是为了应对复杂的社交关系和群体互动需求。

如今看来,AI 也是一样,为了变聪明,得先会和不同“人格”社交!

本文源自:IT之家

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
张豆豆曝孙杨干涉自己交友:他被好几个朋友重创过

张豆豆曝孙杨干涉自己交友:他被好几个朋友重创过

懂球帝
2026-04-17 10:55:07
掘金再输森林狼自讨苦吃!湖人收获1喜1忧,G3该他为詹姆斯分忧了

掘金再输森林狼自讨苦吃!湖人收获1喜1忧,G3该他为詹姆斯分忧了

小路看球
2026-04-24 14:38:15
今年大师赛丢的第二盘,辛纳2-1逆转邦齐晋级马德里大师赛第三轮

今年大师赛丢的第二盘,辛纳2-1逆转邦齐晋级马德里大师赛第三轮

懂球帝
2026-04-25 00:48:09
国米无缘提前4轮夺冠!那不勒斯4-0差榜首9分,3队争四有变数

国米无缘提前4轮夺冠!那不勒斯4-0差榜首9分,3队争四有变数

体育知多少
2026-04-25 07:59:39
谢谢谢娜,贡献出26年内娱的第一个笑话!

谢谢谢娜,贡献出26年内娱的第一个笑话!

娱乐圈笔娱君
2026-03-04 14:03:54
失业后在小县城的两年发现,打麻将和性生活才是普通人底色!

失业后在小县城的两年发现,打麻将和性生活才是普通人底色!

黯泉
2026-04-01 17:44:20
火湖G3,湖人该让一场?若横扫火箭,挑战雷霆,或难凑齐完整阵容

火湖G3,湖人该让一场?若横扫火箭,挑战雷霆,或难凑齐完整阵容

熊哥爱篮球
2026-04-24 22:30:38
局势改写!韩国瑜大获全胜,郑丽文才是关键?朱立伦落败原因曝光

局势改写!韩国瑜大获全胜,郑丽文才是关键?朱立伦落败原因曝光

小嵩
2026-04-25 05:08:17
砍掉26号线:一鲸落万物生?

砍掉26号线:一鲸落万物生?

吃货的分享
2026-04-24 06:36:51
何塞·穆里尼奥确认“皇马条款”,重燃回归伯纳乌传闻

何塞·穆里尼奥确认“皇马条款”,重燃回归伯纳乌传闻

绿茵情报局
2026-04-25 01:20:20
印度这次被狠狠宰了!天价买尿素,935美元一吨,比中国贵4倍

印度这次被狠狠宰了!天价买尿素,935美元一吨,比中国贵4倍

轩逸阿II
2026-04-25 02:09:41
大老师,这也太美了!

大老师,这也太美了!

贵圈真乱
2026-04-24 10:50:13
小区多户还没收房,已有人在楼顶准备加盖,还有人切割一楼和地下室贯通,西安大明宫璞悦府购房者好担心:房子安全还有保障吗?

小区多户还没收房,已有人在楼顶准备加盖,还有人切割一楼和地下室贯通,西安大明宫璞悦府购房者好担心:房子安全还有保障吗?

大风新闻
2026-04-24 08:32:18
双胞胎兄弟杀害富豪父亲,将其从29层推下,母亲:他们有苦衷

双胞胎兄弟杀害富豪父亲,将其从29层推下,母亲:他们有苦衷

星宇共鸣
2025-09-18 18:10:55
斯卢茨基没看错他!本赛季坚持要留下的申花王牌,本轮贡献进球

斯卢茨基没看错他!本赛季坚持要留下的申花王牌,本轮贡献进球

懂个球
2026-04-24 21:43:15
教育纪传体7:教师群体之内的肮脏龌龊,你们永远不会懂!(二)

教育纪传体7:教师群体之内的肮脏龌龊,你们永远不会懂!(二)

双旗镇客栈
2026-04-24 21:18:20
八十岁后,老人能活到以下状态,就是人生赢家,便是圆满!

八十岁后,老人能活到以下状态,就是人生赢家,便是圆满!

小谈食刻美食
2026-04-22 07:33:20
新四军进山东,第一仗就和八路军擦枪走火,双方各伤亡多少人?

新四军进山东,第一仗就和八路军擦枪走火,双方各伤亡多少人?

旧书卷里的长安
2026-04-23 22:12:41
同学聚会,班长让我给迟到的镇长让座,下一秒,县长向我道歉

同学聚会,班长让我给迟到的镇长让座,下一秒,县长向我道歉

农村情感故事
2026-03-23 07:31:39
603959,将被ST!600965,或被*ST

603959,将被ST!600965,或被*ST

证券时报e公司
2026-04-24 21:00:13
2026-04-25 08:20:49
金融界 incentive-icons
金融界
投资者信赖的财经金融门户网站
9194706文章数 546259关注度
往期回顾 全部

科技要闻

DeepSeek V4牵手华为,价格依然"屠夫级"

头条要闻

两届奥运冠军、中国羽协主席张军"失联" 知情人士发声

头条要闻

两届奥运冠军、中国羽协主席张军"失联" 知情人士发声

体育要闻

上海男篮23连胜+主场全胜 姚明之后最强一季

娱乐要闻

停工16个月!赵露思证实接拍新剧

财经要闻

LG财阀内斗:百亿美元商业帝国争夺战

汽车要闻

零跑Lafa5 Ultra北京车展上市:11.88-12.48万

态度原创

教育
时尚
手机
游戏
旅游

教育要闻

教室火锅”被人民日报点赞,却被家长疯狂举报

今日热点:爱奇艺回应暂停页面广告争议;经纪公司否认THEBOYZ解约成功……

手机要闻

iQOO 15T首曝:天玑9500+144Hz 2K直屏+200MP主摄,主打一个堆料

Steam新一代手柄要来了!突发上架或暗示快要开卖

旅游要闻

朔州崇福寺:金代遗构,塞北千年佛殿

无障碍浏览 进入关怀版