网易首页 > 网易号 > 正文 申请入驻

谷歌新发现:DeepSeek推理分裂出多重人格,左右脑互搏越来越聪明

0
分享至

闻乐 发自 凹非寺
量子位 | 公众号 QbitAI

AI变聪明的真相居然是正在“脑内群聊”?!

谷歌最新研究表明,DeepSeek-R1这类顶尖推理模型在解题时,内部会自发“分裂”出不同性格的虚拟人格,比如外向的、严谨的、多疑的……

大模型的解题推理过程,就是这些人格一场精彩的社交、辩论会;左右脑互搏be like:

“这个思路对吗?试试这样验证……”
“不对,之前的假设忽略了xx条件”



有意思的是,AI还越吵越聪明

研究发现,当遇到GPQA graduate-level科学问题、复杂数学推导这类高难度任务时,这种内部观点冲突会变得更加激烈。

相比之下,面对布尔表达式、基础逻辑推理等简单任务,模型的脑内对话会明显减少。



模型推理过程就是“左右脑互搏”

团队通过分析DeepSeek-R1和QwQ-32B等模型的思维轨迹发现,它们的推理过程充满了对话感。

内部分裂出来的虚拟角色不仅性格迥异,还能覆盖更多解题角度。

创意型角色擅长提出新颖思路,批判型角色专注挑错补漏,执行型角色负责落地验证……



通过这些人格的一场交流,不同观点的碰撞能让模型更全面地审视解决方案。

就连网友都说,自己在思考的时候,也会“左右脑互搏”。



不过,这种多角色互动并不是开发人员刻意设计的,而是模型在追求推理准确率的过程中自发形成的。

那么实验是如何证明这一点的呢?



团队借助稀疏自编码器SAE,对AI的推理黑盒进行了深度解码,成功“监听”到了AI的脑内群聊。

首先,研究者让AI执行复杂的数学或逻辑推理任务。在模型产出思维链的同时,团队同步提取其隐藏层神经元的激活数值。

但此时的数据是由数亿个参数构成的复杂非线性信号,无法直接对应任何语义。

将这些激活数据输入SAE,通过SAE的稀疏约束机制,就可以把杂乱的激活拆解为“自问自答”、“切换视角”等独立的对话语义特征;

通过分析这些特征的激活频率以及它们在时间序列上的协同关系,团队成功识别出了不同的内部逻辑实体。

再给上述特征打上“规划者”、“验证者”等虚拟角色的标签,就成功解码了AI内部的多角色对话行为。

“哦!”能让推理更准确

通过对比DeepSeek-R1与DeepSeek-V3、Qwen-2.5-32B-IT这类普通指令模型的推理轨迹,发现推理模型的对话式行为出现的频率显著更高



这里还有个很有意思的发现——

“哦!”能让推理更准确。

当团队通过激活添加法强化模型的对话特征,放大“哦!”这类表达惊讶、转折的话语标记时,模型在Countdown算术推理任务中的准确率直接从27.1%翻倍至54.8%。



更关键的实验证据来自强化学习训练。

研究人员不提供任何对话结构的训练信号,只奖励模型答对题目的行为,结果发现模型会自发学会用对话式思考;

而先通过多智能体对话数据对模型进行微调,再进行推理训练,进步速度会远快于直接训练推理或用独白式推理数据微调的模型。

在Qwen-2.5-3B和Llama-3.2-3B两个模型体系中,早期训练阶段对话微调模型的准确率比独白微调模型高出10%以上,Llama-3.2-3B到训练后期差距甚至扩大到22%。



这一发现恰好呼应了人类演化生物学中的著名理论社会脑假说

假说认为人类大脑的进化主要是为了应对复杂的社交关系和群体互动需求。

如今看来,AI也是一样,为了变聪明,得先会和不同“人格”社交!

论文地址:https://arxiv.org/abs/2601.10825
参考链接:https://x.com/sebkrier/status/2013331596863041731

— 完 —

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
赵祥松|那位替俄罗斯洗地的杜某,到底是个什么货色?

赵祥松|那位替俄罗斯洗地的杜某,到底是个什么货色?

祥松谈
2026-05-09 19:05:44
1-1,热刺遭英超第14逼平,保级形势不容乐观,最后两轮对手强劲

1-1,热刺遭英超第14逼平,保级形势不容乐观,最后两轮对手强劲

侧身凌空斩
2026-05-12 06:03:01
随着吉达国民2-1,沙特联最新积分榜出炉:争冠和争亚皆白热化

随着吉达国民2-1,沙特联最新积分榜出炉:争冠和争亚皆白热化

凌空倒钩
2026-05-12 06:17:52
为啥建议尽量用现金支付?3个现实原因,看完你也会揣现金出门

为啥建议尽量用现金支付?3个现实原因,看完你也会揣现金出门

老特有话说
2026-05-10 21:01:02
徐帆回应离婚仅9个月,冯小刚王志文同聚打球,与养女关系引争议

徐帆回应离婚仅9个月,冯小刚王志文同聚打球,与养女关系引争议

蹲坑看世界
2026-05-09 19:22:54
反转了!文班不禁赛!天王山能打!

反转了!文班不禁赛!天王山能打!

柚子说球
2026-05-12 07:36:46
OPPO再致歉:从严处罚高级副总裁段要辉

OPPO再致歉:从严处罚高级副总裁段要辉

21世纪经济报道
2026-05-11 14:48:08
爸爸想把房子送给"干女儿"保姆 儿子扣房产证

爸爸想把房子送给"干女儿"保姆 儿子扣房产证

看看新闻Knews
2026-05-11 13:12:03
坑惨OPPO,惊坏华为大疆,武大母校痛心,余思月事后狡辩掉人心!

坑惨OPPO,惊坏华为大疆,武大母校痛心,余思月事后狡辩掉人心!

小兔子发现大事情
2026-05-11 16:17:25
俄阅兵活动简化,普京保护措施加强,有情报猜测可能与绍伊古有关

俄阅兵活动简化,普京保护措施加强,有情报猜测可能与绍伊古有关

麓谷隐士
2026-05-11 14:01:34
王曼昱哭了登热搜第一!两度致谢莎莎情真意切 陈熠何卓佳都哭了

王曼昱哭了登热搜第一!两度致谢莎莎情真意切 陈熠何卓佳都哭了

颜小白的篮球梦
2026-05-11 07:50:35
凌晨外出复印失联的西宁17岁高中女生已找到,亲属:属意外溺亡

凌晨外出复印失联的西宁17岁高中女生已找到,亲属:属意外溺亡

极目新闻
2026-05-11 19:13:31
维修资金成了“提款机”?上海一小区物业被曝疯狂敛财:1.3万修个插头,300元椅子敢报1000

维修资金成了“提款机”?上海一小区物业被曝疯狂敛财:1.3万修个插头,300元椅子敢报1000

观威海
2026-05-11 21:54:14
举报成风,正在压垮教育!

举报成风,正在压垮教育!

行者殷涛
2026-05-11 19:00:42
谁都不看好你,偏偏你最争气——国乒荣膺男团12连冠

谁都不看好你,偏偏你最争气——国乒荣膺男团12连冠

体坛周报
2026-05-11 17:54:14
武汉大学终于硬气了,余思月真人曝光,她无缘继续留在OPPO公司

武汉大学终于硬气了,余思月真人曝光,她无缘继续留在OPPO公司

平老师666
2026-05-11 23:21:51
冲上热榜第一!世乒赛结束数小时,外媒提到樊振东,现场一片沉默

冲上热榜第一!世乒赛结束数小时,外媒提到樊振东,现场一片沉默

大秦壁虎白话体育
2026-05-11 20:29:50
被全网嘲讽、官方封杀的嘎子,为什么就成了永远杀不死的烂梗永动机?

被全网嘲讽、官方封杀的嘎子,为什么就成了永远杀不死的烂梗永动机?

BB姬
2026-05-11 22:08:38
广东惨败北京25分!杨溢10分7助,李奕臻5分,难怪杜锋不给机会

广东惨败北京25分!杨溢10分7助,李奕臻5分,难怪杜锋不给机会

多特体育说
2026-05-11 22:53:21
新能源汽车维修遭垄断,4400万车主选择权被锁

新能源汽车维修遭垄断,4400万车主选择权被锁

第一财经资讯
2026-05-11 16:52:11
2026-05-12 07:55:00
量子位 incentive-icons
量子位
追踪人工智能动态
12605文章数 176461关注度
往期回顾 全部

科技要闻

黄仁勋:你们赶上了一代人一次的大机会

头条要闻

女子连上20多天瑜伽课被教练踢出群聊:天天来 不累吗

头条要闻

女子连上20多天瑜伽课被教练踢出群聊:天天来 不累吗

体育要闻

梁靖崑:可能是最后一届了,想让大家记住这个我

娱乐要闻

“孕妇坠崖案”王暖暖称被霸凌协商解约

财经要闻

宗馥莉罢免销售负责人 部分业务将外包

汽车要闻

吉利银河“TT”申报图曝光 电动尾翼+激光雷达

态度原创

健康
亲子
教育
本地
数码

干细胞能让人“返老还童”吗

亲子要闻

蒙眼吹钱挑战亲子互动游戏

教育要闻

有公费海外交换机会的院校(妈妈!免费旷野!

本地新闻

用苏绣的方式,打开江西婺源

数码要闻

苹果iPadOS 17.7.11正式版发布

无障碍浏览 进入关怀版