网易首页 > 网易号 > 正文 申请入驻

谷歌新发现:DeepSeek推理分裂出多重人格,左右脑互搏越来越聪明

0
分享至

AI 变聪明的真相居然是正在“脑内群聊”?!

谷歌最新研究表明,DeepSeek-R1 这类顶尖推理模型在解题时,内部会自发“分裂”出不同性格的虚拟人格,比如外向的、严谨的、多疑的……

大模型的解题推理过程,就是这些人格一场精彩的社交、辩论会;左右脑互搏 be like:

“这个思路对吗?试试这样验证……”

“不对,之前的假设忽略了 xx 条件”

有意思的是,AI 还越吵越聪明

研究发现,当遇到 GPQA graduate-level 科学问题、复杂数学推导这类高难度任务时,这种内部观点冲突会变得更加激烈。

相比之下,面对布尔表达式、基础逻辑推理等简单任务,模型的脑内对话会明显减少。

模型推理过程就是“左右脑互搏”

团队通过分析 DeepSeek-R1 和 QwQ-32B 等模型的思维轨迹发现,它们的推理过程充满了对话感。

内部分裂出来的虚拟角色不仅性格迥异,还能覆盖更多解题角度。

创意型角色擅长提出新颖思路,批判型角色专注挑错补漏,执行型角色负责落地验证……

通过这些人格的一场交流,不同观点的碰撞能让模型更全面地审视解决方案。

就连网友都说,自己在思考的时候,也会“左右脑互搏”。

不过,这种多角色互动并不是开发人员刻意设计的,而是模型在追求推理准确率的过程中自发形成的。

那么实验是如何证明这一点的呢?

团队借助稀疏自编码器 SAE,对 AI 的推理黑盒进行了深度解码,成功“监听”到了 AI 的脑内群聊。

首先,研究者让 AI 执行复杂的数学或逻辑推理任务。在模型产出思维链的同时,团队同步提取其隐藏层神经元的激活数值。

但此时的数据是由数亿个参数构成的复杂非线性信号,无法直接对应任何语义。

将这些激活数据输入 SAE,通过 SAE 的稀疏约束机制,就可以把杂乱的激活拆解为“自问自答”、“切换视角”等独立的对话语义特征;

通过分析这些特征的激活频率以及它们在时间序列上的协同关系,团队成功识别出了不同的内部逻辑实体。

再给上述特征打上“规划者”、“验证者”等虚拟角色的标签,就成功解码了 AI 内部的多角色对话行为。

“哦!”能让推理更准确

通过对比 DeepSeek-R1 与 DeepSeek-V3、Qwen-2.5-32B-IT 这类普通指令模型的推理轨迹,发现推理模型的对话式行为出现的频率显著更高

这里还有个很有意思的发现 ——“哦!”能让推理更准确

当团队通过激活添加法强化模型的对话特征,放大“哦!”这类表达惊讶、转折的话语标记时,模型在 Countdown 算术推理任务中的准确率直接从 27.1% 翻倍至 54.8%。

更关键的实验证据来自强化学习训练。

研究人员不提供任何对话结构的训练信号,只奖励模型答对题目的行为,结果发现模型会自发学会用对话式思考;

而先通过多智能体对话数据对模型进行微调,再进行推理训练,进步速度会远快于直接训练推理或用独白式推理数据微调的模型。

在 Qwen-2.5-3B 和 Llama-3.2-3B 两个模型体系中,早期训练阶段对话微调模型的准确率比独白微调模型高出 10% 以上,Llama-3.2-3B 到训练后期差距甚至扩大到 22%。

这一发现恰好呼应了人类演化生物学中的著名理论社会脑假说

假说认为人类大脑的进化主要是为了应对复杂的社交关系和群体互动需求。

如今看来,AI 也是一样,为了变聪明,得先会和不同“人格”社交!

本文源自:IT之家

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
不玩游戏、偶像包袱重、前胸贴白鹿后背,《奔跑吧》他干嘛来了?

不玩游戏、偶像包袱重、前胸贴白鹿后背,《奔跑吧》他干嘛来了?

洲洲影视娱评
2026-04-25 14:24:44
两位知名港星声援马蹄露!广东雨神直播拉票,张敬轩必败无疑

两位知名港星声援马蹄露!广东雨神直播拉票,张敬轩必败无疑

涵豆说娱
2026-04-25 12:07:14
张雪峰多位爱将离职,真相很残忍

张雪峰多位爱将离职,真相很残忍

新浪财经
2026-04-24 19:11:55
澳洲折扣超市取代Coles, Woolies! 大批澳人疯狂扫货, 最高可省80%!

澳洲折扣超市取代Coles, Woolies! 大批澳人疯狂扫货, 最高可省80%!

澳微Daily
2026-04-25 15:42:43
辛纳谈阿卡退出法网:安心养伤是明智之举,期待温网见到他

辛纳谈阿卡退出法网:安心养伤是明智之举,期待温网见到他

懂球帝
2026-04-25 16:55:04
60分12板8助!大号文班真强啊!探花50+11+11一剑封喉1

60分12板8助!大号文班真强啊!探花50+11+11一剑封喉1

贵圈真乱
2026-04-25 13:54:25
燃气公司上门安检,根本不是查漏气!真正目的其实是这3个

燃气公司上门安检,根本不是查漏气!真正目的其实是这3个

匹夫来搞笑
2026-04-20 13:24:51
眼红啊!工资到账19380.52元,自称“长沙教培牛马”发帖刷爆网络

眼红啊!工资到账19380.52元,自称“长沙教培牛马”发帖刷爆网络

火山詩话
2026-04-24 07:35:54
全球最疲惫总统宣布退场

全球最疲惫总统宣布退场

刘澜昌
2026-04-25 08:43:52
59岁巩俐身材引热议,外套都快撑不住丰腴身材了,却被夸少女体态

59岁巩俐身材引热议,外套都快撑不住丰腴身材了,却被夸少女体态

一盅情怀
2026-03-16 16:52:57
胆大包天!伊朗33艘快艇闪电突袭:美军来不及出动,眼睁睁吃败仗

胆大包天!伊朗33艘快艇闪电突袭:美军来不及出动,眼睁睁吃败仗

伴史缘
2026-04-25 14:02:08
昔日和王钰栋齐名并称国少双星 如今却沦落中甲碌碌无为 5轮0进球

昔日和王钰栋齐名并称国少双星 如今却沦落中甲碌碌无为 5轮0进球

零度眼看球
2026-04-25 08:54:32
我敢说,大部分会跟我一样,选择黑色衣服那个女孩!

我敢说,大部分会跟我一样,选择黑色衣服那个女孩!

草莓解说体育
2026-04-12 17:05:01
巅峰之夜!亚冠决赛今晚打响:吉达vs町田 马宁担任第四官员

巅峰之夜!亚冠决赛今晚打响:吉达vs町田 马宁担任第四官员

新英体育
2026-04-25 09:09:10
近7场1胜 皇马球迷贴面怒骂球员:不知羞耻 姆巴佩用帽遮脸+逃离

近7场1胜 皇马球迷贴面怒骂球员:不知羞耻 姆巴佩用帽遮脸+逃离

我爱英超
2026-04-25 07:46:50
印度终于抢到化肥,却被狠宰一刀!算清这笔账,为何中国不慌?

印度终于抢到化肥,却被狠宰一刀!算清这笔账,为何中国不慌?

丁丁鲤史纪
2026-04-25 11:45:39
看完伊朗,再看中国,卢卡申科做出一个神预测,特朗普怕就是这个

看完伊朗,再看中国,卢卡申科做出一个神预测,特朗普怕就是这个

落梅如雪乱飞
2026-04-22 13:31:47
海昏侯简牍的价值,为什么远高于他墓中的巨量黄金

海昏侯简牍的价值,为什么远高于他墓中的巨量黄金

澎湃新闻
2026-04-21 08:08:40
彻底焊死了!

彻底焊死了!

安安说
2026-04-25 11:52:50
C罗被媒体放出来的那份食谱太反科学!被认为是在搞营销!

C罗被媒体放出来的那份食谱太反科学!被认为是在搞营销!

历史第一人梅西
2026-04-25 01:36:38
2026-04-25 18:35:00
金融界 incentive-icons
金融界
投资者信赖的财经金融门户网站
9194706文章数 546266关注度
往期回顾 全部

科技要闻

DeepSeek V4发布!黄仁勋预言的"灾难"降临

头条要闻

伊朗最高领袖一条腿截肢面部严重烧伤 通信方式披露

头条要闻

伊朗最高领袖一条腿截肢面部严重烧伤 通信方式披露

体育要闻

火箭0-3触发百分百出局定律:本季加时赛9战8败

娱乐要闻

邓超最大的幸运,就是遇见孙俪

财经要闻

90%订单消失,中东旺季没了

汽车要闻

2026款乐道L90亮相北京车展 乐道L80正式官宣

态度原创

房产
手机
时尚
健康
数码

房产要闻

新一轮教育大爆发来了!海口,开始疯狂建学校!

手机要闻

一加Ace 6至尊版手机规格汇总,4月28日发布

上新|| 入夏第一件短袖,买它!

干细胞如何让烧烫伤皮肤"再生"?

数码要闻

英伟达适配DeepSeek-V4 AI模型,开箱性能超150 tokens/sec/user

无障碍浏览 进入关怀版