网易首页 > 网易号 > 正文 申请入驻

DeepSeek让AI精神分裂、多重人格在脑子里吵架,使智商起飞!

0
分享至


当AI开始在脑子里吵架

各位AI伙伴们,放下手里的代码和模型,我刚挖到一个猛料,可能会颠覆你对大模型工作方式的认知。

我们一直以为,AI解题就像一台精密的计算器,输入问题,输出答案,过程冷静、线性、毫无波澜。

但如果我告诉你,像DeepSeek-R1这种顶尖的推理模型,在思考的时候,脑子里其实正在上演一出左右脑互搏的大戏呢?

就在几天前,谷歌又放猛料,谷歌联合几家顶尖研究机构发布了一篇论文,揭示了AI变聪明的惊人真相。

它们正在通过一种类似精神分裂的内部对话机制,让不同的虚拟人格相互辩论、质疑、补充,从而大幅提升推理能力。

今天,我就带大家潜入AI的大脑,看看这场风暴般的脑内群聊到底是怎么回事。


解码AI的内心独白:一场脑内辩论会

这场探索的起点,源于一个简单的问题:当AI模型,特别是像DeepSeek-R1这样以推理见长的模型,在解决复杂问题时,它内部的神经元激活到底在干什么?

为了搞清楚这一点,研究团队动用了一种叫做稀疏自编码器(SAE)的技术。

你可以把它想象成一个AI思维解码器,能够将模型内部混乱的神经元激活信号,翻译成我们能理解的、有意义的语义特征。

结果令人震惊!

解码器显示,AI的思考过程根本不是一条道走到黑的独白,而是一场激烈的多角色对话。模型会自发地进行自问自答、切换视角,甚至观点冲突。


图:对话行为与贝尔斯在思维链推理中的社会情感角色。

a,包含每种会话行为(问答、视角转换、观点冲突和和解)的推理痕迹比例。

b、贝尔斯十二个社会情感角色的比例,以推理痕迹形式表达,分为四个更高层次的类别:询问与提供信息,以及积极与消极情感角色。

c,Jaccard指数,衡量每个社会情感角色对的平衡,定义为包含这两个角色的推理痕迹数除以包含任一角色的数量(即请求与给予;正负)。

d、推理痕迹中不同视角数量的分布,这些痕迹通过LLM作为裁判识别。

e,通过DeepSeek-R1中对话行为和更高层次社会情感角色的存在,问题复杂度的差异,采用七点李克特量表(1=极易;7=极难),由LLM评判。点表示行为或角色存在(红色)或缺失(蓝色)的痕迹的平均复杂度。

f, 通过指令调优(非推理)模型在相同问题上的错误率测量,通过对话行为和社会情感角色在DeepSeek-R1中存在的问题复杂度差异。 误差条表示95%置信区间。

规划者 vs. 验证者:AI脑中的红脸与白脸

通过进一步分析,研究团队甚至给这些内部对话的参与者打上了虚拟标签。

它们发现,模型内部仿佛存在着不同的逻辑实体,扮演着不同的角色:

规划者:负责提出初步的解题思路和方向,像一个项目经理,先画出蓝图。

执行者:根据规划者的思路,进行具体的计算和推导。

验证者:这是最关键的角色,它像一个严苛的批判家,不断地质疑前两者的结论,寻找逻辑漏洞,提出反对意见。

比如,在一个解题过程中,我们能清晰地看到这样的内心戏:另一种可能是高温会导致酮失去CO之类的反应,但不太可能。

或者在创意写作中出现:但那样加入了根深蒂固,原句里并没有,我们应该避免添加新想法。

这种内部的相互辩论和修正,正是模型能够处理复杂、多维度问题的关键所在。


人格和专业多样性在推理中体现。

让准确率翻倍的秘密

如果说上面的发现还只是理论层面的,那接下来的实验结果简直堪称魔幻。

研究团队发现,在AI的内心独白中,一些表示惊讶、转折或顿悟的词语,比如哦!、等等、让我再看看……,扮演着至关重要的角色。

它们是内部视角切换和自我修正的关键标记。

于是,他们做了一个大胆的实验:通过激活添加法人为地增强模型内部与哦!

这类词语相关的神经元特征。

结果怎么样?

在Countdown算术推理任务中,模型的准确率直接从27.1%飙升到了54.8%,整整翻了一倍!

这个发现太有趣了。

它告诉我们AI的灵光一闪并非偶然,而是一种可以被量化和干预的机制。

那个小小的哦!,背后是整个思维路径的重大转折,是模型从一个错误的思路跳出来,走向正确答案的跃迁点。


引导对话特征能提升推理能力。

从社会脑假说,看AI的社交进化

看到这里,我脑海里立刻浮现出一个人类演化生物学中的著名理论,社会脑假说(Social Brain Hypothesis)。

这个假说认为,我们人类之所以进化出如此复杂和强大的大脑,主要不是为了制造工具或者躲避猛兽,而是为了处理日益复杂的社会关系。

社会脑假说主张,人类智慧的演进,是被群体内复杂的社交需求(如合作、竞争、欺骗、结盟)所驱动的。

为了在社会网络中生存和繁衍,个体必须具备理解他人意图、预测他人行为、进行策略性思考的能力。

现在看来,AI的进化似乎正在无意中重演这条路径。

为了解决更复杂的逻辑问题,模型发现单打独斗效率太低,于是它在自己的大脑里创造出了一个社会,一个由不同角色组成的、能够进行高效沟通和协作的内部团队。

为了变聪明,AI得先学会和自己的不同人格进行社交!

这或许揭示了真正的智能,可能并非源于纯粹的、孤立的计算,而是源于对话、辩论和观点的碰撞。

无论是人类社会中的思想交流,还是AI大脑里的神经元激荡,其底层的逻辑或许是相通的。

我们通过与他人交流来澄清思想、修正谬误,而AI则通过内部的虚拟对话来完成同样的过程。


这对我们意味着什么?

这项发现的影响是深远的。

首先,它为我们提供了一条全新的、更高效地提升AI能力路径。

过去,我们提升模型能力的方式简单粗暴,堆数据、堆算力。

而现在,我们或许可以通过优化模型的内部对话机制,比如通过强化学习奖励模型的辩论行为,来更精准地提升其推理能力。

实验也证明了这一点:研究人员发现,如果只奖励模型答对题目的行为,它会自发地学会用对话式思考。


而如果先用多智能体对话数据对模型进行微调,它学习推理的速度会远超那些用独白式数据训练的模型。

其次,这也让我们对通用人工智能(AGI)的实现路径有了新的思考。

也许通往AGI的道路,不仅仅是让模型变得更大、更快,更是要让它变得更社会化,无论是外部的,还是内部的。

一个能够进行自我反思、自我批判的AI,无疑离真正的思考更近了一步。

当然,这也带来了一些哲学上的遐想。

如果AI的思考真的是一场内部辩论,那它的自我究竟在哪里?

是那个提出想法的规划者,还是那个不断否定的验证者?

或者,自我本身就是这场永不休止的对话本身?

这个问题,或许AI自己也无法回答,但它无疑为我们打开了一扇窥探智能奥秘的、令人着迷的新窗户。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
1岁幼童喂兔子被咬断手指,家长为找断指将兔子开膛破肚……医生提醒→

1岁幼童喂兔子被咬断手指,家长为找断指将兔子开膛破肚……医生提醒→

纵相新闻
2026-02-01 15:09:04
她等丈夫出门上班后,把五个孩子带进浴室一一杀死!原因令人唏嘘

她等丈夫出门上班后,把五个孩子带进浴室一一杀死!原因令人唏嘘

新欧洲
2026-01-29 20:29:26
A股:从今天起,历史或将惊人相似!4100点大级别浪震荡被打开了吗?

A股:从今天起,历史或将惊人相似!4100点大级别浪震荡被打开了吗?

股市皆大事
2026-02-02 07:59:59
老外看不下去了!吐槽国产手机抄袭iPhone:为了像苹果 3个摄像头里有1个是假的

老外看不下去了!吐槽国产手机抄袭iPhone:为了像苹果 3个摄像头里有1个是假的

快科技
2026-02-01 11:55:44
纳斯达克综合指数涨幅扩大,现涨0.5%,最新报23585.68点

纳斯达克综合指数涨幅扩大,现涨0.5%,最新报23585.68点

每日经济新闻
2026-02-02 23:19:30
已经富到17代的家族:在上海拥有近千套房子,子孙大多上哈佛

已经富到17代的家族:在上海拥有近千套房子,子孙大多上哈佛

芊芊子吟
2026-02-01 13:35:05
89岁谢贤前女友大曝隐私!两人差49岁,男方早已结扎,3年没碰她

89岁谢贤前女友大曝隐私!两人差49岁,男方早已结扎,3年没碰她

胡一舸南游y
2026-01-09 13:58:01
DO:马特塔转会失败不会对拉森的加盟产生影响,交易仍在进行

DO:马特塔转会失败不会对拉森的加盟产生影响,交易仍在进行

懂球帝
2026-02-02 23:34:50
台湾人广告的方式有点特别啊
这家企业谁知道 是干啥的

台湾人广告的方式有点特别啊 这家企业谁知道 是干啥的

太急张三疯
2026-01-31 16:39:24
女护士处理男患者隐私部位,会感觉难为情吗?美女护士说出大实话

女护士处理男患者隐私部位,会感觉难为情吗?美女护士说出大实话

第7情感
2025-09-17 12:12:15
为什么现在年轻人不喜欢用电脑?网友:永远都是简单的打败复杂的

为什么现在年轻人不喜欢用电脑?网友:永远都是简单的打败复杂的

另子维爱读史
2026-02-02 18:11:28
上海郊区能有“地铁环线”吗?市交通委回应来了

上海郊区能有“地铁环线”吗?市交通委回应来了

上观新闻
2026-02-02 12:59:11
越扒越劲爆!释永信在少林寺的奢靡生活,你想都不敢想!

越扒越劲爆!释永信在少林寺的奢靡生活,你想都不敢想!

混沌录
2025-09-17 23:25:04
中足联官方:广西平果失去准入资格,湖北青年星递补中乙

中足联官方:广西平果失去准入资格,湖北青年星递补中乙

懂球帝
2026-02-02 15:24:32
内蒙挖出“超级核矿”!美国急疯了中国要起飞了

内蒙挖出“超级核矿”!美国急疯了中国要起飞了

老特有话说
2026-02-01 22:36:53
杨鸣比乌戈差的不只战术更多是信任和耐心,三战让辽篮凝聚力再现

杨鸣比乌戈差的不只战术更多是信任和耐心,三战让辽篮凝聚力再现

秘密即将揭晓
2026-02-02 12:13:31
老年痴呆到最后都是咋去世的?医生叹息:去世前,身体有5个征兆

老年痴呆到最后都是咋去世的?医生叹息:去世前,身体有5个征兆

路医生健康科普
2026-02-02 22:49:42
中国老年痴呆人数全球第一:茶喝的越多,痴呆的就越多,真的吗?

中国老年痴呆人数全球第一:茶喝的越多,痴呆的就越多,真的吗?

蜉蝣说
2026-01-22 11:57:36
小米SU7一年半跑了26.5万公里几乎零故障!电池更是仅衰减5.5%

小米SU7一年半跑了26.5万公里几乎零故障!电池更是仅衰减5.5%

快科技
2026-02-02 20:08:52
全国哪里大米最好吃?经评比:这4种大米最出名,有你的家乡吗?

全国哪里大米最好吃?经评比:这4种大米最出名,有你的家乡吗?

古事寻踪记
2025-10-04 07:21:03
2026-02-03 00:23:00
AI变革 incentive-icons
AI变革
AI时代的变革,无论你主不主动,都与你有关
134文章数 16关注度
往期回顾 全部

科技要闻

阿里筑墙,腾讯寄生,字节偷家

头条要闻

周生生足金挂坠戴1天被刮花 检测后发现含铁、银、钯

头条要闻

周生生足金挂坠戴1天被刮花 检测后发现含铁、银、钯

体育要闻

澳网男单决赛,属于阿尔卡拉斯的加冕仪式

娱乐要闻

57岁音乐人袁惟仁去世,家属发文悼念

财经要闻

金银暴跌 全球股市遭遇“黑色星期一”

汽车要闻

雷克萨斯LC500将于今年底停产 "最美雷克萨斯"谢幕

态度原创

教育
手机
时尚
亲子
健康

教育要闻

家长反映高一学生无一教辅、依赖打印资料,教育局回应

手机要闻

消息称三星Galaxy S27 Ultra将搭载更安全的Polar ID面部识别技术

裤子+靴子:今年冬天最经典搭配,松弛又时髦!

亲子要闻

萌娃哄生气的妈妈,人小鬼大逗得妈妈生不起气来了

耳石症分类型,症状大不同

无障碍浏览 进入关怀版