网易首页 > 网易号 > 正文 申请入驻

宾夕法尼亚大学突破AI"集体思维"困境:拥有独特个性的PRISM框架

0
分享至

来源:市场资讯

(来源:科技行者)


这项由宾夕法尼亚大学、耶鲁大学、蒙特利尔大学和加州大学圣克鲁兹分校联合开展的研究发表于2026年2月,论文编号为arXiv:2602.21317v1。研究团队针对当前大型语言模型趋于同质化的"人工蜂巢思维"问题,提出了一个名为PRISM的创新框架,旨在为AI模型注入独特的认知轨迹和个性化思维方式。

当我们打开不同公司的聊天机器人时,会发现一个令人担忧的现象:无论是GPT、Claude还是其他AI助手,它们给出的答案往往惊人地相似。就像一群接受了相同训练的士兵,它们的思维方式已经高度统一,缺乏个体差异和创新火花。这种现象被研究者们称为"人工蜂巢思维",正在成为AI发展路上的一个重大障碍。

回想牛顿和糖果制作师威廉·科尔布同时看到苹果落下的场景。牛顿从中发现了万有引力定律,而科尔布却想到了制作糖苹果的灵感。同样的刺激,却产生了截然不同的认知反应。这正是人类智慧的精髓所在——共享的知识基础并不妨碍个体思维的独特性。然而,当前的AI模型却失去了这种宝贵的多样性。

研究团队认为,这个问题的根源在于所有AI模型都接受了类似的训练数据和优化目标,导致它们的"天性"过于相似。为了解决这个问题,他们提出了一个革命性的概念:既然改变AI的"天性"(预训练参数)成本高昂且风险重重,那么为什么不在推理过程中为它们注入独特的"后天经历"呢?

这就是PRISM框架的核心思想。PRISM的全称是"通过上下文结构建模实现多元化推理",它就像一个认知棱镜,能够将AI模型共同的知识基础折射成不同的思维轨迹。整个过程可以用一个人的成长历程来比喻:首先是"体验"阶段,就像一个人在生活中接触各种不同的经历;然后是"内化"阶段,将这些零散的经历整理成有条理的知识体系;最后是"表达"阶段,基于这些独特的认知背景做出个性化的回应。

一、认知爆炸:打破思维的舒适圈

当我们习惯了某种思维方式时,往往会陷入固定模式,就像走熟悉的路线一样自然而然。AI模型也面临同样的问题——它们的预训练让它们习惯了某些"安全"的回答模式。为了打破这种局限,PRISM首先需要进行"认知爆炸",强迫模型走出思维的舒适圈。

这个过程就像让一个只在城市生活的人突然去体验不同的环境——沙漠、雨林、高原。PRISM通过一种叫做"野性搜索"的机制来实现这一点。不同于传统的信息检索追求相关性,野性搜索故意寻找那些看似不相关但可能激发新思路的信息片段。

具体来说,系统会随机选择3个名词作为"认知种子",然后用这些种子去大规模数据库中进行搜索。这些搜索结果可能天马行空,毫无章法,但正是这种随机性为模型提供了突破思维定式的机会。就像一个厨师突然在传统食谱中加入了意想不到的调料,可能会创造出令人惊喜的新口味。

这种方法的巧妙之处在于,它模拟了人类真实的学习体验。我们每个人的知识背景和人生经历都不同,这些差异正是创新思维的源泉。通过为每次推理过程注入不同的"经历种子",PRISM让AI模型获得了类似的多样性。

二、认知结构化:将混乱整理成智慧

仅有丰富的经历还不够,关键在于如何将这些零散的信息整理成有用的知识体系。这就像一个人需要将旅行中的见闻整理成人生感悟一样,PRISM需要将野性搜索得到的杂乱信息转化为结构化的认知图谱。

这个过程的核心是构建一个"认知图谱",就像绘制一张思维地图。图谱中包含两种关键节点:上下文节点和火花节点。上下文节点来自用户的原始问题,代表着问题的核心约束和基本要素,就像地图上的固定地标。火花节点则来自野性搜索的结果,代表着可能激发创新的外部信息,就像地图上新发现的有趣地点。

更重要的是,PRISM不是简单地将这些信息拼凑在一起,而是通过三种"认知操作符"来建立节点之间的联系。映射操作符能够将一个领域的机制转移到另一个领域,就像将生物学中的"病毒传播"概念应用到营销策略中。融合操作符则能够将不同节点的属性结合起来,创造出全新的组合。逆转操作符通过寻找对立面来产生创造性张力,就像在和谐中加入不协调音符来创造音乐的戏剧效果。

这种结构化过程确保了AI不会被大量信息淹没,而是能够有条理地处理和利用这些多样化的输入。就像一个经验丰富的图书管理员,能够将看似无关的书籍按照某种内在逻辑组织起来,让读者更容易发现新的知识连接。

三、个性化生成:独特视角的诞生

有了结构化的认知图谱,最后一步就是基于这个独特的"思维地图"来生成回应。这个过程不再是简单的信息检索或模式匹配,而是真正的创造性综合。

PRISM将认知图谱转换成文本形式,然后作为上下文输入给基础模型。这就像为模型提供了一个独特的"人生背景故事",让它能够从这个特定的视角来理解和回应问题。就如同让一个有着丰富海洋经历的人和一个山区长大的人分别描述"自由"这个概念,他们的回答必然会带有各自经历的独特印记。

这种方法的效果是显著的。在创新性测试中,使用PRISM的模型能够产生更加多样化和新颖的回答。比如,当被要求写关于电动汽车的笑话时,普通模型可能会重复使用常见的"充电"或"安静"等梗,而经过PRISM处理的模型可能会从完全不同的角度切入,创造出意想不到的幽默效果。

在科学发现任务中,PRISM展现出了更强的跨领域连接能力。它不再局限于某个特定领域的既有知识,而是能够将看似无关的概念巧妙地结合起来,产生真正创新的研究假设。这种能力正是人类科学家最宝贵的品质之一。

四、实验验证:从创意到诊断的全面测试

为了验证PRISM的有效性,研究团队设计了一系列全面的测试。这些测试就像为一个声称具有特殊能力的人设计的综合考试,需要从多个角度来验证其真实水平。

在人工蜂巢思维测试中,研究人员让不同的AI模型对同一问题生成多个回答,然后分析这些回答的相似程度。结果发现,普通模型的回答往往高度集中在少数几个"安全"选项上,就像考试时所有学生都选择了最保险的答案。而使用PRISM的模型则展现出明显的多样性,它们的回答分布更加分散,覆盖了更广阔的语义空间。

特别有趣的是,研究人员发现同一个模型在使用PRISM前后的差异,甚至比不同模型之间的差异还要大。这说明PRISM确实为模型注入了独特的"个性",让它们能够产生真正不同的思维方式。

在开放式创意任务中,PRISM在新颖性评分上取得了显著提升。比如在NoveltyBench基准测试中,使用PRISM的GPT-4o-mini模型的独特性得分提高了28%。这意味着它们不再像复读机一样重复相似的内容,而是能够产生真正新颖的创意。

五、科学发现能力:从模仿到创新的跨越

在IdeaBench科学发现任务中,PRISM展现出了令人印象深刻的表现。这个测试要求AI基于现有学术文献生成新的研究假设,这对于普通AI来说是一个巨大挑战,因为它们往往只能重复已有的观点。

结果显示,使用PRISM的模型在新颖性洞察得分上取得了44.4%的提升。更重要的是,这些新颖性并非空中楼阁,而是建立在坚实的科学基础之上的。模型能够将不同领域的概念进行有机结合,提出既创新又可行的研究方向。

比如,在一个关于运动心理学的研究中,普通模型可能只是重复已知的咖啡因对运动表现的影响。而使用PRISM的模型则能够将认知心理学中的"信念效应"与运动生理学中的"临界速度"概念结合起来,提出关于安慰剂效应如何影响运动员生理阈值的创新假设。这种跨领域的洞察正是科学突破的重要源泉。

六、医疗诊断突破:在罕见疾病中寻找真相

PRISM最令人振奋的应用之一是在罕见疾病诊断领域。这个任务具有特殊的挑战性:罕见疾病顾名思义非常少见,普通AI模型往往倾向于诊断常见疾病,就像医生可能会优先考虑常见病一样,这种保守策略虽然在大多数情况下是安全的,但可能会遗漏真正的罕见疾病。

在RareBench测试中,PRISM展现出了突破这种保守偏见的能力。当面对一个复杂的病例时,普通模型可能会给出"自闭症谱系障碍"或"努南综合征"等常见诊断。但PRISM通过构建专家咨询网络,能够从多个专业角度分析症状。

举个具体例子,面对一个表现为大头畸形、囊性水瘤、嗜睡等症状的患者,PRISM会模拟不同专科医生的思维过程。临床遗传学专家可能会关注大头畸形与戊二酸尿症的关联,儿科神经学专家会注意到肌张力障碍提示基底节受累,代谢专科医生则会分析低血浆游离肉碱的意义。通过整合这些不同视角,PRISM最终能够准确诊断出戊二酸血症I型这一罕见遗传病。

这种诊断能力的提升不仅体现在准确率上。在回忆率@10测试中,PRISM达到了52%的成绩,相比基线模型的32%有显著提升。这意味着在真正的罕见疾病案例中,PRISM有更大概率将正确答案包含在其候选列表中,这对于临床实践具有重要意义。

七、深度分析:解析成功的关键要素

为了理解PRISM成功的原因,研究团队进行了详细的分解分析。他们发现,仅仅增加信息检索是不够的——简单的平面检索甚至可能让模型表现变差,因为无关信息会干扰模型的判断。真正的关键在于图谱结构对这些信息的组织和消化。

这就像比较两种学习方式:一种是随意浏览各种资料但不加整理,另一种是系统地构建知识框架并将新信息有机地整合进去。显然,后者更有效。PRISM的图谱结构就起到了这种知识框架的作用,它帮助模型将看似无关的信息片段连接成有意义的认知网络。

研究还发现,模型规模对PRISM效果有重要影响。较大的模型能够更好地利用PRISM提供的结构化信息,而较小的模型虽然也能受益,但提升幅度相对有限。这说明PRISM不是简单的信息堆砌,而是需要模型具备一定的理解和整合能力。

特别有趣的是,探索种子的数量存在一个最优区间。太少的种子无法提供足够的多样性,太多的种子又会引入过多噪音。研究发现3个种子通常是一个较好的平衡点,既能保证多样性又不会过于分散。

八、技术创新的深层意义

PRISM的意义远不止于提高AI模型的性能指标。它代表了AI发展的一个重要转向:从追求单一的"完美"模型转向培育多元化的AI生态系统。

传统的AI开发理念认为,最好的AI应该在所有任务上都表现优异,就像培养一个全才。但PRISM的研究表明,多样性本身就是一种宝贵的资源。就像自然界中生物多样性是生态系统稳定的基础一样,AI的认知多样性也可能是人工智能系统健康发展的关键。

这种思路转变有着深刻的哲学意涵。它挑战了"标准答案"的概念,认为对于复杂问题,可能存在多种同样有效的解决方案。这与现实世界的情况更加吻合——面对同样的挑战,不同文化背景和专业训练的人往往会提出截然不同但都有价值的解决方案。

从技术实现角度来看,PRISM还展示了一种新的AI优化策略。与其在训练阶段就试图让模型学会所有可能的思维方式,不如在推理阶段动态地为模型注入不同的认知背景。这种方法不仅更加高效,也更加灵活,能够根据具体任务的需要调整模型的"思维方式"。

九、实际应用前景与社会影响

PRISM的应用前景极为广阔。在教育领域,它可以为不同学习风格的学生提供个性化的教学方法。有些学生可能更适合视觉化的解释,有些学生则偏好逻辑推理,PRISM可以让AI教师根据每个学生的特点调整教学策略。

在科研协作中,PRISM可以模拟来自不同学科背景的研究者,为跨学科合作提供新的可能性。一个生物学问题可能从物理学、化学、数学等多个角度得到不同的洞察,PRISM让单个AI系统具备了这种多视角思维能力。

在创意产业中,PRISM可以为内容创作者提供多样化的灵感来源。无论是写作、设计还是音乐创作,都可以从不同的认知角度获得新鲜的创意输入。

但这种技术也带来了新的挑战。如何确保AI的多样性是建设性的而非破坏性的?如何平衡创新性和可靠性?这些问题需要在技术发展过程中持续关注和解决。

研究团队也认识到了这些挑战,他们强调PRISM的设计原则是在保持模型基本安全性的前提下增加多样性。由于PRISM只在推理阶段生效,不会改变模型的核心参数,因此能够在很大程度上保持原有的安全保障机制。

说到底,PRISM为我们展示了AI发展的一个新方向:不是让所有AI都变得一样聪明,而是让它们各有所长、各具特色。这种理念可能会根本性地改变我们与AI互动的方式。我们不再面对一个标准化的智能助手,而是可以根据需要选择具有不同"性格"和"专长"的AI伙伴。

这项研究的更深层意义在于,它提醒我们多样性的价值。在追求效率和标准化的现代社会中,我们有时会忽视差异性的重要作用。PRISM通过技术手段重新唤醒了对认知多样性的重视,这不仅对AI发展有启发,对人类社会的发展也具有借鉴意义。

当我们站在人工智能快速发展的十字路口时,PRISM为我们指出了一条不同的道路:不是让AI变得更像人类,而是让AI拥有不同的"个性",从而在人机协作中发挥更大的价值。这种技术哲学的转变,可能会开启人工智能发展的新篇章。

Q&A

Q1:PRISM框架是如何让AI模型产生不同个性的?

A:PRISM通过三个步骤为AI注入独特"个性":首先进行"野性搜索"随机获取多样化信息,然后构建认知图谱将信息结构化,最后基于这个独特的认知背景生成回答。就像让AI拥有不同的"人生经历",从而产生不同的思维方式和回答风格。

Q2:PRISM框架在医疗诊断方面有什么突破?

A:PRISM在罕见疾病诊断方面表现突出,能够突破AI模型偏向常见疾病的保守诊断模式。通过模拟多个专科医生的思维过程,PRISM在罕见疾病回忆率@10测试中达到52%,相比基线模型32%有显著提升,能更准确地识别被忽视的罕见疾病。

Q3:PRISM框架会不会影响AI回答的准确性?

A:PRISM在提高创新性的同时基本保持了准确性。虽然在一些标准化评估中可能略有下降,但这是因为评估标准更偏向"平均"答案。在实际应用中,PRISM生成的多样化答案仍然保持逻辑一致性和事实准确性,只是表达方式更加个性化和创新。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
360周鸿祎眼睛换上人工晶体:摘掉眼镜是为了戴AI眼镜

360周鸿祎眼睛换上人工晶体:摘掉眼镜是为了戴AI眼镜

IT之家
2026-03-05 11:02:08
邹市明一家国外度假!冉莹颖膘肥体壮不好惹,轩轩一头白毛好土气

邹市明一家国外度假!冉莹颖膘肥体壮不好惹,轩轩一头白毛好土气

小徐讲八卦
2026-03-01 05:51:11
比亚迪西班牙猛涨203% !

比亚迪西班牙猛涨203% !

后视镜里de未来
2026-03-04 11:44:32
朝阳“暴雷”学校被接盘!网友:上不起

朝阳“暴雷”学校被接盘!网友:上不起

朝阳通
2026-03-06 15:36:34
打哭了!中国女足大胜乌兹别克斯坦:对方美女主帅“食言”!

打哭了!中国女足大胜乌兹别克斯坦:对方美女主帅“食言”!

邱泽云
2026-03-06 18:34:07
曼联若换帅选谁?贝尔联手生姜头疯狂安利:请这老头准没错!

曼联若换帅选谁?贝尔联手生姜头疯狂安利:请这老头准没错!

仰卧撑FTUer
2026-03-06 19:46:05
火箭遭喷上全美热搜!年轻核心被高估 休媒直言争冠无望 勇记嘲讽

火箭遭喷上全美热搜!年轻核心被高估 休媒直言争冠无望 勇记嘲讽

颜小白的篮球梦
2026-03-06 12:05:51
宋轶整容失败认不出?脸变宽嘴变大颧骨变高,乍一看还以为是易梦玲

宋轶整容失败认不出?脸变宽嘴变大颧骨变高,乍一看还以为是易梦玲

八卦王者
2026-03-06 11:42:04
莫迪就中东局势罕见发声

莫迪就中东局势罕见发声

中国网
2026-03-06 20:16:19
全国人大代表,成都市委副书记、市长陈书平:推动“成渝CP”再创发展新高度|两会开放日

全国人大代表,成都市委副书记、市长陈书平:推动“成渝CP”再创发展新高度|两会开放日

封面新闻
2026-03-06 19:25:02
余华:若想一日不得安宁,你就请客;若想一年不得安宁,你就盖屋

余华:若想一日不得安宁,你就请客;若想一年不得安宁,你就盖屋

富书
2026-03-04 20:37:33
女单史上第2长!世界第一安洗莹跨赛季35连胜,超越谢杏芳

女单史上第2长!世界第一安洗莹跨赛季35连胜,超越谢杏芳

体育妞世界
2026-03-05 21:45:30
理想和大众,证明邪修增程车的尽头是比“发动机”

理想和大众,证明邪修增程车的尽头是比“发动机”

源Auto
2026-03-04 18:59:53
教育部发布关于全面推进健康学校建设的指导意见

教育部发布关于全面推进健康学校建设的指导意见

清华大学体育产业研究中心
2026-03-04 16:51:29
年薪900万!巴萨愿意续约29岁后卫:2年合同 要求大幅降薪

年薪900万!巴萨愿意续约29岁后卫:2年合同 要求大幅降薪

叶青足球世界
2026-03-06 16:06:58
一块布卡住英伟达的脖子!日企垄断30年后,中国造出王炸撕碎封锁

一块布卡住英伟达的脖子!日企垄断30年后,中国造出王炸撕碎封锁

胖哥不胡说
2026-01-20 11:10:05
活了30年才知道,不是东西难用,是你一直用错了!

活了30年才知道,不是东西难用,是你一直用错了!

室内设计师有料儿
2026-02-27 18:32:03
伊朗玩命!美防长称“不用理中俄”,转头发现:中国已经开始行动

伊朗玩命!美防长称“不用理中俄”,转头发现:中国已经开始行动

军机Talk
2026-03-05 12:52:30
德转预测:阿根廷世界杯主力阵容,身价4.5亿,前场豪华后防一般

德转预测:阿根廷世界杯主力阵容,身价4.5亿,前场豪华后防一般

夕落秋山
2026-03-06 13:45:04
湖南卫视元宵晚会直播发生意外,一名表演嘉宾在完成舞台动作时意外失误撞向何炅,何炅:这是要给我拜个晚年吗

湖南卫视元宵晚会直播发生意外,一名表演嘉宾在完成舞台动作时意外失误撞向何炅,何炅:这是要给我拜个晚年吗

极目新闻
2026-03-04 09:59:45
2026-03-06 21:07:00
新浪财经 incentive-icons
新浪财经
新浪财经是一家创建于1999年8月的财经平台
2386941文章数 5707关注度
往期回顾 全部

科技要闻

独家|除夕加班、毫无黑料!林俊旸无奈离场

头条要闻

美国击沉伊朗军舰后 印度总理莫迪就中东局势罕见发声

头条要闻

美国击沉伊朗军舰后 印度总理莫迪就中东局势罕见发声

体育要闻

跑了24年,他终于成为英超“最长的河”

娱乐要闻

周杰伦社交媒体晒昆凌,夫妻感情稳定

财经要闻

关于经济、股市等,五部门都说了啥?

汽车要闻

逃离ICU,上汽通用“止血”企稳

态度原创

手机
家居
亲子
游戏
教育

手机要闻

消息称港版华为Mate X7折叠屏手机搭载麒麟9030 Pro处理器

家居要闻

暖棕撞色 轻法奶油风

亲子要闻

中韩双胞胎萌娃回国第一天,简直太幸福了

《失落星船:马拉松》首发Steam峰值8.8万 不及《命运2》首发表现

教育要闻

高考地理中的冲淤原理

无障碍浏览 进入关怀版