网易首页 > 网易号 > 正文 申请入驻

神经符号扩散模型:突破性整合神经感知与符号推理的新框架

0
分享至

论文研究团队及发表信息

这项研究由英国爱丁堡大学信息学院的Emile van Krieken、Pasquale Minervini、Edoardo Ponti和Antonio Vergari共同完成,论文题为《Neurosymbolic Diffusion Models》(神经符号扩散模型),于2025年5月19日发表在arXiv预印本服务平台(arXiv:2505.13138v1),目前正在接受审阅。

解决的关键问题:思维"孤岛"之间的桥梁

想象你是一个盲人,正试图理解一个雕塑。你可以通过触摸感知它的形状(神经感知),但要真正理解这个雕塑代表什么,你还需要将这些触感转化为具体概念和逻辑关系(符号推理)。现代人工智能面临着类似的挑战:如何将原始感知数据与高层次的逻辑思维无缝连接?

神经符号(NeSy)人工智能正是为解决这一问题而生。它结合了神经网络的感知能力和符号系统的推理能力,创造出既能"看"又能"思考"的AI系统。然而,目前的神经符号模型存在一个关键局限:它们假设从输入提取的概念之间是相互独立的。

这就像假设我们看到"狗"和"尾巴"这两个概念时,两者之间没有任何关联。这种假设虽然使计算变得简单,但也导致模型无法捕捉概念间的重要关系,就像它无法理解"摇尾巴的狗"和"狗摇尾巴"之间的细微区别一样。

推理捷径:AI的"考试作弊"

更糟糕的是,这种独立性假设导致神经符号模型容易形成所谓的"推理捷径"(reasoning shortcuts)。这有点像学生在考试中找到了一种取巧的方法:他们能得到正确答案,但实际上并不理解潜在的概念。

例如,一个模型可能正确识别出"3+4=7",但它可能是通过记住"当看到3和4时输出7"而不是真正理解加法的概念。在现实世界中,这会导致AI系统在遇到新情况时突然失效,而且让人无法理解为什么会失效。

神经符号扩散模型:突破性的解决方案

爱丁堡大学的研究团队提出了一个突破性的解决方案——神经符号扩散模型(NESYDMS)。这是第一个将扩散模型(一种生成AI的前沿技术)与神经符号推理相结合的框架。

想象一下扩散模型就像是一个能够逐渐从模糊到清晰恢复图像的过程。研究团队将这一过程应用于符号概念,使AI系统能够逐步构建出概念之间的复杂关系,而非简单地假设它们相互独立。

关键的创新在于,NESYDMS在每个局部步骤中仍然利用了独立性假设的计算优势,但通过多个这样的步骤逐渐构建出全局依赖关系。这就像建造一座复杂的乐高城堡:每次只需专注于放置一块积木(简单计算),但最终完成的是一个复杂的整体结构(概念间的依赖关系)。

工作原理:从模糊到清晰的概念重建

NESYDMS的工作原理可以通过一个直观的例子来理解:假设你正在玩一个迷宫游戏,需要找出从起点到终点的最短路径。

在传统的神经符号方法中,AI会首先识别迷宫中每个格子的类型(如草地、沙地或岩石),然后根据这些类型计算最短路径。但问题是,如果AI错误地将沙地识别为草地,它可能会计算出错误的路径,而且无法意识到自己的错误。

NESYDMS采用了一种全新的方法:

1. 首先,它会对迷宫中的每个格子类型进行初步猜测。 2. 然后,它会故意"模糊"一些格子的类型,就像给部分迷宫打上马赛克。 3. 接下来,它尝试恢复这些被模糊的格子类型,但不只是单独考虑每个格子,而是考虑其他格子和最终路径的约束。 4. 通过多次重复这个过程,模型能够发现格子类型之间的依赖关系,以及它们与最终路径的关系。

这种方法使NESYDMS能够表达对不同可能概念的不确定性,并了解哪些概念组合是一致的。当模型遇到模棱两可的情况时,它不会武断地选择一个答案,而是能够表达出多种可能性及其概率。

技术实现:数学原理与创新点

从技术角度看,NESYDMS基于两个关键创新:

第一,研究团队开发了一种新的连续时间损失函数,能够将符号程序无缝集成到扩散过程中。这就像是创造了一种新的数学语言,使神经网络和符号程序能够有效沟通。

第二,他们设计了一种高效的梯度估计算法,使得模型能够处理大规模推理问题。这就像开发了一种快速导航系统,即使在复杂的概念地图上也能迅速找到最优路径。

一个关键的数学突破是证明了掩码扩散模型(一种离散扩散技术)的连续时间损失可以扩展到非分解分布。用通俗的语言说,这意味着他们发现了一种方法,可以在保持计算效率的同时处理概念之间的复杂依赖关系。

实验验证:从数字加法到自动驾驶

研究团队在多个具有挑战性的基准测试上评估了NESYDMS的性能:

在MNIST多位数加法任务中,他们让模型学习识别图像中的数字并计算它们的和。这类似于教一个AI系统先识别手写数字,然后执行算术运算。NESYDMS在包含15位数字的加法任务上达到了77.29%的准确率,与当前最先进方法相当。

更令人印象深刻的是视觉路径规划任务。这是一个极具挑战性的问题,需要AI系统理解视觉场景并规划最优路径。在30×30的网格上,问题的复杂度达到了惊人的5^900种可能状态。NESYDMS在这个任务上达到了97.40%的准确率,显著超越了现有方法。

研究团队还在RSBench测试集上评估了NESYDMS对推理捷径的感知能力。结果表明,NESYDMS在准确性和校准性之间取得了良好的平衡,能够有效地表示概念的不确定性,而不会给出过度自信的错误预测。

在真实世界的基于规则的自动驾驶任务上,NESYDMS表现出色,不仅预测准确率高,还具有良好的校准性和概念性能。这意味着它不仅能做出正确决策,还"知道它知道什么"——这对于安全关键应用至关重要。

未来展望与局限性

尽管NESYDMS取得了显著进展,研究团队也坦诚地指出了一些局限性和未来工作方向。

首先,NESYDMS的可扩展性依赖于输出空间的分解特性或符号程序的高效表示。研究人员指出,探索如何自动将复杂问题转化为这些可处理形式是一个有价值的未来研究方向。

其次,最大化变分熵和处理来自变分分布采样的间接梯度仍有优化空间。这些技术挑战就像是需要进一步完善的发动机部件,以使整个系统运行得更加高效。

最后,研究团队提出了将NESYDMS扩展到混合扩散模型的可能性,这种模型同时包含符号概念和连续隐变量。这可能为处理同时包含离散和连续特性的复杂问题(如生成满足约束的表格数据)开辟新途径。

结论:跨越符号与神经网络的鸿沟

NESYDMS代表了神经符号AI领域的重要进步。通过创新性地将离散扩散模型整合到神经符号框架中,研究团队成功地创造了一种既可扩展又能感知推理捷径的方法。

这项研究的意义远超技术创新。它展示了如何构建既能看懂世界(感知),又能思考世界(推理)的AI系统。这种能力对于需要可解释性和可靠性的安全关键应用(如自动驾驶、医疗诊断)至关重要。

归根结底,NESYDMS向我们展示了弥合神经感知与符号推理之间鸿沟的一种可行方法。这不仅是朝着更智能的AI系统迈出的一步,也是朝着更可靠、更可解释AI系统迈出的一步——一种不仅能给出正确答案,还能让我们理解为什么是正确答案的AI系统。

对于有兴趣深入了解这项研究的读者,可以通过arXiv:2505.13138v1访问完整论文,或前往GitHub仓库https://github.com/HEmile/neurosymbolic-diffusion查看代码实现。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
立陶宛请求访华,要当面向中方认错?中方开出条件,做不到就免谈

立陶宛请求访华,要当面向中方认错?中方开出条件,做不到就免谈

掉了颗大白兔糖
2026-03-26 07:31:17
扫地僧不去干预,乔峰父子打得过慕容博、慕容复、鸠摩智三人吗?

扫地僧不去干预,乔峰父子打得过慕容博、慕容复、鸠摩智三人吗?

武侠百晓生
2026-03-26 10:50:32
中东战场外的大赢家:俄罗斯拿下越南核电和液化天然气大单

中东战场外的大赢家:俄罗斯拿下越南核电和液化天然气大单

澎湃新闻
2026-03-25 19:52:29
1 胜 180 负! 加时领先 13 分 被逆转,火箭耻辱创史!

1 胜 180 负! 加时领先 13 分 被逆转,火箭耻辱创史!

贵圈真乱
2026-03-26 17:33:49
岳云鹏现身上海,气场跟以前完全不一样了,助理当街抽烟也不避讳

岳云鹏现身上海,气场跟以前完全不一样了,助理当街抽烟也不避讳

仙味少女心
2026-03-24 16:47:29
服务犬第一次坐飞机,不忘叼着自己的阿布布,全程乖巧像小玩偶

服务犬第一次坐飞机,不忘叼着自己的阿布布,全程乖巧像小玩偶

Magic宠物社
2026-03-25 19:11:59
特变电工:公司输变电产线基本处于满负荷生产状态,公司变压器、电线电缆、电抗器等输变电产品在手订单饱满

特变电工:公司输变电产线基本处于满负荷生产状态,公司变压器、电线电缆、电抗器等输变电产品在手订单饱满

每日经济新闻
2026-03-26 19:25:48
金刻羽给特朗普献计:现有政策全部反过来,就能锁住中国发展

金刻羽给特朗普献计:现有政策全部反过来,就能锁住中国发展

福建平子
2026-03-21 09:14:00
第一名帅!执教18年获40冠,瓜迪奥拉甩开穆里尼奥,有望超弗格森

第一名帅!执教18年获40冠,瓜迪奥拉甩开穆里尼奥,有望超弗格森

夏侯看英超
2026-03-24 00:07:54
“尼帕病毒”来势汹汹,建议:每家备好6样东西,关键时刻能救命

“尼帕病毒”来势汹汹,建议:每家备好6样东西,关键时刻能救命

路医生健康科普
2026-01-28 12:18:49
U23国足2-2逼平泰国,名宿范志毅赛后点评言辞犀利,句句在理!

U23国足2-2逼平泰国,名宿范志毅赛后点评言辞犀利,句句在理!

田先生篮球
2026-03-25 22:37:26
A股:两个信息落地,明天,周五或会这样走了!

A股:两个信息落地,明天,周五或会这样走了!

明心
2026-03-26 16:35:30
微软前CTO长文控诉:Windows被搞成一锅粥!14年14次转变、17种GUI共存

微软前CTO长文控诉:Windows被搞成一锅粥!14年14次转变、17种GUI共存

快科技
2026-03-25 15:13:32
伊朗导弹砸向美国航母:伊朗打出了开战以来最强一拳

伊朗导弹砸向美国航母:伊朗打出了开战以来最强一拳

起喜电影
2026-03-26 14:20:32
法媒:“伊朗战争的首个受害者是真相”

法媒:“伊朗战争的首个受害者是真相”

参考消息
2026-03-26 13:30:07
“以前每桶省20美元,现在一分折扣没有” 油价“破百”下的山东地炼产业现状深度调查

“以前每桶省20美元,现在一分折扣没有” 油价“破百”下的山东地炼产业现状深度调查

每日经济新闻
2026-03-26 13:14:14
苹果把降噪塞了1.5倍,价格却忘了改

苹果把降噪塞了1.5倍,价格却忘了改

硬核玩家2哈
2026-03-25 22:01:40
再也不愁充电难了!成都将充电桩装在路灯上:600多个点位4月底投用

再也不愁充电难了!成都将充电桩装在路灯上:600多个点位4月底投用

快科技
2026-03-26 16:20:10
腿部是心梗的提示器?提醒:若腿部出现这4种表现,尽快就医

腿部是心梗的提示器?提醒:若腿部出现这4种表现,尽快就医

路医生健康科普
2026-03-16 22:10:03
特朗普战争致共和党优势尽失,民主党胜率达85%

特朗普战争致共和党优势尽失,民主党胜率达85%

揽星辰入梦
2026-03-26 18:51:00
2026-03-26 20:04:49
科技行者 incentive-icons
科技行者
科技正在如何变革商业世界
7746文章数 556关注度
往期回顾 全部

科技要闻

Meta高管狂分百亿期权,700名员工却下岗

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

刘晓庆妹妹发声!称姐姐受身边人挑拨

财经要闻

油价"驯服"特朗普?一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

亲子
艺术
健康
时尚
军事航空

亲子要闻

这就是引导型老师的厉害吗?

艺术要闻

哪一座桥不是风景?

转头就晕的耳石症,能开车上班吗?

皮衣+裙,高级到炸

军事要闻

担心特朗普突然停战 以总理下令48小时尽力摧毁伊设施

无障碍浏览 进入关怀版