网易首页 > 网易号 > 正文 申请入驻

【人工智能】神经符号学的转变:纯LLM为何遭遇困境

0
分享至

人工智能行业正在经历一场尚未被广泛认可的重大转变。尽管大型语言模型 (LLM) 继续占据主导地位,但一种新的方法正在悄然兴起。这种方法,本文称为神经符号 LLM,它使基于神经网络的 LLM 能够运用符号推理来执行任务。与仅依赖神经网络模式识别能力的纯 LLM 不同,神经符号 LLM 首先将自然语言指令转换为符号程序,然后使用外部符号解释器(例如编程语言解释器)来执行这些程序。这种集成增强了模型处理复杂任务的能力,从而提供更高的准确性、透明度和可解释性。在本文中,我们将探讨神经符号 LLM 日益普及的原因。

扩展神话破灭

纯 LLM 时代的关键承诺很简单:更大的模型将产生更好的结果。这个想法是,有了更多的数据和计算能力,人工智能就可以产生更好的结果。这个理论一度有效,但最近的发展已经显示出它的局限性。最近的一个例子是 Grok 4,它使用的计算能力是其前身的 100 倍,但在人类的最后考试等具有挑战性的基准测试中并没有显示出显着的改进。虽然 Grok 4 在某些领域表现更好,但收益远低于预期。然而,当将符号工具集成到这些模型中时,性能显着提高。这表明单靠扩展并不是提高人工智能性能的关键,而神经符号方法有可能超越纯 LLM。

纯神经网络的局限性

纯 LLM 存在一些固有的弱点,这些弱点在扩展过程中无法克服。这些限制源于 LLM 构建的方式,即使用神经网络,而神经网络主要依赖于模式识别。虽然 LLM 在许多情况下都有效,但它们对模式识别的依赖以及推理能力的缺乏限制了它们执行需要更深入理解或逻辑推理的复杂任务的能力。例如,当苹果研究人员在数学问题中添加不相关的子句时,最先进的 LLM 的准确率会下降高达 65%。在 GSM-Symbolic研究中,即使在完美的视觉输入下,当数字被打乱或添加额外子句时,LLM 的表现也会很差。

这种缺陷的另一个例子体现在填字游戏的构建中。ChatGPT 无法理解代码,在网格构建等任务上表现不佳。这导致它犯了一些简单的错误,例如将“ RCRCT ”识别为有效单词。相比之下,使用符号代码的 OpenAI o3 可以正确创建填字游戏网格。这表明,纯 LLM 无法可靠地执行算法流程,无法区分相关性和因果关系,也无法在多步骤推理任务中保持逻辑一致性。

符号人工智能的兴起:逻辑精度高于模式匹配

符号人工智能采用透明的、基于规则的系统,更易于理解和验证。与通常不透明的神经网络不同,符号系统提供了从输入到结论的清晰推理路径。这使得符号人工智能成为需要透明度和可追溯性的应用的理想选择。

符号系统也更高效。例如,神经符号概念学习器仅使用传统神经网络所需数据的10%就实现了高精度。更重要的是,符号系统可以为每个决策提供人类可读的解释,这对于医疗保健、金融和法律等领域至关重要。

最近的研究表明,符号方法在汉诺塔问题等任务中非常有效,其中像 o3 这样的模型在使用符号代码时表现更佳。同样,具有情境感知的溯因规则学习器(ARLC) 在算术问题中表现出近乎完美的准确率,而纯 LLM 在问题变得更加复杂时甚至难以达到 10% 的准确率。

对可解释人工智能的需求日益增长

随着人工智能系统监管的不断加强,对可解释且透明的人工智能的需求也将不断增长。医疗保健、金融和法律等领域需要能够解释其推理过程的人工智能系统。神经符号人工智能尤其适合满足这些需求。欧盟的《人工智能法案》及类似法规正在推动企业采用能够体现问责制和透明度的人工智能系统。

此外,投资趋势正转向能够平衡性能与可解释性的人工智能系统。重视创新和信任的公司发现,神经符号系统凭借其卓越的决策解释能力,越来越具有吸引力。

利用神经符号集成提高人工智能的可靠性

尽管纯LLM取得了显著进展,但其可靠性仍然令人担忧,尤其是在医疗保健、法律和金融等高风险领域。这种不可靠性源于LLM对模式和概率的依赖,这可能导致不可预测的输出和错误。神经符号LLM将神经网络与符号推理相结合,提供了一种解决方案。通过使用逻辑来验证和组织信息,LLM可以确保生成的响应既准确又可靠。它可以减少错误,提高透明度,并保持输出的一致性。这种方法在关键领域尤其有价值,可以提高人们对人工智能系统的信任度。GraphRAG模型就是这种方法的一个例子,它展示了如何结合这些技术来增强创造力和准确性。

神经符号LLM实践

神经符号LLM)在应对复杂挑战方面表现出色。谷歌 DeepMind 的系统(例如AlphaFold、AlphaProof和AlphaGeometry)将 LLM 与符号推理相结合,在蛋白质折叠、数学定理证明和几何问题求解方面取得了卓越的成果。它们使用了搜索和条件迭代等符号推理技术,而这些技术是传统神经网络所摒弃的。此外,现代模型越来越多地使用符号规则进行数据增强,这表明符号推理正在成为领先人工智能系统的关键组成部分。

挑战与机遇

虽然神经符号LLM已经取得了重大进展,但仍有许多工作要做。当前的实现(例如向 LLM 添加代码解释器)提供了功能性能力,但它们仍然不是满足通用人工智能 (AGI)要求的完整解决方案。真正的挑战是开发神经和符号组件无缝协作的系统,让机器能够像人类一样推理和理解世界。神经符号LLM的未来目标之一是使它们能够动态地与不同的推理模式集成而不丢失一致性。这将使它们能够在不同情况下进行不同的推理。然而,它需要能够将符号推理与神经网络一起使用的新架构。

底线

神经符号人工智能的兴起是人工智能发展的范式转变。虽然传统的LLM(LLM)已被证明在许多领域有效,但它们受限于对模式识别的依赖和推理能力的缺乏。新兴的神经符号方法将LLM与符号推理相结合,在准确性、透明度和可解释性方面具有显著优势。神经符号系统在需要复杂推理、逻辑精确性和可解释性的任务中表现出色。这些特质在医疗保健、金融和法律等受监管行业中日益重要。随着对人工智能透明度和可问责性的需求日益增长,神经符号人工智能正成为开发更可靠、更易理解的系统的关键解决方案。然而,完全整合神经和符号组件仍面临挑战,需要持续创新才能创建能够跨多种模式进行动态推理的系统。

免责声明:

本文所发布的内容和图片旨在传播行业信息,版权归原作者所有,非商业用途。如有侵权,请与我们联系删除。所有信息不构成任何投资建议,加密市场具有高度风险,投资者应基于自身判断和谨慎评估做出决策。投资有风险,入市需谨慎。

设为星标 避免错过

虚拟世界没有旁观者,每个点赞都是创造历史的像素

关注我,一起探索AWM⁺

2025-07-28

2025-07-25

2025-07-24

商业赞助

点击下方 “目录” 阅读更多

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
这是张雪峰创业初期和女儿张姩菡的旧合照

这是张雪峰创业初期和女儿张姩菡的旧合照

岁月有情1314
2026-04-04 10:26:01
第95波打击!美国命门被炸,特朗普请求停火,中方已回应伊朗求援

第95波打击!美国命门被炸,特朗普请求停火,中方已回应伊朗求援

起喜电影
2026-04-05 12:19:36
过来人忠告:父母走的那天,哪怕心里再难受,也别在床边哭!

过来人忠告:父母走的那天,哪怕心里再难受,也别在床边哭!

游戏收藏指南
2026-04-03 00:12:24
刚从辽宁大连回来,毫不客气的说,中山区是全国市辖区城建天花

刚从辽宁大连回来,毫不客气的说,中山区是全国市辖区城建天花

奇思妙想生活家
2026-04-05 15:46:20
北京永定门城楼启动修缮,将重现历史风貌

北京永定门城楼启动修缮,将重现历史风貌

普陀动物世界
2026-04-05 11:44:21
自助者天助之!孙颖莎被埃及天才逼到绝境,靠一个擦边拯救了自己

自助者天助之!孙颖莎被埃及天才逼到绝境,靠一个擦边拯救了自己

三十年莱斯特城球迷
2026-04-04 15:10:26
德甲最新积分战报:拜仁奇迹逆袭,勒沃库森轰入6球,多特4连胜

德甲最新积分战报:拜仁奇迹逆袭,勒沃库森轰入6球,多特4连胜

足球狗说
2026-04-05 06:55:14
以色列重大战略转向!美军损失惨重:内塔尼亚胡已经在考虑"后事"了

以色列重大战略转向!美军损失惨重:内塔尼亚胡已经在考虑"后事"了

星辰大海路上的种花家
2026-04-05 15:16:23
以色列特种兵被打死!战友乱枪扫射自己人,致1死1重伤

以色列特种兵被打死!战友乱枪扫射自己人,致1死1重伤

战风
2026-04-05 16:56:53
一位g民果断出手

一位g民果断出手

风风顺
2026-04-05 14:18:40
气笑了!雷迪克:达拉斯影像团队把里夫斯的MRI扫描位置搞错了

气笑了!雷迪克:达拉斯影像团队把里夫斯的MRI扫描位置搞错了

懂球帝
2026-04-05 13:24:07
以数十万订单震惊业界的电车新贵运气似乎耗光了,销量无增长

以数十万订单震惊业界的电车新贵运气似乎耗光了,销量无增长

柏铭锐谈
2026-04-03 16:46:25
继续硬刚?京媒名嘴:北京国安被漏判点球,应重点申诉这2个判罚

继续硬刚?京媒名嘴:北京国安被漏判点球,应重点申诉这2个判罚

足球大腕
2026-04-05 16:24:14
震撼!网传火葬场一个月烧出医用金属假体堆成小山,大多是钛合金

震撼!网传火葬场一个月烧出医用金属假体堆成小山,大多是钛合金

火山詩话
2026-04-03 07:53:17
随着阿贾克斯1-2,埃因霍温4-3,荷甲最新积分榜出炉

随着阿贾克斯1-2,埃因霍温4-3,荷甲最新积分榜出炉

凌空倒钩
2026-04-05 07:09:56
对于中国来说,霍尔木兹只是短期痛苦,马六甲海峡才是终极命门

对于中国来说,霍尔木兹只是短期痛苦,马六甲海峡才是终极命门

壹只灰鸽子
2026-04-05 13:36:25
澳门世界杯捷报:女单爆大冷!世界冠军0:4出局,国乒被剃光头

澳门世界杯捷报:女单爆大冷!世界冠军0:4出局,国乒被剃光头

超喜欢我
2026-04-05 04:25:45
烟火伴锋芒,深情渡余生!张雪峰的爱情故事很浪漫

烟火伴锋芒,深情渡余生!张雪峰的爱情故事很浪漫

史海流年号
2026-04-03 08:25:33
俄罗斯军事专家:“最强超级大国已经诞生,美国必须接受现实”

俄罗斯军事专家:“最强超级大国已经诞生,美国必须接受现实”

让生活充满温暖
2026-03-22 16:46:14
看完澳门世界杯比起赢球得分我反倒被王曼昱一个小细节狠狠打动了

看完澳门世界杯比起赢球得分我反倒被王曼昱一个小细节狠狠打动了

小光侃娱乐
2026-04-05 15:25:05
2026-04-05 17:59:00
七元宇宙 incentive-icons
七元宇宙
AI、Web3、Meta聚合型精选内容分享。以前沿视角,探索科技未来;让每一个人,都走在时代的前沿
2042文章数 92关注度
往期回顾 全部

科技要闻

花200薅5千算力,Claude冷血断供“龙虾”

头条要闻

自称将劳斯莱斯变现 陈光标晒捐款图:张雪迟迟未提车

头条要闻

自称将劳斯莱斯变现 陈光标晒捐款图:张雪迟迟未提车

体育要闻

CBA最老球员,身价7500万美元

娱乐要闻

好用心!宋慧乔为好友庆生做一桌美食

财经要闻

谁造出了优思益这头“怪物”?

汽车要闻

家用SUV没驾驶乐趣?极氪8X第一个不同意

态度原创

艺术
教育
手机
家居
公开课

艺术要闻

怀素的这件“临终绝笔”,彻底改写了书法史

教育要闻

班主任紧急提醒:3类孩子期中考最易考砸,现在补救还来得及

手机要闻

Q1预排名:华为强势夺冠,OPPO第三,vivo第四

家居要闻

温馨多元 爱的具象化

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版