网易首页 > 网易号 > 正文 申请入驻

【人工智能】AI 推理的演进:从链式到迭代和分层策略

0
分享至



近年来,思路链提示已成为大型语言模型推理的核心方法。通过鼓励模型“大声思考”,研究人员发现,循序渐进的解释可以提高数学和逻辑等领域的准确性。然而,随着任务变得越来越复杂,思路链提示的局限性也逐渐显现。它依赖于精心挑选的推理示例,这使得它难以处理过于简单或比这些示例更难的任务。虽然思路链提示为语言模型引入了结构化思维,但该领域现在需要更多能够处理复杂程度各异的复杂、多步骤问题的新方法。因此,研究人员正在探索迭代推理和分层推理等新策略。这些方法旨在使推理更深入、更高效、更稳健。本文将阐述思路链提示的局限性,探索思路链提示的演进,并展望扩展人工智能推理的应用、挑战和未来方向。

01

思维链的局限性

CoT 推理通过将复杂任务分解为更小的步骤,帮助模型处理这些任务。这种能力不仅提升了数学竞赛、逻辑谜题和编程任务的基准测试结果,还通过公开中间步骤提供了一定的透明度。然而,尽管 CoT 有这些优势,它并非没有挑战。研究表明,CoT 在处理需要符号推理或精确计算的问题时效果最佳。然而,对于开放式问题、常识性推理或事实回忆,它通常对准确性的提升甚微,甚至会降低准确性。

理论推理(CoT)本质上是线性的。该模型会生成一个单一的步骤序列来得出答案。这对于简短且定义明确的问题非常有效,但当任务需要更深入的探索时,就会遇到困难。此外,复杂的推理通常涉及分支、回溯和重新审视假设。单一的线性链无法捕捉这些。如果模型在早期犯错,所有后续步骤都会崩溃。即使推理正确,线性输出也无法适应新的信息或重新检验先前的假设。现实世界的推理需要灵活性,而理论推理无法提供这种灵活性。

研究人员还强调了扩展问题。随着模型面临更艰巨的任务,链条会变得更长、更脆弱。对多条链条进行采样或许有帮助,但很快就会变得效率低下。问题在于如何从狭窄的单路径推理转向更稳健的策略。

02

下一步是迭代推理

一个有前景的方向是迭代。该模型并非一次性得出最终答案,而是循环推理、评估和改进。这反映了人们解决难题的方式:首先起草解决方案,然后进行检查,找出不足之处,并逐步改进。

迭代方法允许模型从错误中恢复并探索替代解决方案。它们创建一个反馈循环,模型在其中自我批判推理,或者多个模型相互批判。一个强大的想法是自洽性。模型不会信任单一的思路,而是会采样多条推理路径,然后选择最常见的答案。这模仿了学生在信任答案之前尝试多种方法解决问题。研究表明,聚合多条推理路径可以提高可靠性。最近的研究将这一想法扩展到结构化迭代中,其中输出被反复检查、修正和扩展。

这种能力还使模型能够使用外部工具。迭代使得将搜索引擎、求解器或记忆系统集成到循环中变得更容易。模型不再局限于一个答案,而是可以查询外部资源,重新思考其推理过程并修改其步骤。迭代将推理过程转变为一个动态过程,而非静态链条。

03

复杂性的分层方法

当任务变得非常庞大时,单靠迭代是不够的。对于需要长远规划或多阶段规划的问题,层次结构至关重要。人类始终运用层次推理。我们将任务分解为子问题,设定目标,然后以结构化的层次进行处理。模型也需要同样的能力。

分层方法允许模型将任务分解为更小的步骤,并并行或顺序求解。思维程序 和思维树的研究 突出了这一方向。推理不再是扁平的链条,而是以树或图的形式组织,其中可以探索和修剪多条路径。这使得搜索不同的策略并选择最有希望的策略成为可能。在这个方向上,一个新的发展是思维森林框架,它可以同时启动许多推理“树”,并在它们之间使用共识和纠错机制。每棵树都可以探索不同的路径;看起来没有希望的树会被修剪,而自我修正机制可以让模型发现并修复任何分支中的错误。通过合并所有树的投票,模型做出集体决策。

层级结构还能促进协调。大型任务可以分配给处理问题不同部分的智能体。一个智能体可以专注于规划,另一个智能体专注于计算,还有一个智能体专注于验证。然后,所有结果可以整合成一个连贯的单一解决方案。多智能体推理的早期实验 表明,这种分工模式可以优于单链方法。

04

验证和可靠性

迭代和分层策略的另一个优势在于它们本身就允许验证。思路链揭示了推理步骤,但并不能保证其正确性。通过迭代循环,模型可以检查自身的步骤,也可以让其他模型进行检查。通过分层结构,可以独立验证不同层级。

这为结构化评估流程打开了大门。例如,模型可以在较低层级生成候选解决方案,而较高层级的控制器则对其进行选择或优化。或者,外部验证器可以在接受输出之前,根据约束条件对其进行测试。这些机制使推理更加可靠,更加可信。

验证不仅关乎准确性,还能提升可解释性。通过将推理组织成层或迭代,研究人员可以更轻松地检查失败的位置。这既支持调试,也支持比对,使开发人员能够更好地控制模型的推理方式。

05

应用

高级推理策略已在各个领域得到应用。在科学领域,它们支持高等数学问题解决,甚至有助于起草研究提案。在编程领域,模型如今在竞争性编码、调试和整个软件开发周期中都表现良好。

法律和商业领域受益于复杂的合同分析和战略规划。AI Agent 系统将推理与工具使用相结合,管理跨 API、数据库和 Web 的多步骤操作。在教育领域,辅导系统可以逐步讲解概念并提供个性化指导。

06

挑战与悬而未决的问题

尽管迭代和分层方法前景光明,但仍有许多挑战亟待解决。其中之一就是效率。迭代循环和树形搜索的计算成本可能很高。如何在彻底性和速度之间取得平衡仍是一个悬而未决的问题。

另一个挑战是控制。确保模型遵循有效的策略而不是陷入无效的循环非常困难。研究人员正在探索利用启发式方法、规划算法或学习控制器来指导推理的方法,但该领域仍处于起步阶段。

评估也是一个悬而未决的问题。传统的准确度基准仅捕捉结果,而非推理过程的质量。我们需要新的评估框架来衡量推理策略的稳健性、适应性和透明度。

最后,还有一致性问题。迭代和分层推理可能会放大模型的优势和劣势。虽然它们可以使推理更加可靠,但也使得预测模型在开放式场景下的表现变得更加困难。为了避免新的风险,必须进行精心设计和监督。

总结

思维链为人工智能的结构化推理打开了大门,但其线性局限性显而易见。未来在于迭代和分层策略,这些策略能够使推理更具自适应性、可验证性和可扩展性。通过循环改进和分层问题求解,人工智能可以从脆弱的逐步链条转变为能够应对现实世界复杂性的稳健、动态的推理系统。

免责声明:

本文所发布的内容和图片旨在传播行业信息,版权归原作者所有,非商业用途。如有侵权,请与我们联系删除。所有信息不构成任何投资建议,加密市场具有高度风险,投资者应基于自身判断和谨慎评估做出决策。投资有风险,入市需谨慎。

设为星标 避免错过

虚拟世界没有旁观者,每个点赞都是创造历史的像素

关注我,一起探索AWM⁺

2025-08-15

2025-08-14

2025-08-13

商业赞助


点击下方 “目录” 阅读更多

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
三只羊复出!两大徒弟开播,乔妹清纯嘴哥在线超8万,选品好谨慎

三只羊复出!两大徒弟开播,乔妹清纯嘴哥在线超8万,选品好谨慎

裕丰娱间说
2025-09-15 22:22:55
小泉进次郎支持率飙升,麻生太郎态度反转!

小泉进次郎支持率飙升,麻生太郎态度反转!

天真无牙
2025-09-15 15:53:22
惊呆了!西贝的厨师工资7000,服务员8000,网友:就是一个热菜员

惊呆了!西贝的厨师工资7000,服务员8000,网友:就是一个热菜员

明月杂谈
2025-09-15 05:47:53
人民日报、新华社接连发文,只字不提罗永浩,却句句暗指罗永浩

人民日报、新华社接连发文,只字不提罗永浩,却句句暗指罗永浩

小兰聊历史
2025-09-15 17:48:40
中美密谈6小时,3个细节抢眼,美财长事后放狠话,我国寸步不让

中美密谈6小时,3个细节抢眼,美财长事后放狠话,我国寸步不让

DS北风
2025-09-15 11:47:04
7条中欧班列,全都要经过波兰?19架来历不明的无人机闯大祸了

7条中欧班列,全都要经过波兰?19架来历不明的无人机闯大祸了

历史摆渡
2025-09-15 12:50:03
陈震谈小米16改名:让人一看到iPhone 17就想到小米17

陈震谈小米16改名:让人一看到iPhone 17就想到小米17

手机中国
2025-09-15 13:45:01
姜萍从数学天才到黑丝网红,这是什么情况!?

姜萍从数学天才到黑丝网红,这是什么情况!?

霹雳炮
2025-09-15 22:34:29
国家统计局:8月全国城镇调查失业率5.3%

国家统计局:8月全国城镇调查失业率5.3%

澎湃新闻
2025-09-15 10:02:29
西贝道歉信激怒大众?私下聊天记录曝光,西贝曾"滑跪"递话求饶

西贝道歉信激怒大众?私下聊天记录曝光,西贝曾"滑跪"递话求饶

乌娱子酱
2025-09-15 16:51:05
扶老人过马路被打后续:老人已找到,目击者发声,警方:需要道歉

扶老人过马路被打后续:老人已找到,目击者发声,警方:需要道歉

奇思妙想草叶君
2025-09-14 22:28:58
深圳一市民捡到2267.83克巨型金条

深圳一市民捡到2267.83克巨型金条

深圳晚报
2025-09-15 19:38:21
美制武器遭多国放弃,乌克兰女博主曝比尔盖茨援乌100亿美元细节

美制武器遭多国放弃,乌克兰女博主曝比尔盖茨援乌100亿美元细节

史政先锋
2025-09-15 17:41:44
小红书为什么被约谈?就是因为这女孩的视频,因为她的话太炸裂!

小红书为什么被约谈?就是因为这女孩的视频,因为她的话太炸裂!

花心电影
2025-09-15 08:24:28
一夜之间,成千上万的小餐饮老板,仿佛约好了一样,集体“醒”了

一夜之间,成千上万的小餐饮老板,仿佛约好了一样,集体“醒”了

阿伧说事
2025-09-15 15:25:30
中欧班列是中国和欧洲的黄金大动脉,现在却被波兰关闭,无法运行

中欧班列是中国和欧洲的黄金大动脉,现在却被波兰关闭,无法运行

大道无形我有型
2025-09-15 18:33:17
特讯!卡塔尔发表“罕见”涉华言论,西方国家“舆论”一片哗然

特讯!卡塔尔发表“罕见”涉华言论,西方国家“舆论”一片哗然

科技出仕
2025-09-15 23:35:59
第14次!杜普兰蒂斯毫无悬念夺金,6米30再破撑竿跳世界纪录

第14次!杜普兰蒂斯毫无悬念夺金,6米30再破撑竿跳世界纪录

直播吧
2025-09-15 21:59:33
警惕!退休金外的这几笔钱,无人通知,不主动领就亏大了!

警惕!退休金外的这几笔钱,无人通知,不主动领就亏大了!

慧眼看世界哈哈
2025-09-15 10:43:20
西贝正式发布道歉信:“绝对权威者”贾国龙的一次大败

西贝正式发布道歉信:“绝对权威者”贾国龙的一次大败

锌财经
2025-09-15 16:21:10
2025-09-16 07:19:00
七元宇宙 incentive-icons
七元宇宙
AI、Web3、Meta聚合型精选内容分享。以前沿视角,探索科技未来;让每一个人,都走在时代的前沿
1704文章数 91关注度
往期回顾 全部

科技要闻

官方:英伟达违反反垄断法 将施进一步调查

头条要闻

中美就妥善解决TikTok问题达成基本框架共识

头条要闻

中美就妥善解决TikTok问题达成基本框架共识

体育要闻

诺维茨基退役十年后,德国篮球走向巅峰

娱乐要闻

60岁张曼玉定居法国:瘦成皮包骨?

财经要闻

华与华秒怂 罗永浩称已接到对方道歉

汽车要闻

后轮转向和5C 2026款梦想家把想到的都给了

态度原创

教育
游戏
家居
健康
军事航空

教育要闻

责任与回报的失衡困境:班主任没人当,抽签解决

TES输得可惜!赛后官博沦陷,粉丝怒喷369:最大短板!越打越菜

家居要闻

典雅大气 舒适中带童趣

内分泌科专家破解身高八大谣言

军事要闻

三人伪装"外卖员""钓鱼佬"窃取军事秘密 详情公布

无障碍浏览 进入关怀版