网易首页 > 网易号 > 正文 申请入驻

“AI”科普丨超越思维链:大型语言模型的X链范式综述

0
分享至

转自 专知


思维链(CoT)已经成为一种广泛采用的提示方法,激发了大型语言模型(LLMs)的印象深刻的推理能力。受CoT的连续思维结构的启发,已经开发了许多针对CoX(X链)的方法,以应对涉及LLMs的不同领域和任务中的各种挑战。在本文中,我们提供了一个全面的关于LLMs在不同情境下的CoX方法的综述具体来说,我们根据节点的分类,即CoX中的X,以及应用任务对它们进行分类。我们还讨论了现有CoX方法的发现和含义,以及潜在的未来方向。我们的综述旨在为寻求将CoT理念应用于更广泛场景的研究人员提供一个详细且最新的资源。

https://arxiv.org/abs/2404.15676


大型语言模型(LLMs)在使用思维链(CoT)方法提示时表现出强大的推理能力(Wei et al., 2022; Yao et al., 2024; Besta et al., 2024a)。CoT的本质是将复杂问题分解为一系列中间子任务(Chu et al., 2023; Zhou et al., 2023)。通过逐步处理这些子任务,LLMs能够关注重要的细节和假设,这大大提高了它们在广泛推理任务中的表现(Huang and Chang, 2023; Chu et al., 2023)。此外,CoT的中间步骤提供了一个更透明的推理过程,便于对LLMs的解释和评估(Yu et al., 2023b)。随着CoT的成功,开发了许多X链(CoX)方法(Yu et al., 2023a)。这些方法不仅限于推理思维,最近的CoX方法还构建了包含各种组件的链,如反馈链(Lei et al., 2023; Dhuliawala et al., 2023)、指令链(Zhang et al., 2023d; Hayati et al., 2024)、历史链(Luo et al., 2024; Xia et al., 2024d)等。这些方法已被应用于解决涉及LLMs的多样化任务中的挑战,包括多模态交互(Xi et al., 2023a; Zhang et al., 2024a)、幻觉减少(Lei et al., 2023; Dhuliawala et al., 2023)、基于LLM的代理规划(Zhan and Zhang, 2023; Zhang et al., 2024c)等。

尽管这些CoX方法的普及度不断提高,但它们尚未被集体审查或分类,我们对它们的潜力和细微差别的理解还存在差距。为此,本综述旨在提供一个结构化概览,捕捉CoX方法的本质和多样性,以便进一步探索和创新。虽然几项综述已经探讨了CoT(Chu et al., 2023; Yu et al., 2023b; Besta et al., 2024b),它们主要关注不同结构的推理思维,例如图1(a)所示的思维链。与此相反,本文关注的是如图1所示,超越推理思维的多面向组件设计的X链,提供CoT概念在更广泛领域的见解。我们通过CoX中的X的分类和应用这些方法的任务来呈现一个全面的综述。综述概览首先提供思维链的背景信息并定义X链为其概括(§2)。接下来,我们根据用于构建链的组件类型对CoX方法进行分类(§3)。此外,根据这些CoX方法的应用领域,我们按任务对它们进行分类(§4)。然后,我们讨论现有CoX方法的见解并探索潜在的未来方向(§5)。综述的详细结构在图2中呈现。


什么是X链?

在本节中,我们首先介绍一些关于思维链(Chain-of-Thought,CoT)提示的背景信息,然后定义一个广义的X链(Chain-of-X,CoX)概念。

思维链(CoT)提示是一种方法论,能显著增强大型语言模型(LLMs)的推理能力。CoT由Wei等人(2022)引入,涉及以结构化的格式 提示LLMs,其中“thoughts”包括通向最终答案的连贯的中间自然语言推理步骤。CoT在需要复杂推理的任务中效果最为显著。传统的少样本学习方法在这类场景中经常会失败,因为它们倾向于直接提供答案而不包括必要的中间步骤。Rae等人(2021)强调了这一局限性,指出这些方法随着模型大小的增加而显得不足。相比之下,CoT提示通过融入中间推理步骤而表现出色。这些步骤通过逻辑推进引导模型,增强其解决算术、常识和符号推理等复杂问题的能力(Wang等人,2023d;Lyu等人,2023)。CoT的本质在于通过将复杂问题分解为可管理的中间步骤来解决问题(Zhou等人,2023)。Kojima等人(2022)也展示了通过提示“让我们一步一步思考。”的零样本CoT的强大性能。明确的推理步骤还为模型的思考过程提供了一个透明的路径,允许进一步的评估和纠正(Yu等人,2023b)。

受CoT的顺序分解特性启发,最近开发了大量的X链(CoX)方法(Yu等人,2023a)。在这里,我们将CoX定义为CoT方法的一种广义形式,用于超越LLM推理的多样化任务。我们将CoX中的X称为链结构的“节点”。除了CoT提示中的思考外,CoX中的X可以采取针对特定任务定制的各种形式,包括中间件(§3.1)、增强(§3.2)、反馈(§3.3)甚至模型(§3.4),如图1所示。我们在图2中总结了现有CoX方法中的节点类型。CoX的想法是构建一个与问题相关的组件序列,这些组件要么组合贡献解决方案,要么迭代精炼复杂任务的输出。同样,我们为CoX定义了一个结构化格式 ,其中n是链的长度。请注意,这种格式超越了像CoT这样的提示策略,可以适应多种算法框架或结构,用于涉及LLMs的多样化任务。例如,验证链(Chain-of-Verification,Dhuliawala等人,2023)是一个幻觉减少框架,使用LLM生成初始响应,构建一系列验证问题,并根据这些问题修订其先前的响应。除了减少幻觉外,CoX方法还被应用于多种任务,如图2所示,包括多模态互动(§4.1)、事实性与安全(§4.2)、多步骤推理(§4.3)、指令跟随(§4.4)、LLMs作为代理(§4.5)和评估工具(§4.6)。

结论

本综述探讨了基于思维链概念构建的X链方法。通过根据节点和任务对它们进行分类,我们提供了一个全面的概览,突出了CoX在增强大型语言模型(LLMs)能力方面的潜力,并为未来研究开辟了新的途径。通过这项综述,我们旨在激发对LLMs的X链范式进行更深入理解和更有创造性使用的进一步探索。

【免责声明】转载出于非商业性的教育和科研目的,只为学术新闻信息的传播,版权归原作者所有,如有侵权请立即与我们联系,我们将及时删除。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
伊朗总统直升机坠毁原因引关注

伊朗总统直升机坠毁原因引关注

环球时报国际
2024-05-21 08:08:17
美国军方发布消息:俄罗斯开往中国油轮,遭到反舰导弹打击

美国军方发布消息:俄罗斯开往中国油轮,遭到反舰导弹打击

龙炎校尉
2024-05-20 09:03:47
避雷!网传退市风险预警名单,多家著名企业上榜

避雷!网传退市风险预警名单,多家著名企业上榜

小萝卜丝
2024-05-21 15:48:01
科协辟谣美登月造假:骂你蠢你还杠上了

科协辟谣美登月造假:骂你蠢你还杠上了

雾满拦江
2024-05-21 12:13:26
台海观澜|赖清德4年任内,两岸会不会有大事发生

台海观澜|赖清德4年任内,两岸会不会有大事发生

经济观察报
2024-05-21 11:39:08
全国人均寿命排行:决定寿命的行为,睡眠第9,跑步第2,第一是…

全国人均寿命排行:决定寿命的行为,睡眠第9,跑步第2,第一是…

华人星光
2024-05-20 12:03:06
后续!贵溪小学伤人案12人伤亡!网友建议重判保安,保安工资曝光

后续!贵溪小学伤人案12人伤亡!网友建议重判保安,保安工资曝光

古希腊掌管松饼的神
2024-05-21 11:35:44
1969年,战士五天剿灭90只狼,临走前一晚,半夜突然听见敲门声

1969年,战士五天剿灭90只狼,临走前一晚,半夜突然听见敲门声

阿坷叙故事
2024-04-15 10:24:53
真被郭台铭说对了?富士康出走“不赏饭”后,营收反创新高

真被郭台铭说对了?富士康出走“不赏饭”后,营收反创新高

奉壹数码
2024-05-20 20:32:49
BBC揭韩国男星阴暗细节:各种下药轮X拍视频互传!夜店迷倒直接带走?!

BBC揭韩国男星阴暗细节:各种下药轮X拍视频互传!夜店迷倒直接带走?!

英国那些事儿
2024-05-20 23:18:09
正部级老虎落马后,省政府表态!

正部级老虎落马后,省政府表态!

鲁中晨报
2024-05-21 12:39:05
复牌撤销ST,股价从19元跌到0.97元,4.6万股东等来一字天花板

复牌撤销ST,股价从19元跌到0.97元,4.6万股东等来一字天花板

惜别的海岸
2024-05-21 12:15:10
儿童“患癌”越来越多,这8种食品一定要少吃,家长必看

儿童“患癌”越来越多,这8种食品一定要少吃,家长必看

阿燕姐说育儿
2024-05-21 07:50:03
黄奇帆:房地产的负债率都飙到90%了,房价怎么可能还会往上涨!

黄奇帆:房地产的负债率都飙到90%了,房价怎么可能还会往上涨!

名岂文章著
2024-05-20 19:28:35
大降温!“五一”后各地餐饮生意断崖下滑,倒下的店越来越多……

大降温!“五一”后各地餐饮生意断崖下滑,倒下的店越来越多……

红餐网
2024-05-21 10:18:31
曝45岁伏明霞离婚,净身出户原因揭晓,71岁百亿丈夫只说6个字

曝45岁伏明霞离婚,净身出户原因揭晓,71岁百亿丈夫只说6个字

深度知局
2024-05-20 19:25:53
断崖式专利差!6G技术美国占了35.2%,日本9.9%,中国是多少?

断崖式专利差!6G技术美国占了35.2%,日本9.9%,中国是多少?

莫将离
2024-05-20 22:36:28
货币保卫战,输了!外汇储备见底,巨额债务压顶,或率先倒下?

货币保卫战,输了!外汇储备见底,巨额债务压顶,或率先倒下?

满大勋看经济
2024-05-21 12:35:59
《解放日报》被网暴,也是在打《人民日报》的脸

《解放日报》被网暴,也是在打《人民日报》的脸

观人随笔
2024-05-21 11:18:08
叶浩文任福鼎市代市长

叶浩文任福鼎市代市长

鲁中晨报
2024-05-21 13:59:05
2024-05-21 17:26:44
中国人工智能学会
中国人工智能学会
中国人工智能学会网易官方账号
2631文章数 1452关注度
往期回顾 全部

科技要闻

微软发AI PC:这次真的能与MacBook竞争了

头条要闻

美方无理指责中方向俄提供军事装备 中国代表当场回击

头条要闻

美方无理指责中方向俄提供军事装备 中国代表当场回击

体育要闻

兄弟们,为了我,拿下冠军吧!

娱乐要闻

杨洋乔欣聊天记录曝光!还牵扯张天爱

财经要闻

重营销轻研发 “扫地茅”股价已跌去78%

汽车要闻

四排八座纯电MPV/续航超过800km 翼真L380开启预订

态度原创

亲子
游戏
时尚
本地
房产

亲子要闻

宝宝被哄睡时含情脉脉盯着妈妈,“这就是我选的妈妈耶”

M站预测《地狱之刃2》媒体均分:83.2分

女人40也能很美!夏天利用穿搭来释放女人味,成熟风格有韵味

本地新闻

强制措施展铁腕 “交叉执行”勇亮剑

房产要闻

突然爆发!大量重磅宅地挂出,海南土地市场开始狂飙!

无障碍浏览 进入关怀版