网易首页 > 网易号 > 正文 申请入驻

姚期智院士大模型新研究:思维图DoT,用数学理论确保AI逻辑一致性

0
分享至

文章转载于量子位(QbitAI)
作者:西风

姚期智院士领衔,推出大模型新推理框架,CoT“王冠”戴不住了。

提出思维图(Diagram of Thought),让大模型思考更像人类。

团队更是为这种推理过程提供了数学基础,通过拓扑斯理论(Topos Theory)正式化(formalize)DoT,确保其逻辑一致性和合理性。

相比CoT将推理过程表示为线性序列,DoT更能捕捉人类推理的复杂性。

相比引入分支结构ToT和GoT,DoT不需要依赖外部控制机制或多个模型协作,训练部署更简单。

秘诀就在于,DoT将LLM中的迭代推理建模为在单一模型内构建有向无环图(DAG)。

DAG由代表命题、批评、精炼和验证的节点组成,边表示它们之间的逻辑关系或依赖关系,边都有方向,不存在任何循环路径。

这种无环的特性确保推理过程不受循环依赖的影响,能更真实反映合理的逻辑推导。

9.11和9.8哪个大、strawberry中有几个“r”等问题在DoT的帮助下全都迎刃而解了。

要知道,大模型最新“顶流”OpenAI o1目前被训练得原生具备生成CoT的能力,现在更强的DoT来了,是不是也可以通过强化学习内化到模型里,如此一来……

这项研究提出后得到了不小的关注。

网友纷纷表示这是一种正确的路径。

码住,码住,码住

具体来看看DoT长啥样。

1

大模型复杂推理新框架

如前所述,DoT将逻辑推理过程建模为在单个LLM内构建有向无环图(DAG)。

其框架内部管理三个关键角色:

  • 提议者:生成命题或推理步骤,添加新节点。

  • 批评者:评估命题,识别错误、不一致或逻辑谬误,并添加批评节点。

  • 总结者:将经过验证的命题综合成一个连贯的思维链,有效地执行DAG的拓扑排序(topological sort)以产出最终的推理输出。

这三个角色通过使用特殊token ,如 、 、 , 在模型的输出中被明确定义。LLM在生成过程中 在这些角色之间 无缝切换 ,利用其自回归能力根据上下文预测下一个token。

推理过程始于提议者引入一个命题,向DAG添加一个节点。

然后,由评论者评估验证或提供批评。如果提供了批评,将添加一个新节点,并在该命题和批评之间建立一个边。

基于批评,提议者生成一个精炼改进过的命题,表示为DAG中的一个新节点。

这一过程 重复进行, 命题不断被精炼直到得到验证 。

一旦建立了足够有效的命题,总结者就会综合这些推理,对DAG进行拓扑排序以产生一个连贯的思维链。

通过让模型接触正确和错误的推理,DoT允许LLM从错误中学习,随着时间的推移不断精炼其推理,这也更像人类解决问题的方式。

这种方法不仅捕捉了推理的非线性和迭代特性,还通过自然语言批评提供了比二元信号更丰富的反馈。

DoT的训练涉及使用格式化为DoT结构的训练样例,包括角色特定token和DAG表示。在推理过程中,模型基于上下文线索和角色特定token生成命题、批评和总结。

这种方法简化了部署,消除了对多LLM协作或外部控制机制的需求,同时与标准LLM训练范式保持一致,便于集成到现有工作流程中。

作者还为DoT框架提供了严格的数学基础,利用 Topos Theory 对推理过程进行了形式化描述。

在这个框架中,命题被建模为拓扑中终端对象的子对象,逻辑关系和推理步骤表示为态射,批评和改进过程分别对应到子对象分类器的态射和命题间的态射。

通过引入PreNet范畴,他们还成功捕捉了推理过程的动态和并发特性。

这种数学基础不仅确保了推理过程的逻辑一致性和完备性,还为设计下一代专门用于推理的AI模型提供了概念框架。

1

清华叉院姚期智、袁洋领衔

这篇论文由清华交叉信息研究院姚期智、袁洋领衔,论文第一作者为张伊凡。

张伊凡

张伊凡2021年本科毕业于于北京大学元培学院,现为清华大学交叉信息学院博士研究生,师从袁洋助理教授。

他的主要研究方向为基础模型(大语言模型)的理论和算法、自监督学习、可信人工智能。

袁洋

袁洋是清华大学交叉信息学院助理教授,博士生导师。

2012年毕业于北京大学计算机系;2018年获美国康奈尔大学计算机博士学位;2018-2019年前往麻省理工学院大数据科学学院做博士后。

他的主要研究方向是智能医疗、AI可解释性、AI大系统,在非凸优化理论、神经网络优化理论、机制设计等领域有颇多研究成果。

姚期智

姚期智是中国科学院院士、清华大学交叉信息研究院院长;同时也是“图灵奖”创立以来首位获奖的亚裔学者、迄今为止获此殊荣的唯一华人计算机科学家。

姚期智教授2004年从普林斯顿辞去终身教职回到清华任教;2005年为清华本科生创立了计算机科学实验班“姚班”;2011年创建“清华量子信息中心”与“交叉信息研究院”;2019年再为清华本科生创立了人工智能学堂班,简称“智班”。

如今,他领导的清华大学交叉信息研究院早已声名远播,姚班、智班都隶属交叉信息院。

姚期智教授研究方向有算法、密码学、量子计算等,是这方面的国际先驱和权威。

1

One More Thing

一年前的差不多同一时间姚期智院士领衔提出了 (Cumulative Reasoning,CR)的方法。

DoT是对CR的进一步深化。

当时CR协调了一个涉及不同专业化大语言模型的迭代过程,由不同模型承担了提议者、验证者和报告者角色。

而DoT直接在单一模型内构建有向无环图,不依赖于外部控制机制或多个模型,训练和部署更简单。

且在DoT中,模型生成的批评反馈是自然语言形式的,而不是像CR那样只给出二值信号。这使得模型可以接收到关于错误的详细解释,有助于更有效地改进命题。

这次DoT还有了强有力的数学基础,阐明了DoT推理过程与范畴逻辑的关系,从理论上确保了推理的一致性和可靠性。

论文链接:https://arxiv.org/abs/2409.10038

参考链接:
[1]https://x.com/omarsar0/status/1835882277563179512
[2]https://hub.baai.ac.cn/users/16897
[3]https://hub.baai.ac.cn/users/19790

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
双汇子公司猪肉抗生素超标37.5倍 长期摄入或致心血管副作用

双汇子公司猪肉抗生素超标37.5倍 长期摄入或致心血管副作用

闪电新闻
2026-05-25 21:26:10
在深圳,我看到了文化的“未来模样”

在深圳,我看到了文化的“未来模样”

智谷趋势
2026-05-24 17:44:58
奶茶店施暴女子已被行拘:正脸曝光,身份被扒是老师,工作恐不保

奶茶店施暴女子已被行拘:正脸曝光,身份被扒是老师,工作恐不保

奇思妙想草叶君
2026-05-25 23:22:54
血债惊全球!47条人命炸穿底线!中方怒斥:这事没完!

血债惊全球!47条人命炸穿底线!中方怒斥:这事没完!

达文西看世界
2026-05-26 15:42:43
双汇猪肉暴雷!药物超标近40倍,流入多家超市,企业:样品有问题

双汇猪肉暴雷!药物超标近40倍,流入多家超市,企业:样品有问题

奇思妙想草叶君
2026-05-25 23:37:03
大润发创始人今日去世

大润发创始人今日去世

中国基金报
2026-05-26 18:02:51
太空厨房的中国制造密码

太空厨房的中国制造密码

中国家电网
2026-05-26 09:25:19
一月八万不够花,李双江“赖”学校不退休,儿子改名出国后再作妖

一月八万不够花,李双江“赖”学校不退休,儿子改名出国后再作妖

一盅情怀
2026-05-16 20:12:47
尼克斯重返总决赛!布伦森1999年总决赛萌照曝光,冥冥自有天意

尼克斯重返总决赛!布伦森1999年总决赛萌照曝光,冥冥自有天意

仰卧撑FTUer
2026-05-26 14:34:08
“足疗第一股”要来了?知名连锁足疗巨头,启动IPO!20~30岁的年轻人成消费主力,00后已加入“按脚大军”

“足疗第一股”要来了?知名连锁足疗巨头,启动IPO!20~30岁的年轻人成消费主力,00后已加入“按脚大军”

每日经济新闻
2026-05-26 14:50:53
女演员的长相有多重要?看《主角》中的刘浩存和韩沛颖就知道了!

女演员的长相有多重要?看《主角》中的刘浩存和韩沛颖就知道了!

星宿影视鸭
2026-05-25 18:36:44
“想停火?先签协议” 特朗普打起新算盘

“想停火?先签协议” 特朗普打起新算盘

上游新闻
2026-05-26 14:19:02
尴尬!广东一业主因邻居大姐房事声音过大不堪其扰,声称要去录音

尴尬!广东一业主因邻居大姐房事声音过大不堪其扰,声称要去录音

火山詩话
2026-05-26 06:21:30
泡药杨梅后遗症:你一样一样地烂了,我一样一样地戒了!

泡药杨梅后遗症:你一样一样地烂了,我一样一样地戒了!

行者殷涛
2026-05-26 12:35:34
投毒杀人者、 三体公司原CEO许垚被执行死刑

投毒杀人者、 三体公司原CEO许垚被执行死刑

经济观察报
2026-05-26 09:53:04
2026一季度财政自给率:浙江96%领跑,10多个省不足50%

2026一季度财政自给率:浙江96%领跑,10多个省不足50%

风向观察
2026-05-26 11:27:00
经纪人谈温岚病情:因结石引发败血症,经ICU抢救10天,已转至一般病房

经纪人谈温岚病情:因结石引发败血症,经ICU抢救10天,已转至一般病房

红星新闻
2026-05-26 13:38:13
猖狂一幕!美日刚拉印度“制华”!日本就登门挑衅,中方一招破局

猖狂一幕!美日刚拉印度“制华”!日本就登门挑衅,中方一招破局

健身狂人
2026-05-26 15:55:47
突发:伊朗发生大规模爆炸

突发:伊朗发生大规模爆炸

扬子晚报
2026-05-26 07:46:02
神舟二十三号1名航天员驻留1年 航天员的太空厨房里藏着中国技术

神舟二十三号1名航天员驻留1年 航天员的太空厨房里藏着中国技术

中国家电网
2026-05-26 09:42:31
2026-05-26 18:28:49
硅星人 incentive-icons
硅星人
硅(Si)是创造未来的基础,欢迎来到这个星球。
3110文章数 10499关注度
往期回顾 全部

科技要闻

中国AI要向外卷,而不只是做第二个OpenAI

头条要闻

25岁海归男恋上32岁离异女 因88.8万彩礼闹掰追讨12万

头条要闻

25岁海归男恋上32岁离异女 因88.8万彩礼闹掰追讨12万

体育要闻

上赛季差点降入英甲,下赛季要踢英超了

娱乐要闻

台媒贴脸!S妈被问大S嗑药当场沉默

财经要闻

中国铝行业爆单 下一个“煤炭”大周期?

汽车要闻

涉水加强 福特烈马亚马逊限量版上市 售价39.98万

态度原创

房产
家居
艺术
本地
公开课

房产要闻

招商地产接盘碧桂园!海口这个烂尾豪宅,要彻底改命?

家居要闻

生与命相依 旧公寓改造

艺术要闻

画美,文字也美 | 日本著名画家内田正泰

本地新闻

用云锦的方式,打开江苏南京

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版