网易首页 > 网易号 > 正文 申请入驻

CoT 技术究竟能否拯救 LLM?田渊栋、马腾宇在线“互怼”:皆因OpenAI o1发布

0
分享至

谷歌 DeepMind 首席科学家 Denny Zhou ,最近在 社交媒体上语出惊人:LLM 的推理能力没有极限!只要给它足够的时间“思考”,它就能解决任何问题! 此话一出,立刻在 AI 圈炸开了锅,连 Meta AI 的大佬 Yuandong Tian(田渊栋) 都下场“开怼”

究竟发生了什么?

原来,Denny Zhou 是 Chain of Thought Empowers Transformers to Solve Inherently Serial Problems 这篇论文的主要作者之一。这篇论文发表在 ICLR 2024 上,核心思想是利用 CoT (Chain of Thought,思维链) 技术让 LLM 模拟人类的思考过程,通过生成一系列中间推理步骤,来解决那些需要逻辑推理的复杂问题。

论文详情可以看我之前写的这篇文章

Denny Zhou 在 的发言是在OpenAI推出o1模型后,其实就是对这篇论文核心观点的“广告”:

“扩展 LLM 推理能力的性能极限是什么?天空才是极限。我们已经用数学方法证明了 Transformer 可以解决任何问题,只要允许它们根据需要生成任意数量的中间推理 token。值得注意的是,恒定深度就足够了。”

简单来说,就是“只要 CoT 够长,Transformer 就能解决任何问题!”

Meta AI 的 Yuandong Tian 大神看到这条 “广告” 后,坐不住了,直接“开怼”:

“虽然 CoT 非常有用,但我不敢苟同盲目地扩大规模就能满足我们所有需求的观点。这篇论文提出了一个通用逼近定理,它通过显式地构建 Transformer 权重来适应任务族。虽然深度可以是常数,但 CoT 的长度可以超长,而且我们不知道这样的权重配置是否可以通过梯度下降来学习。这就像‘既然我们知道 2 层 MLP 可以拟合任何数据,我们就相信它并将其应用到所有地方’。人类的推理链非常简洁,即使对于从未见过的问题也能抓住关键因素。这种表示是如何在运行中学习(或构建?)的,这是一个令人着迷的问题。”

田渊栋一针见血地指出了 Denny Zhou 论文和观点中的 “漏洞”:

理论和实践的差距:你论文里说 CoT 长度可以无限长,但现实中,模型训练是有成本的,谁有那么多资源去训练一个超长 CoT 的模型?

CoT 长度过长,模型训练难度大:CoT 越长,模型越难学习,这就像 2 层 MLP 虽然理论上可以拟合任何数据,但实际上需要指数级的 neurons 才能做到,根本不现实!

人类的推理链简洁高效,AI 难以模仿:你光顾着增加 CoT 的长度,却忽略了 AI 推理的效率问题!人类的推理链非常简洁,能够抓住问题的关键因素,即使面对新问题也能快速找到解决方案。AI 要想像人类一样进行推理,还有很长的路要走!

眼看 Yuandong Tian 来势汹汹,同为论文作者的 Stanford 大学 Tengyu Ma(马腾宇) 教授赶紧出来“救火” :

“‘CoT 的长度可以超长’:如果我还没记错的话,所需的 CoT 步骤与解决问题所需的门的数量呈线性关系,或者对于 NC1 完全问题来说,与输入长度呈线性关系。我还隐约记得,用 2 层 MLP 逼近几乎所有函数都需要指数级的 neurons。(以上评论并不意味着对引用的推文或引用的引用的论文的任何其他部分有任何其他暗示/扩展)”

马腾宇教授试图用更严谨的理论解释来“打圆场”:

CoT 长度的解释:我们的论文并不是说 CoT 长度可以无限长,而是说对于某些类型的问题,例如 NC1 问题,所需的 CoT 步骤是可控的

与神经网络类比:2 层 MLP 逼近任意函数需要指数级 neurons 的例子,只是为了说明理论上的能力和实际应用之间可能存在很大差距,并不是说 CoT 就不可行。

田渊栋显然不买账,继续追问:

“NC1 问题是那些可以用多项式数量的 AND/OR/NOT 门表示的问题,所以它属于 P 类。对于可能需要指数级数量的门的问题,CoT 的长度可能非常长。这与 2 层 MLP 的情况一致,因为拟合任意函数需要覆盖高维空间中的所有角落,这在最坏情况下是指数级的。关键是:我们不知道现实世界的问题是否有好的/简洁的表示...... 如果有(例如,NC1),那么我们可以构建 Transformer 的权重来做到这一点。”

田渊栋的意思是,现实世界的问题往往比 NC1 问题更复杂,所需的 CoT 长度可能会超出想象。除非我们能找到一种简洁高效的表示方法来描述现实世界的问题,否则 CoT 技术很难在实际应用中发挥作用。

随后,Yuandong Tian 与其他几位专家就 CoT 技术的未来发展进行了一番讨论,主要观点如下:

Tijmen Blankevoort 认为,应该限制 CoT 的长度,迫使 AI 进行更强的抽象,就像人类一样,因为人类的“愚蠢”反而让我们更擅长抽象思维

Yuandong Tian 则透露了他们正在研究的 Searchformer 模型,该模型的目标是在保持最佳最终结果的同时,找到更短的 CoT,并认为 OpenAI 的 o1 模型可能也采用了类似的方法

Zeming Lin 希望建立一个类似于乔姆斯基层次结构的机器学习模型分类体系,以便更好地理解不同模型的计算能力

Dickson Pau 则不认同田渊栋的看法,大家勇于尝试,不要因为理论上的限制就放弃探索

这一切都发生在OpenAI o1推出后,按照Sam Altman的说法o1目前还只是预览版,o1在几个月之类就会得到非常大的进化,CoT 究竟行不行,我们很快就会看到结果,o1究竟是不是AGI的关键一步,我们拭目以待!

⭐星标AI寒武纪,好内容不错过

用你的在看告诉我~

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
台海若出事,日本第一个动武?高市早苗掀桌,不许解放军做一件事

台海若出事,日本第一个动武?高市早苗掀桌,不许解放军做一件事

影孖看世界
2025-11-09 19:08:56
别骗不物质的女人,她要的真心才是硬通货

别骗不物质的女人,她要的真心才是硬通货

加油丁小文
2025-11-02 06:30:03
男单大爆冷!世界冠军0:4被淘汰,不敌日本选手,无缘4强大名单

男单大爆冷!世界冠军0:4被淘汰,不敌日本选手,无缘4强大名单

国乒二三事
2025-11-09 11:56:36
切忌“刻舟求剑”,接受乌克兰以主权国家存在,但领土不完整

切忌“刻舟求剑”,接受乌克兰以主权国家存在,但领土不完整

山河路口
2025-11-09 19:31:52
专家终于说实话了!不出10年,老小区将会迎来“5种”最终结局!

专家终于说实话了!不出10年,老小区将会迎来“5种”最终结局!

石辰搞笑日常
2025-11-09 10:16:18
史诗一战!2-0打爆世界第1,26岁美女斩年终冠军 独揽奖金3728万

史诗一战!2-0打爆世界第1,26岁美女斩年终冠军 独揽奖金3728万

风过乡
2025-11-09 06:46:43
芦哲:出口为何超预期转负?——10月出口数据点评

芦哲:出口为何超预期转负?——10月出口数据点评

首席经济学家论坛
2025-11-09 18:29:15
为什么中国要不顾一切玩了命的发展军事?因为怕,中国人怕极了!

为什么中国要不顾一切玩了命的发展军事?因为怕,中国人怕极了!

百态人间
2025-11-05 05:00:03
有点想不通,为什么骗子的卡从不担心被冻结?

有点想不通,为什么骗子的卡从不担心被冻结?

公子麦少
2025-11-09 20:18:39
中国将迎来前所未有的死亡高峰,专家给出答案:是这些因素导致的

中国将迎来前所未有的死亡高峰,专家给出答案:是这些因素导致的

法老不说教
2025-11-09 15:54:46
詹姆斯下季离开湖人?骑士勇士最新态度曝光:愿为他筹备退役巡演

詹姆斯下季离开湖人?骑士勇士最新态度曝光:愿为他筹备退役巡演

罗说NBA
2025-11-09 06:45:28
一场2-1!让葡萄牙体育登顶:客场绝杀+7轮不败,本菲卡差4分

一场2-1!让葡萄牙体育登顶:客场绝杀+7轮不败,本菲卡差4分

体育知多少
2025-11-09 10:01:53
我调任市长参加恩师寿宴,被昔日校花女友和她的局长老公当众羞辱

我调任市长参加恩师寿宴,被昔日校花女友和她的局长老公当众羞辱

萧竹轻语
2025-11-06 14:18:15
TVB演员海俊杰深夜痛哭求助:妻子急需换肝手术,费用150万港币仅筹得70万 曾出演《功夫足球》《法证先锋IV》

TVB演员海俊杰深夜痛哭求助:妻子急需换肝手术,费用150万港币仅筹得70万 曾出演《功夫足球》《法证先锋IV》

鲁中晨报
2025-11-09 11:11:05
最健康安全的染发范围是什么?一周一次、半年一次还是一年一次?

最健康安全的染发范围是什么?一周一次、半年一次还是一年一次?

爆炸营养彭鑫蕊
2025-11-09 15:16:59
汽水音乐用户量狂飙超1.2亿 QQ音乐、网易云音乐有压力了

汽水音乐用户量狂飙超1.2亿 QQ音乐、网易云音乐有压力了

快科技
2025-11-07 11:22:06
刘德华再唱中国人

刘德华再唱中国人

南方都市报
2025-11-09 21:28:18
杨振宁院士临终留下的10个字,值得每个人思考!是哪10字?

杨振宁院士临终留下的10个字,值得每个人思考!是哪10字?

凡人侃史
2025-10-20 16:14:55
全红婵夺得第5名没有伤心!令人伤心的是她赛后采访说的那段话!

全红婵夺得第5名没有伤心!令人伤心的是她赛后采访说的那段话!

田先生篮球
2025-11-07 20:08:22
Doran成冠军上单!Guma拿下FMVP,放话:我就是史上最强ADC

Doran成冠军上单!Guma拿下FMVP,放话:我就是史上最强ADC

贝塔看比赛
2025-11-09 20:37:08
2025-11-09 21:52:49
AI寒武纪 incentive-icons
AI寒武纪
专注于人工智能,科技领域
963文章数 370关注度
往期回顾 全部

科技要闻

黄仁勋亲赴台积电“讨要更多芯片”

头条要闻

两位欧洲政要将同日访华:一人曾被誉为欧洲"最帅王子"

头条要闻

两位欧洲政要将同日访华:一人曾被誉为欧洲"最帅王子"

体育要闻

他只想默默地拿走最后一亿美元

娱乐要闻

《繁花》事件影响:唐嫣工作被取消

财经要闻

10月CPI同比涨0.2% PPI同比下降2.1%

汽车要闻

钛7月销破2万 霜雾灰与青峦翠配色正式开启交付

态度原创

教育
亲子
艺术
家居
时尚

教育要闻

傲慢与偏见英文原版语音课08:给我的小莉齐美言几句啊!

亲子要闻

小龚大夫上线了

艺术要闻

她眼中的世界丰富多彩 | Erin Hanson 2025作品

家居要闻

现代自由 功能美学居所

伊姐周六热推:电视剧《四喜》;电视剧《唐朝诡事录之长安》......

无障碍浏览 进入关怀版