网易首页 > 网易号 > 正文 申请入驻

华人团队提出「CoD」草稿链,减少 80% Token,AI 省钱第一名!

0
分享至

降低 AI 成本,依然是目前的一大难题。

作者|芯芯
编辑|靖宇

两个月前 DeepSeek R1 横空出世,震惊所有人。除了成本巨低,大模型在回答问题时候显示的思维链 CoT 也功不可没。

在 AI 领域,大规模语言模型(LLMs)已经展示了强大的推理能力。这些模型通常生成长长的「思维链(Chain-of-Thought, CoT)」来逐步推导答案,好处显而易见,问题是计算成本和延迟高。

最近,Zoom 的研究团队提出了一种全新的推理范式——「草稿链(Chain-of-Draft, CoD)」,试图通过模仿人类的简洁思维过程,来提升 AI 的推理效率,从而节省成本。

数据显示,相同的任务,使用 CoD 能将 Token 使用减少 80%,大幅度降低成本。

成本更低,准确率却不低的 CoD,会成为大模型的下一个趋势吗?

01

如何让 AI「少写点」?

无论是 OpenAI 的 o1,还是 DeepSeek 的 R1,在使用「思维链」处理任务时都有出色表现,这个范式鼓励模型将问题分解成一步步的推导,类似于人类在纸上写下完整的解题过程。

「尽管这一方法有效,但它在推理时需要大量的计算资源,导致输出冗长且延迟较高。」Zoom 研究人员指出,LLM 通常会在得出最终答案之前消耗大量 Token。

在他们看来,人类通常解决问题的方式根本没有这么冗长,「我们依赖简洁的草稿或速记来捕捉必要的见解,而不做不必要的详细阐述。」

受此启发,他们提出「草稿链」这一新范式,鼓励模型生成极简的中间推理步骤,只要捕捉解决问题的关键信息。

这一灵感来自人类的认知过程。因为在解决复杂任务时——无论是解决数学问题、撰写论文还是编程——人类通常只记录下有助于推进的关键信息。通过模仿这一行为,LLMs 可以专注于推进解决方案,而不受冗长推理的影响。

其研究论文称,这一方法不仅减少了冗余,还显著降低了计算成本和延迟,同时保持了与「思维链」相当的准确性。

用一个简单的算术题例子感受直接回答(标准)、「思维链」与「草稿链」的区别:

标准:

问:杰森有 20 个棒棒糖。他给了丹尼一些棒棒糖。现在杰森有 12 个棒棒糖。杰森给了丹尼多少个棒棒糖?

答:8

思维链:

问:杰森有 20 个棒棒糖。他给了丹尼一些棒棒糖。现在杰森有 12 个棒棒糖。杰森给了丹尼多少个棒棒糖?

答:让我们一步步来思考:


  1. 最初,杰森有 20 个棒棒糖。

2. 在给丹尼一些棒棒糖后,杰森现在有 12 个棒棒糖。

3. 为了找出杰森给了丹尼多少个棒棒糖,我们需要计算最初的数量和剩余数量之间的差异。

4. 我们可以设置一个简单的减法问题:最初的棒棒糖数 - 剩余的棒棒糖数 = 给丹尼的棒棒糖数

5. 把数字带入:20 - 12 = 给丹尼的棒棒糖数

6. 解决减法:20 - 12 = 8

因此,杰森给了丹尼 8 个棒棒糖。

草稿链:

问:杰森有 20 个棒棒糖。他给了丹尼一些棒棒糖。现在杰森有 12 个棒棒糖。杰森给了丹尼多少个棒棒糖?

答:20 - x = 12;x = 20 - 12 = 8。#### 8

在标准的直接回答中,模型直接输出答案「8」,没有任何推理过程。虽然答案正确,但缺乏透明性,可解释性不强,且在多步推理任务中容易出错。

「思维链」则生成了冗长的推理。相比之下,「草稿链」的推理被简化为一个简洁的方程,答案应放在响应的结尾,并使用分隔符「####」,减少了 Token 数,同时保持透明性和正确性。

为了评估「草稿链」的有效性,Zoom 的研究团队进行了多种基准测试,包括算术推理、常识推理和符号推理任务。其实验结果称,草稿链在「准确性」上与思维链相当,甚至在某些任务中表现更好,同时显著减少了 Token 使用和延迟。

以算术推理任务为例,使用草稿链的 GPT-4o 和 Claude 3.5 Sonnet 模型在 GSM8k 数据集上的准确率分别为 91.1% 和 91.4%,而思维链的准确率分别为 95.4% 和 95.8%。

尽管草稿链的准确率略低,但它将 Token 使用减少了 80%,并将延迟降低了 76.2% 和 48.4%

在常识推理和符号推理任务中,他们称草稿链同样表现出色。例如,在掷硬币任务中,草稿链将 GPT-4o 的 Token 使用减少了 68%,而 Claude 3.5 Sonnet 的 Token 使用减少了 86%,同时保持了 100% 的准确率。

02

部署 AI,更省钱了?

Zoom 的研究人员还提到,与「草稿链」类似,去年圈内已有研究提出「简洁思维(Concise Thoughts,CCoT)和 Token 预算感知 LLM 推理,建议对推理步骤使用固定的全局 Token 预算。

然而,不同的任务可能需要不同的预算,以实现性能和成本之间的最佳平衡。此外,LLM 可能无法遵守不切实际的预算,通常生成的 Token 数量远超预期。即使是动态估算,也要额外的 LLM 调用,这增加了延迟。

「相比之下,我们的方法采用每步预算,允许无限的推理步骤,使其更适应各种结构化推理技术。」研究团队称。

但「草稿链」也有其局限性,对于需要大量反思、自我纠正或外部知识检索的任务,它可能效果较差。

这项研究目前被讨论较多的用处在于,它可能改变企业部署 AI 的成本,让 AI 模型以更少的资源更便宜地思考,对成本敏感的场景尤其适用。

例如,AI 研究人员 Ajith Prabhakar 分析认为,对于每月处理 100 万条推理查询的企业,「草稿链」可以将成本从 3800 美元(CoT)降至 760 美元,每月节省超过 3000 美元——在大规模应用时,节省更多。

除了成本,「草稿链」可能使 AI 驱动的应用程序更加响应迅速,特别是在实时支持、教育和对话式 AI 等领域尤其有价值,因为即使是短暂的延迟也会严重影响用户体验。

不过,值得注意的是,OpenAI 在 3 月 10 日发文称,他们相信「思维链(CoT)监控」可能是未来监督超人类模型的少数工具之一,「建议不要对前沿推理模型的 CoT 施加强烈的优化压力,保持 CoT 不受限制,以便进行监控。」

因为模型通常会在「思维链」中非常清楚地陈述其意图,让人类可以看到模型的思维,从而检测模型一些不当行为,比如在编程任务中绕过测试、欺骗用户,或者在问题过于困难时放弃。

无论如何,从「思维链」到「草稿链」,AI 推理范式还在不断进化。

目前看来,随着应用场景扩展,在不谈 AI 安全时,成本与速度越来越成为绕不过的关键指标。而 CoD 的出现,证明了人们依然在探索如何在保持大模型进步的前提下,进一步降低成本,加速 AI 的普及。

*头图来源:Quanta Magzine

本文为极客公园原创文章,转载请联系极客君微信 geekparkGO

极客一问

你觉得大模型成本降低,是目前行业的首要挑战吗?

机器人也能当摇子?众擎机器人再上新!大跳斧头帮舞蹈致敬星爷。

点赞关注极客公园视频号

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
15万!蔚来"神车"官宣:5月29日 ,正式发布亮相

15万!蔚来"神车"官宣:5月29日 ,正式发布亮相

科技堡垒
2026-05-29 11:14:19
浙江国资“一把手”突然投案,29日那天,很多人刷到消息愣了三秒

浙江国资“一把手”突然投案,29日那天,很多人刷到消息愣了三秒

时尚的弄潮
2026-05-31 00:34:34
又是“科技与狠活”!继泡药杨梅后又一水果塌房,我们还能吃什么

又是“科技与狠活”!继泡药杨梅后又一水果塌房,我们还能吃什么

蜉蝣说
2026-05-30 23:31:05
明星无滤镜后,周涛一脸凶相,李冰冰像小老太,金晨脸大如饼

明星无滤镜后,周涛一脸凶相,李冰冰像小老太,金晨脸大如饼

笑饮孤鸿非
2026-05-30 20:58:06
稻城亚丁景区致歉,停收观光车交通服务费!珠峰、纳木错、泸沽湖等均被曝拦路

稻城亚丁景区致歉,停收观光车交通服务费!珠峰、纳木错、泸沽湖等均被曝拦路

上观新闻
2026-05-29 14:54:19
印度高温近50℃!宿舍没有空调 中国留学生被热到提前回国

印度高温近50℃!宿舍没有空调 中国留学生被热到提前回国

封面新闻
2026-05-30 14:26:04
三四个同事死死拽住,才没让他冲出去!药房医生当众扯下白大褂,只因一句……

三四个同事死死拽住,才没让他冲出去!药房医生当众扯下白大褂,只因一句……

医客
2026-05-30 12:14:19
永别了,“千面如来”刘洵,他真的是一位好演员!

永别了,“千面如来”刘洵,他真的是一位好演员!

新民周刊
2026-05-30 14:28:40
西决抢七大战裁判出炉:戴维斯担任主裁 三人执哨两队胜率曝光

西决抢七大战裁判出炉:戴维斯担任主裁 三人执哨两队胜率曝光

罗说NBA
2026-05-30 21:26:04
中方代表:日本没有资格谈国际防务合作 须警惕军国主义思潮借机复活

中方代表:日本没有资格谈国际防务合作 须警惕军国主义思潮借机复活

环球网资讯
2026-05-30 19:36:11
名记正式确认,CBA下赛季采取三外援新政!广东或优先续约奎因

名记正式确认,CBA下赛季采取三外援新政!广东或优先续约奎因

多特体育说
2026-05-30 23:31:21
是不是太过了?神舟飞船落地,地面上居然安排有专门的开舱手岗位

是不是太过了?神舟飞船落地,地面上居然安排有专门的开舱手岗位

阿龙聊军事
2026-05-30 07:47:52
法网女单彻底乱了:随着卫冕冠军爆大冷1-2,世界前十已有5将出局

法网女单彻底乱了:随着卫冕冠军爆大冷1-2,世界前十已有5将出局

侧身凌空斩
2026-05-31 02:25:54
被中国军队赶跑后,荷兰军舰溜到越南,获越方款待,要再穿行南海

被中国军队赶跑后,荷兰军舰溜到越南,获越方款待,要再穿行南海

影孖看世界
2026-05-30 22:32:27
D1804次列车受电弓遭异物击打,被困隧道内超2小时,乘客称全车停电闷热异常,身上像从水里捞出来的,备用列车已到现场并开始转运

D1804次列车受电弓遭异物击打,被困隧道内超2小时,乘客称全车停电闷热异常,身上像从水里捞出来的,备用列车已到现场并开始转运

台州交通广播
2026-05-30 13:47:54
闹笑话了!黄仁勋摊牌:看不上华为韬定律,却被业内专家说不专业

闹笑话了!黄仁勋摊牌:看不上华为韬定律,却被业内专家说不专业

兵鉴史
2026-05-30 14:32:11
信号失联、烧成火球!神舟二十二号返回遭黑障区,有多惊心动魄?

信号失联、烧成火球!神舟二十二号返回遭黑障区,有多惊心动魄?

有范又有料
2026-05-30 10:57:05
越扒越有!曝杨梅协会会长:是当地最大批发商,亲戚全在协会任职

越扒越有!曝杨梅协会会长:是当地最大批发商,亲戚全在协会任职

天天热点见闻
2026-05-30 06:44:22
俄罗斯无人机击中罗马尼亚,导致2人受伤,预计北约不会有大动作

俄罗斯无人机击中罗马尼亚,导致2人受伤,预计北约不会有大动作

山河路口
2026-05-29 14:04:31
一豪华游轮在土耳其沿海沉没,148人跳海逃生无人伤亡

一豪华游轮在土耳其沿海沉没,148人跳海逃生无人伤亡

现代快报
2026-05-30 17:57:06
2026-05-31 04:43:00
极客公园
极客公园
让最棒的创新成为头条
12107文章数 78891关注度
往期回顾 全部

科技要闻

车圈大佬发声:价格战远去,但竞争仍残酷

头条要闻

两名9岁女孩被困电梯近2小时 求救几十次物业无动于衷

头条要闻

两名9岁女孩被困电梯近2小时 求救几十次物业无动于衷

体育要闻

巴黎再度捧起欧冠奖杯 枪手众将黯然神伤

娱乐要闻

张碧晨《歌手》 “活人微死” 自嘲

财经要闻

双汇管不住一头猪

汽车要闻

900V+3.2秒破百 领克10+&领克10上市16.99万元起

态度原创

房产
健康
数码
时尚
艺术

房产要闻

红动五月!全国抢入核心资产,广州盯紧凯旋新世界!

尝试干细胞疗法如何避免踩坑?

数码要闻

华擎RX 9070 XT太极十周年版曝光:黑白金配色首次亮相

美回巅峰的她们,带火的这些爆款真的好用吗

艺术要闻

非洲超级地标!全球最大足球场,持续推进!

无障碍浏览 进入关怀版