网易首页 > 网易号 > 正文 申请入驻

高效智能体幕后推手是谁?一篇综述带你从记忆×工具学习×规划看透

0
分享至



随着大模型能力的跃迁,业界关注点正在从 “模型能不能做” 快速转向 “智能体能不能落地”。过去一年可以看到大量工作在提升智能体的有效性(effectiveness):如何让它更聪明、更稳、更会用工具、更能完成复杂任务。

但在真实应用里,另一个更 “硬” 的问题常常决定能否上线:高效性(efficiency)。智能体即便表现很好,如果每次都要消耗大量算力、时间与调用成本,也很难在生产环境大规模部署。

基于这一视角,论文整理并撰写了一篇面向 “高效智能体” 的综述,系统梳理当前主要方法,并从三个最关键的机制出发组织全文框架:记忆 — 工具学习 — 规划。论文从设计范式出发对代表性方法进行归纳总结,聚焦那些以效率为目标或能够提升效率的核心设计与实现路径,从而更清晰地呈现智能体在真实落地场景中的成本 — 性能权衡。



  • 论文地址:https://arxiv.org/abs/2601.14192
  • GitHub 地址:https://github.com/yxf203/Awesome-Efficient-Agents



一、智能体记忆:

让 “会记” 更省、更准、更可扩展



智能体要做长任务,离不开记忆。但把历史一股脑塞进提示词,会带来 token 暴涨和智能体处理长上下文能力下降。因此,高效记忆系统的关键在于把 “长历史” 加工成 “可用、可检索、可复用” 的信息资产。

论文按记忆生命周期梳理三步:构建 — 管理 — 访问。

  • 记忆构建:通过概括、压缩与结构化把 “长对话” 转成 “可用记忆”。一类是留在推理链路的工作记忆,文本式直观但吃上下文,隐式式更像缓存,可减少重复编码;另一类是外置为可检索系统的外部记忆,先将信息压成小单元再按需召回,包括条目式、图式与分层式。此外论文也提到要警惕过度压缩带来的信息损失,即需要考虑如何在降成本与保真之间取得平衡。
  • 记忆管理:防止 “存爆炸”,也避免 “取太慢”。规则式快但可能误删重要内容,大模型式更聪明但更贵,混合式则按层级或场景组合两者策略,在效果与成本之间取得折中。
  • 记忆访问:选什么 + 怎么用。访问分记忆选择与记忆整合,通过检索或训练等方式挑选记忆,再用压缩过滤或隐式注入减少 token 与重复编码。

另外,多智能体记忆也成为新趋势。相较于只靠通信,近年更多工作开始引入 “记忆” 这一概念来支撑规模化协作,论文将其概括为:共享记忆 / 本地记忆 / 混合记忆三类。

二、工具学习:

让 “会用工具” 更少调用、更少等待、更少走弯路



工具让智能体从 “会说” 变成 “能做”,但成本也最容易在工具链路里失控。论文按三条主线梳理提效思路:工具选择 — 工具调用 — 工具融合推理。

  • 工具选择:目标是 “更快选对、少塞进 prompt”。相关方法包括外部检索器、多标签分类,以及将工具映射为特殊 token 等思路,核心都是在大量工具中更快、更准地选出最需要的那几个。
  • 工具调用:核心是 “少等、少调、少走弯路”。典型路线包括边生成边调用、并行化调用,以及利用成本感知调用与测试时高效扩展来削减冗余调用;进一步还可通过面向效率的后训练把 “短轨迹、少调用” 写进策略本身。
  • 工具融合推理:让模型学会 “该不该用、何时用、用几次”。代表性方向包括选择性调用,引导智能体只在必要时才发起工具调用;以及成本约束策略优化,在保证效果的同时对冗余交互与过长轨迹施加惩罚,从而学到更短、更省的工具使用策略。

三、智能体规划:

在 “深度” 与 “宽度” 上同时省下来



规划决定智能体如何在多步决策空间里行动。效率问题要么来自单体推理 “想太深、搜太贵”,要么来自多体协作 “聊太多、通信太重”。因此论文从两条线展开:单智能体规划与多智能体协作规划。



四、基准与评测(Benchmark):

没有 “可比的尺”,就谈不上 “可落地的效率”

在谈记忆、工具学习与规划的提效方案之前,先要把 “尺子” 定清楚:高效到底怎么量?

论文强调,效率必须建立在有效性之上。省了资源却显著掉性能,不算高效。因此论文采用的定义是:在给定预算下取得更好的效果,或在相近效果下消耗更少资源。

基于这一视角,论文先梳理了以有效性为主的 benchmark,并进一步汇总了与效率相关的评测内容:一方面,整理了在 benchmark 中显式纳入效率信号(成本、延迟、调用次数等)的评测设置;另一方面,总结了智能体方法中常用的效率指标,用于刻画 “省在哪儿、省多少”。

五、挑战与展望

论文同时也提出了目前的一些挑战与展望:

1)统一评测框架:指标口径统一,模块开销边界清楚,才能真正让各个智能体方法可比可复现。

2)智能体的隐式推理(Latent Reasoning):大模型侧的隐式推理正在升温,但面向智能体的研究仍相对稀缺。由于智能体链路更长、更复杂,还要处理工具调用、规划与记忆等环节,如何把中间推理 “做在隐式空间里”、在不掉效果的前提下降低成本,既是挑战,也是机会。

3)面向部署设计:在多智能体场景下,需要把部署成本纳入考量,核心问题是投入产出比。也就是说,增加智能体带来的收益,是否足以覆盖新增的开销。

4)多模态效率:多模态智能体发展很快,但效率研究仍相对欠缺。文本智能体的一些提效思路可以借鉴,但是直接迁移却并不容易,因为多模态智能体的感知输入、行为空间与任务结构更复杂、交互成本更高。因此,如何在多模态场景下系统地兼顾效果与成本,仍是亟待解决的关键问题。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
有人预测:明后年,中国的二手房或将面临这3个结局,太真实

有人预测:明后年,中国的二手房或将面临这3个结局,太真实

平说财经
2026-07-05 19:45:55
法国队主帅德尚不满裁判纵容对手:赛后安排两名强壮球员保护姆巴佩,为防止对手报复伤人

法国队主帅德尚不满裁判纵容对手:赛后安排两名强壮球员保护姆巴佩,为防止对手报复伤人

红星新闻
2026-07-05 09:06:42
冯德莱恩:如果中国错过10月最后期限,欧盟所有手段都已准备就绪

冯德莱恩:如果中国错过10月最后期限,欧盟所有手段都已准备就绪

故事终将光明磊落
2026-07-05 14:45:58
ESPN:英格兰下榻酒店安保严密,堪称战争级别的防护

ESPN:英格兰下榻酒店安保严密,堪称战争级别的防护

懂球帝
2026-07-05 20:42:22
马未都最新发声:如果权威鉴定确认佛像是海口五公祠失窃的坐像,观复博物馆将配合办理移交,护送佛像返乡

马未都最新发声:如果权威鉴定确认佛像是海口五公祠失窃的坐像,观复博物馆将配合办理移交,护送佛像返乡

极目新闻
2026-07-05 21:04:39
争端升级,美国已介入,抢在日本登上钓鱼岛前,中方先执法立威了

争端升级,美国已介入,抢在日本登上钓鱼岛前,中方先执法立威了

福建睿平
2026-07-05 06:59:08
三分球7中6!中国逆转!追平近十年最好成绩

三分球7中6!中国逆转!追平近十年最好成绩

刺猬篮球
2026-07-05 18:46:28
我以为德国人开玩笑,没想到他们玩真的!中国大使都该无语了

我以为德国人开玩笑,没想到他们玩真的!中国大使都该无语了

王姐懒人家常菜
2026-07-05 02:50:14
7月5日,人社部财政部关于2026年调整基本养老金的通知有公布吗?

7月5日,人社部财政部关于2026年调整基本养老金的通知有公布吗?

小谈食刻美食
2026-07-05 07:35:52
每体:17岁莫拉世界杯表现出色,引皇马、巴萨和曼联关注

每体:17岁莫拉世界杯表现出色,引皇马、巴萨和曼联关注

懂球帝
2026-07-05 20:10:29
儿子打光棍29年愁坏继母她一咬牙:别找了,妈这儿就有现成的

儿子打光棍29年愁坏继母她一咬牙:别找了,妈这儿就有现成的

大熊欢乐坊
2026-07-05 20:11:10
江浙沪或将遭遇17级超强台风,今年第9号台风“巴威”登陆华东概率较大

江浙沪或将遭遇17级超强台风,今年第9号台风“巴威”登陆华东概率较大

上观新闻
2026-07-05 21:25:41
TA:巴洛贡红牌停赛已被暂缓执行,可出战世界杯1/8决赛

TA:巴洛贡红牌停赛已被暂缓执行,可出战世界杯1/8决赛

懂球帝
2026-07-06 00:36:06
她是大家熟悉的演员,不拍戏在法国洗碗谋生,如今遭遇高温热得慌

她是大家熟悉的演员,不拍戏在法国洗碗谋生,如今遭遇高温热得慌

流史岁月
2026-07-03 16:00:07
日本没想到,暴涨签证费,没等来中方取消制裁,赴日航班量反腰斩

日本没想到,暴涨签证费,没等来中方取消制裁,赴日航班量反腰斩

冰语历史
2026-07-05 22:34:34
男子称在胖东来自营影院看电影时,因电影不太符合自己中途离场,工作人员询问后退了一半费用,“20多年人生中的第一次,特别感慨”

男子称在胖东来自营影院看电影时,因电影不太符合自己中途离场,工作人员询问后退了一半费用,“20多年人生中的第一次,特别感慨”

扬子晚报
2026-07-05 15:25:08
世界杯早早出局后换帅!罗马诺:克洛普将担任德国队主教练

世界杯早早出局后换帅!罗马诺:克洛普将担任德国队主教练

全景体育V
2026-07-05 18:19:29
浙媒痛批泰山铁丝网,鲁媒直接打脸:对自家刀刺网选择性失明,真是双标!

浙媒痛批泰山铁丝网,鲁媒直接打脸:对自家刀刺网选择性失明,真是双标!

可达鸭面面观
2026-07-05 15:39:42
中央开始严查,多地机关事业单位大整顿启动,这几类人受影响最大

中央开始严查,多地机关事业单位大整顿启动,这几类人受影响最大

细说职场
2026-07-04 21:41:53
“昂起头,拍着胸膛说:我来过!”——贺炜致敬佛得角的这段话,让54万人的小国感动了全世界

“昂起头,拍着胸膛说:我来过!”——贺炜致敬佛得角的这段话,让54万人的小国感动了全世界

哲学船
2026-07-05 22:15:27
2026-07-06 04:52:49
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
13442文章数 142688关注度
往期回顾 全部

科技要闻

华为:逻辑折叠将大幅提升麒麟CPU核心频率

头条要闻

四川深夜连发3次超4级地震 居民外出躲避回屋再遇地震

头条要闻

四川深夜连发3次超4级地震 居民外出躲避回屋再遇地震

体育要闻

姆巴佩点走巴拉圭:巴黎三代左锋传承

娱乐要闻

霉霉婚礼照片泄露 有四人违规

财经要闻

揭秘跨境“对敲”换汇黑产

汽车要闻

方程豹钛9内饰曝光 用上了长联屏设计/下半年上市

态度原创

旅游
数码
艺术
家居
公开课

旅游要闻

不起眼的滇中名山,山上遍布旧营残迹,藏着元朝在西南最后的倔强

数码要闻

Intel Xe3P核显越来越近!Linux曝光新进展

艺术要闻

伊朗超高层方案惊艳世界,曾获国际大奖!

家居要闻

传奇筑 日常诗

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版