网易首页 > 网易号 > 正文 申请入驻

你的智能体为什么总在原地打转?

0
分享至

一个搜索航班的工具,能让AI调用14次还停不下来——而修复后只需要2次。这不是算法不够聪明,是我们在设计工具反馈时,埋了一个自己都没意识到的陷阱。

847步推理,每分钟烧掉47美元


Particula社区去年记录了一个极端案例:某智能体执行了847步推理,每分钟成本47美元,最终没有输出任何答案。它不断精炼逻辑、质疑结论、请求更多数据,陷入死循环。

CodiesHub年底的分析指向同一个根源:模糊的工具反馈。当工具返回"可能还有更多结果"这类开放式提示,智能体会将其解读为"再试一次就能更好",于是用相同参数重复调用。

问题不在于智能体"想太多",而在于它接收的信号没有明确的终止边界。每一次"再试一次"的决策,在当时看来都是合理的局部最优。

Strands的拦截方案:在调用发生前刹车

Strands Agents提供了一套生命周期钩子(Hook)机制。Debounce Hook监听BeforeToolCallEvent事件,在工具实际执行前检测重复调用:

具体实现上,系统会检查当前调用与近期调用是否在参数、工具类型、上下文状态上高度重合。如果判定为无效重复,直接拦截并返回预设的终止信号,而非让智能体继续消耗token。

这套模式不绑定特定框架。LangGraph、AutoGen、CrewAI等支持生命周期钩子的智能体系统,都可以移植相同的逻辑。

从14次到2次:关键在"成功状态"的定义

原文演示了对比实验:模糊工具反馈导致14次重复调用,而明确定义SUCCESS状态后,智能体在2步内停止。

差距不在智能体的推理能力,而在工具接口的设计契约。当"完成"的标准清晰可判定,智能体就不需要靠"再试一次"来确认。

这引出一个被忽视的设计原则:智能体的可靠性,很大程度上取决于它调用的工具是否具备自描述的终止语义。不是告诉它"可能还有",而是明确"这就是全部"。

框架无关的三层防御

基于AWS提供的开源代码(github.com/aws-samples/sample-why-agents-fail),可归纳出三层通用防御:

第一层,防抖钩子(Debounce Hook)。在工具调用前拦截重复请求,适用于参数级完全重合的场景。

第二层,清晰的工具状态返回。用SUCCESS、FAILED、PARTIAL等枚举值替代自然语言的模糊暗示,消除智能体的过度解读空间。

第三层,硬性的调用次数上限。作为最后保险,无论智能体如何判断,达到阈值强制终止并返回当前最佳结果。

这三层从"预防—信号—保险"三个环节压缩了循环发生的可能性。

为什么这事现在值得重新关注

智能体从demo走向生产环境,token成本从"实验损耗"变成"运营支出"。The Decoder今年1月的研究指出:即便算力无限,过度推理也会导致决策质量下降——每一步额外推理都在放大初始理解的偏差。

这意味着循环问题不只是浪费钱,还会输出更差的结果。一个永远在"再优化一下"的智能体,可能比及时止损的版本给出更离谱的答案。

对于正在搭建智能体系统的团队,工具接口的设计规范可能比选什么模型更影响最终体验。你的工具返回给智能体的,是明确的终点,还是一张无限续杯的邀请函?

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
印度新战机刚首飞,印军元帅:歼20不可怕,巴基斯坦都不愿意采购

印度新战机刚首飞,印军元帅:歼20不可怕,巴基斯坦都不愿意采购

别吵吵
2026-05-04 08:53:43
假日惊雷!浏阳重大爆炸冲击波袭来 5月6日A股这些板块迎剧烈分化

假日惊雷!浏阳重大爆炸冲击波袭来 5月6日A股这些板块迎剧烈分化

乡野小珥
2026-05-05 19:44:13
以革命的名义杀人,对法国大革命的重新审视与批判

以革命的名义杀人,对法国大革命的重新审视与批判

壹家言
2026-04-28 20:27:12
土媒:费内巴切计划签下卢卡库,将为其开出超1500万欧元年薪

土媒:费内巴切计划签下卢卡库,将为其开出超1500万欧元年薪

懂球帝
2026-05-05 15:15:05
我请假参加哥哥婚礼,却被新来上司裁员,谁知准嫂子就是我上司

我请假参加哥哥婚礼,却被新来上司裁员,谁知准嫂子就是我上司

小月文史
2025-04-01 18:14:07
又一国家要走委内瑞拉老路?巴西亲美势力反扑,卢拉陷入困境

又一国家要走委内瑞拉老路?巴西亲美势力反扑,卢拉陷入困境

民间胡扯老哥
2026-05-06 01:38:37
香港演员施明去世,终年74岁,曾出演《倚天屠龙记》紫衫龙王,精通武术曾做史泰龙保镖

香港演员施明去世,终年74岁,曾出演《倚天屠龙记》紫衫龙王,精通武术曾做史泰龙保镖

大象新闻
2026-03-31 14:49:05
山东多地强对流天气即将到达 风力最大11级

山东多地强对流天气即将到达 风力最大11级

闪电新闻
2026-05-05 20:31:36
兰州市政府致信祝贺吴宜泽勇夺2026斯诺克世锦赛冠军

兰州市政府致信祝贺吴宜泽勇夺2026斯诺克世锦赛冠军

环球网资讯
2026-05-05 17:54:57
刀刀切中痛点!Model Y迎最猛改款

刀刀切中痛点!Model Y迎最猛改款

刘哥谈体育
2026-05-05 17:11:36
越来越猖狂的早餐店“铝包子”,我们应提高警惕,该如何辨别呢?

越来越猖狂的早餐店“铝包子”,我们应提高警惕,该如何辨别呢?

心中的麦田
2026-05-04 18:47:55
刚返台,赖清德收到两大噩耗!蓝白封杀关键人选,郑丽文定下调子

刚返台,赖清德收到两大噩耗!蓝白封杀关键人选,郑丽文定下调子

爱意随风起呀
2026-05-06 01:52:30
“典型的职校女孩行为”,脱袜踩讲台跳舞,就说明了一切

“典型的职校女孩行为”,脱袜踩讲台跳舞,就说明了一切

蝴蝶花雨话教育
2026-03-30 13:24:14
前港姐冠军遭骗2.8亿积蓄后崩溃自闭,近况曝光

前港姐冠军遭骗2.8亿积蓄后崩溃自闭,近况曝光

打小我就醜
2026-05-04 16:35:46
在泰国电影院与中国电影院看电影有什么不同

在泰国电影院与中国电影院看电影有什么不同

马克在泰国
2022-09-21 14:01:01
历史上令人无比头痛的匈奴,如今演变成了哪个民族?令人唏嘘不已

历史上令人无比头痛的匈奴,如今演变成了哪个民族?令人唏嘘不已

文史达观
2025-05-01 22:50:28
如果不是外媒披露,可能国人不敢相信,中国已经强大到了如此地步

如果不是外媒披露,可能国人不敢相信,中国已经强大到了如此地步

春序娱乐
2026-05-05 03:21:02
湖人不要,尼克斯不要!31岁1亿王牌再逆袭:轰21+10扎心马刺

湖人不要,尼克斯不要!31岁1亿王牌再逆袭:轰21+10扎心马刺

李喜林篮球绝杀
2026-05-05 13:27:57
女子抢方向盘致车祸:正脸曝光很漂亮,人民法治定性,闺蜜更可恶

女子抢方向盘致车祸:正脸曝光很漂亮,人民法治定性,闺蜜更可恶

奇葩游戏酱
2026-05-05 21:03:38
历史老师跌入“无人区”:某高中20人教研组,近一半无学生可教

历史老师跌入“无人区”:某高中20人教研组,近一半无学生可教

听心堂
2026-03-31 15:52:04
2026-05-06 04:28:49
我是一个养虾人
我是一个养虾人
有态度网友ytd
2129文章数 25关注度
往期回顾 全部

科技要闻

传苹果考虑让英特尔、三星代工设备处理器

头条要闻

媒体:中国史无前例下"阻断禁令" 美媒迅速捕捉到信号

头条要闻

媒体:中国史无前例下"阻断禁令" 美媒迅速捕捉到信号

体育要闻

全世界都等着看他笑话,他带国米拿下冠军

娱乐要闻

内娱真情谊!杨紫为谢娜演唱会送花篮

财经要闻

浏阳烟花往事

汽车要闻

同比大涨190% 方程豹4月销量29138台

态度原创

家居
数码
亲子
本地
公开课

家居要闻

灵动实用 生活艺术场

数码要闻

亚马逊押注“诺奖材料”除湿技术 可大幅削减建筑能耗

亲子要闻

这个五一,带宝宝来北海看海啦~银滩细沙海浪,是小朋友最爱的天

本地新闻

用青花瓷的方式,打开西溪湿地

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版