网易首页 > 网易号 > 正文 申请入驻

韩家炜教授新作:下一代Agentic AI应如何“适配”?

0
分享至

着基础模型,尤其是大语言模型(LLM)的快速发展,Agentic AI 迅速兴起,并广泛应用于在科研、软件开发、药物研发、临床研究等广泛领域。

然而,工具使用不稳定、长程任务规划能力有限、特定领域的推理能力不足、真实环境中的鲁棒性较弱以及在未知环境中泛化能力有限等问题,限制了 Agentic AI 系统在真实场景中的有效部署。

当前的一个热门研究方向是:Agentic AI 系统通过适配(adaptation)机制对自身进行调整,从而提升其自身性能、可靠性和泛化能力,从而更好地适应特定任务需求和现实世界环境。

基于此,数据挖掘专家、伊利诺伊大学厄巴纳-香槟分校教授韩家炜团队,联合斯坦福大学、普林斯顿大学等多所高校的研究人员提出了一个系统性框架,旨在厘清 Agentic AI 适配策略的设计空间,使各方案之间的权衡更加清晰,为系统设计过程中策略的选择或切换提供实践指导。



论文链接:

https://github.com/pat-jj/Awesome-Adaptation-of-Agentic-AI/blob/main/paper.pdf

具体而言,研究团队将 Agentic AI 中的适配机制划分为“智能体适配”(Agent Adaptation)与“工具适配”(Tool Adaptation)两个维度,并归纳出四种适配策略。随后,他们综述了各类别中的代表性方法,并分析了它们的优缺点,指出了当前面临的核心挑战与未来的发展机遇。

研究团队认为,未来 Agentic AI 的进步取决于上述范式的策略性整合,而非孤立发展。“最终,下一代智能系统将不再是一个庞大的单体模型,而是由稳定的推理核心与一系列专业化、可自适应工具的有机协同所构成的体系。”


两个维度


“适配”是 Agentic AI 系统中的关键要素。通过这一机制,Agentic AI 可以调整自身的行为方式、决策策略以及内部表征,从而更好地契合特定领域、任务或运行环境的需求。如果缺乏此类自适应能力,Agentic AI 将难以超越最初的系统设计,在动态、真实世界环境中表现受限。

研究人员依据被优化的系统组件,将 Agentic AI 的适配策略划分为两个维度。

第一维度为智能体适配(Agent Adaptation),主要通过调整 Agent 的内部参数、表征形式或行为策略,使其更好地契合任务需求。这一维度既涵盖传统的模型微调方法,也包括利用环境反馈的现代强化学习方法。

第二维度为工具适配(Tool Adaptation),其优化目标从 Agent 本身转移至其外部工具,如检索器、规划器、记忆模块以及各类专用模型,使得在 Agent 参数保持冻结的情况下,系统仍能从一个可适配的运行环境中获益。



图|Agentic AI 适配机制的概览


四种适配范式


在这两个维度内,研究人员进一步确定了四种不同的适配范式。

在智能体适配这个维度上,Agentic AI 可以根据其与工具、环境或自身输出的交互反馈,不断修正其行为与决策能力的机制。这一过程对于提升智能体在多样化任务中的自主性、推理能力与泛化能力具有关键作用。这一维度可归纳为两个适配范式:

A1:工具执行信号驱动的智能体适应



A1 关注的是智能体自身的适配,其学习信号直接来源于工具的执行结果。在这种设置下,外部工具会返回明确、可验证的反馈,例如代码是否成功运行、检索结果是否匹配目标文档,或某次 API 调用是否返回正确结果。

智能体并不依赖主观评价,而是根据这些由工具执行直接产生的“对或错”信号来调整其决策与行为方式。

这一机制常见于程序合成、信息检索和自动化推理等任务中,其核心特征在于反馈信号具有高度确定性和可验证性。



A2:智能体输出信号驱动的智能体适应



A2 同样以智能体的更新为目标,但其学习信号来自对智能体自身输出结果的评估。在该策略中,智能体的最终答案、规划方案或推理过程会被整体评判,其评价标准可以是答案是否正确、人类或模型给出的偏好评分,或对推理质量的综合判断。

与前一类不同,这里的反馈并不一定直接来自工具执行,而是基于对输出结果的整体评价,因此更适用于开放性任务、主观性较强的问题,或缺乏明确可执行验证机制的场景。

在工具适配这个维度,Agentic AI 将优化目标指向外部组件,即在感知、计算与交互过程中起中介作用的“工具”。这些工具包括预训练模型、检索模块、规划器或执行器等,并可由智能体通过自然语言或代码进行调用。

因此,工具适配关注的并非智能体的内部认知结构,而是其运行环境的整体能力提升。这一维度可归纳为两个适配范式:



T1:智能体无关的工具适应



在 T1 中,智能体保持参数冻结,不参与学习,而各类工具则在系统部署前通过独立训练获得能力。这些工具可以是检索器、领域专用模型或其他预训练组件,智能体只负责在推理过程中调度和组合它们。

这种做法强调模块化和可复用性,使得同一个智能体能够在不改变自身结构的情况下,灵活接入不同能力的工具。

T2:智能体监督的工具适应



在 T2 中,智能体依然保持固定,但工具会根据智能体的输出表现或使用效果进行更新。例如,检索器可以依据智能体最终任务是否成功来调整检索策略,重排序模块可以学习为智能体提供更有用的信息排序,记忆模块也可以根据智能体的使用习惯不断优化存储内容。

这一机制的关键在于,工具的训练目标不再是独立性能最优,而是更好地支持特定智能体的决策与推理过程。




四个研究机遇


基于以上分析,研究团队提出了四个潜在的研究机遇,为开发更高效、可扩展的 Agentic AI 指明了方向。通过整合参数高效微调、量化及端侧适配,未来的智能体将能持续进化,准确契合用户需求与环境限制。

协同适配

在协同适配框架下,智能体的决策与工具的内部机制同步调整,彼此构成动态的学习环境,从而形成更紧密、也更灵活的协作关系。这一设想突破了当前通过固定其中一方来维持训练稳定性的主流做法,使系统优化目标从单点性能提升转向整体协同效果。

与此同时,协同适配也带来了新的挑战,包括复杂任务中的责任归因问题,以及双方同时学习所引发的稳定性风险。未来研究需要在联合训练机制与学习节奏控制方面取得进展,才能推动协同适配走向可扩展、可靠的 Agentic AI 系统。



图|协同适配示例。

持续适配

现有的适配方法预设任务环境是稳定的,通常一次只针对单一任务进行优化。但在真实应用中,任务类型、可用工具和用户需求都会不断变化。为此,Agentic AI 需要具备持续适配的能力,能够在动态环境中不断更新自身行为、工具和记忆。

持续适配的核心是在学习新任务的同时尽量保留已有能力。一方面,通过持续更新模型参数来实现适配,通过限制对关键参数的改动或采用参数高效的更新方式,减轻遗忘问题;另一方面,依赖外部记忆,将经验、工具调用和用户反馈存储并逐步整理,使核心模型保持稳定。



图|持续适配示例。

安全适配

当 AI 从“静态模型”升级为能够不断学习和调整的智能体系统,安全问题也随之发生变化。传统方法主要关注固定模型是否对齐,而一旦系统具备持续适配能力,新的风险就会来自自主试错和持续优化本身。

因此,安全适配的关键不在于彻底限制学习能力,而是在学习过程中引入约束和校验机制,例如在工具调用前进行安全检查,用更可验证的标准评估行为结果,以及防止智能体和工具在适配中相互“迎合”。只有这样,Agentic AI 才能在持续进化的同时保持可控和可靠。



图|安全适配示例。

高效适配

目前,Agentic AI 的学习和适配往往依赖大量算力,这使得它们难以在个人设备上运行,也限制了个性化能力。高效适配的核心目标,是让智能体在更少计算资源下完成学习,从而走向手机、边缘设备等真实使用场景。

一条思路是只对模型进行极小幅度的更新,用很少的参数完成新任务的学习,降低计算和存储成本;另一条思路是通过降低计算精度来提升效率,让学习过程更快、更省能耗,而不会明显影响最终效果。

高效适配意味着把学习过程搬到用户设备本身。智能体可以在本地根据用户的使用习惯不断调整行为,既提升个性化体验,也减少数据外传带来的隐私风险。



图|高效适配示例。

展望未来,Agentic AI 的发展将取决于对上述适配范式的策略性融合,通过采用混合式架构,在保持以智能体适配所带来的深层推理能力的同时,结合以工具适配的模块化效率,实现更好的鲁棒性与可扩展性。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
没了!再见,杨瀚森,主帅正式摊牌:没那么多时间给年轻人

没了!再见,杨瀚森,主帅正式摊牌:没那么多时间给年轻人

球童无忌
2026-02-12 15:28:35
罕见!山西6人被罚下场,专家:比赛没啥意思,但是冲突挺有意思

罕见!山西6人被罚下场,专家:比赛没啥意思,但是冲突挺有意思

南海浪花
2026-02-12 22:52:52
光线传媒:公司参与的影片《飞驰人生3》《惊蛰无声》《熊猫计划之部落奇遇记》已定于2026年大年初一上映

光线传媒:公司参与的影片《飞驰人生3》《惊蛰无声》《熊猫计划之部落奇遇记》已定于2026年大年初一上映

证券之星
2026-02-12 19:35:58
女演员自曝投资失败,从800平豪宅搬进80平出租屋:把所有钱放股市,赔了几百万

女演员自曝投资失败,从800平豪宅搬进80平出租屋:把所有钱放股市,赔了几百万

大风新闻
2026-02-12 18:01:34
Seedance2.0海外爆火!马斯克惊叹:发展速度太快了!美国导演:可能会搞垮好莱坞……

Seedance2.0海外爆火!马斯克惊叹:发展速度太快了!美国导演:可能会搞垮好莱坞……

每日经济新闻
2026-02-12 17:50:21
内蒙古一200斤男子欠5000万不还,被债主装进铁笼沉入80米水库,谁料,2年后才被捞出...

内蒙古一200斤男子欠5000万不还,被债主装进铁笼沉入80米水库,谁料,2年后才被捞出...

品读时刻
2026-02-11 17:18:30
五角场商圈一家烤鱼店排队6000桌?看“排队经济”玩出新高度

五角场商圈一家烤鱼店排队6000桌?看“排队经济”玩出新高度

上观新闻
2026-02-12 20:29:07
又一个恶魔医生!诈骗94名患者205万,手术中植入不必要医疗器械

又一个恶魔医生!诈骗94名患者205万,手术中植入不必要医疗器械

风向观察
2026-02-12 21:02:01
2月12日俄乌最新:停火条件——限制俄罗斯武装部队规模

2月12日俄乌最新:停火条件——限制俄罗斯武装部队规模

西楼饮月
2026-02-12 21:35:54
米兰冬奥奖牌榜:21国获牌,挪威居首,东道主第3,我国力压韩国

米兰冬奥奖牌榜:21国获牌,挪威居首,东道主第3,我国力压韩国

湘楚风云
2026-02-12 11:26:15
中国人民银行通告全国:2月1日起,人民币现金收付新规正式施行

中国人民银行通告全国:2月1日起,人民币现金收付新规正式施行

纵拥千千晚星
2026-02-12 17:01:18
河村勇辉狂轰34+8+16:创两项生涯新高 世预赛将成中国男篮大敌

河村勇辉狂轰34+8+16:创两项生涯新高 世预赛将成中国男篮大敌

醉卧浮生
2026-02-12 15:24:31
但斌爆猛料:公司有研究员炒黄金期货,90万赚了10多亿...

但斌爆猛料:公司有研究员炒黄金期货,90万赚了10多亿...

金石随笔
2026-02-11 23:32:38
马筱梅突然提前报喜,宝宝意外降生,汪小菲专程赴曼谷还愿超暖心

马筱梅突然提前报喜,宝宝意外降生,汪小菲专程赴曼谷还愿超暖心

做一个合格的吃瓜群众
2026-02-12 18:25:01
重庆力帆前外援吉利奥蒂:在中国时球员赛后不洗澡就直接回家

重庆力帆前外援吉利奥蒂:在中国时球员赛后不洗澡就直接回家

懂球帝
2026-02-12 11:37:07
贵有贵的道理!曼城7200万签塞梅尼奥血赚,8场5球2助稳坐主力!

贵有贵的道理!曼城7200万签塞梅尼奥血赚,8场5球2助稳坐主力!

田先生篮球
2026-02-12 16:27:13
曾是章子怡、孙红雷等人老师,中央戏剧学院陈刚主动投案!

曾是章子怡、孙红雷等人老师,中央戏剧学院陈刚主动投案!

中国青年报
2026-02-12 19:14:20
特朗普发声!降息,突变!黄金、白银巨震

特朗普发声!降息,突变!黄金、白银巨震

证券时报e公司
2026-02-12 04:54:10
她住300万美元豪宅,却图便宜找黑医注射屁股?不知黑医早害死过人,悲剧了...

她住300万美元豪宅,却图便宜找黑医注射屁股?不知黑医早害死过人,悲剧了...

英国那些事儿
2026-02-11 23:21:08
谢贤前女友又曝猛料!谢霆锋娶张柏芝并不是因为爱她,隐瞒所有人

谢贤前女友又曝猛料!谢霆锋娶张柏芝并不是因为爱她,隐瞒所有人

洲洲影视娱评
2026-02-12 12:26:45
2026-02-13 00:59:00
学术头条
学术头条
致力于学术传播和科学普及,重点关注AI4Science、大模型等前沿科学进展。
1430文章数 5081关注度
往期回顾 全部

科技要闻

10倍速的一夜:三大模型春节前的暗战

头条要闻

美称中国已购买美国出售的委内瑞拉石油 中方回应

头条要闻

美称中国已购买美国出售的委内瑞拉石油 中方回应

体育要闻

31岁首次参加冬奥,10年前她是个水管工

娱乐要闻

《惊蛰无声》违规抢占排片遭影院控诉

财经要闻

“影子万科”如何掘金万科?

汽车要闻

开212 T01柴油版去穿越 连牧马人都跟不上

态度原创

手机
健康
教育
时尚
本地

手机要闻

荣耀MagicOS二月新春特别更新发布

转头就晕的耳石症,能开车上班吗?

教育要闻

AI替代人并不可怕,只需掌握这三条

50+女人怎么穿更好看?过来人告诉你答案,越老越美赢麻了

本地新闻

下一站是嘉禾望岗,请各位乘客做好哭泣准备

无障碍浏览 进入关怀版