网易首页 > 网易号 > 正文 申请入驻

从 Prompt 到 Context:易点天下 Agentic AI 工程化实践

0
分享至


作者 | 何宇航

随着 2026 年的到来,生成式 AI 已经彻底告别了"Demo 满天飞"的狂热期,正式步入工程化落地的深水区。当大模型的能力边界不再神秘,企业架构师们面临的核心命题已经发生转移:如何在一个确定性要求极高的复杂企业架构中,有效驯服 Agent 固有的"幻觉"与"遗忘",让概率性的智能稳定地跑在确定性的生产系统之上?

在 2026 QCon 全球软件开发大会·北京站上,易点天下中台研发总监何宇航分享了其在 Agentic AI 领域的工程化实践与思考。依托企业级"上下文工程(Context Engineering)"与纵深安全防御体系,他详细解读了易点天下如何将概率性的 AI 稳妥地嵌入全球化业务的毛细血管中。

1 底层支撑:多云共生的确定性架构

Agent 的稳定运行无法脱离坚实的基础设施。易点天下的核心业务覆盖全球 230 多个国家和地区,面对极高的合规与网络连通性挑战,其底层的 Cycor 平台从设计之初便确立了多云战略(Multi-cloud)。

目前,该平台已实现对 AWS、GCP、阿里云、腾讯云、华为云等主流厂商的无缝接入与统一资源调度,实际纳管着大量 K8s 集群与底层组件,形成了跨云、跨地域的统一控制面。

在 Agent 的构建逻辑中,这种不依赖单一云底座的多云共生架构具有极高的战略价值:它不仅从根本上规避了供应商锁定(Vendor Lock-in)的风险,更重要的是在面对大模型算力调度时,能够在成本、效果与可控性之间动态平衡。对于人力相对精简的底层运维团队而言,这种高度统一的多云调度能力,正是后续构建 DevOps Agent 的物理前提。

2 技术攻坚:从 Prompt 编排走向 Context Engineering

在 Agent 探索的早期(V1 阶段),研发团队曾基于低代码平台构建线性 Workflow 编排:由一个前置分类器根据 System Prompt 路由到不同的固定 Agent。系统运行三个月后,架构阵痛集中暴露:

首先,高度依赖系统提示词的分类器极不稳定,分类错误率长期维持在 15% 左右,团队常常陷入"修复 A 场景却破坏 B 场景"的窘境;其次,记忆仅局限于单次上下文窗口,缺乏跨会话的持久化能力,导致同一故障在不同会话中被反复从零推理;最后,固定编排使各 Agent 各自为战,无法协同处理跨域链路问题。

为此,技术团队果断放弃线性编排,转向基于 Agent Loop 的自主智能体架构(单轮对话内最多 15 轮工具调用循环),并将工程重心从"怎么措辞(Prompt)"彻底切换到"每一步该给什么信息(Context)"的上下文工程。

简单来说,上下文工程解决三个彼此纠缠的根本问题:需要的信息如何进得来、无关的信息如何挡得住、宝贵的 Token 预算如何花在刀刃上。围绕这三条主线,易点天下搭建了一套覆盖"分层记忆 + 主动注入 + 预算治理 + 压缩续接"的完整工程体系。


1. 构建六层上下文体系

为了让 Agent 在长期任务中既能记住关键线索,又能有效过滤噪音,系统设计了一条动态的信息管线,将上下文精细化为六个层次:

  • L1 Session Memory(当前会话):基于 PostgreSQL 普通表,通过 session_id 进行硬隔离,支撑当前会话的毫秒级读写与自动化清理;

  • L2 Short-Term(近期记忆):维持 24 小时的跨会话时间窗口,用于识别短期内的故障复发;

  • L3 Long-Term(持久化事实):引入记忆引擎与向量存储,将高价值对话提炼为客观事实并持久化,配合 Agentic Search 进行语义检索与冲突合并;

  • L4 Knowledge Graph(实体关系):由 LLM 抽取三元组,存入图数据库,帮助 Agent 在复杂微服务网络中建立资源间的拓扑认知;

  • L5 Experience(个人经验库):系统自动对高频故障模式进行聚类,提炼出如"遇到 OOM 先查 limits"的经验标签,在同类报错中自动注入;

  • L6 Skill(组织技能手册):由经过人工验证的经验固化而来的标准化 Markdown 手册,作为组织级的 Skill 资产沉淀下来,真正实现"个人经验 → 团队资产"的跃迁。


2. 主动注入:让 Agent 在"需要的时候刚好知道"

仅仅把信息存下来还远远不够。传统的"Agent 按需自取"模式存在一个根本缺陷——模型不知道自己不知道什么,它无法主动去检索一条它从未听说过的故障记录。为此,易点天下借鉴了 Hook 化的主动推送思路,在 Agent 生命周期的关键节点内置了三类检索钩子:

  • UserMessage 钩子:在用户提问进入 Agent Loop 之前,先做意图过滤与关键词 / 语义双路召回,将相关记忆分层注入到 System Prompt;

  • PreToolUse 钩子:在写文件、改配置等敏感工具调用之前,按精确资源 ID 匹配历史变更记录与已知风险,避免 Agent 重复踩坑;

  • ErrorSignal 钩子:一旦检测到错误关键字(timeout、OOM、ImagePullBackOff 等),自动按 bugs/errors 维度拉取历史解法并分层注入。

这一机制把"记忆"从被动的资料库升级为主动的副驾驶——Agent 在真正需要某条知识之前,相关上下文就已经悄悄到位。

3. Token 预算治理:渐进式注入与分层内容

上下文窗口是 Agent 时代最稀缺的资源。经验表明,一次粗放地塞入 3 条知识、每条 500 tokens,就会吞掉约 10% 的可用窗口,不仅挤占推理空间,还会放大 Lost in the Middle 效应。易点天下为此构建了一套分层的 Token 预算治理体系:

  • 三级内容分层:每条知识都会被预先生成 L0/L1/L2 三种"分辨率"——L0 Abstract 约 100 tokens 的一句话摘要,L1 Overview 约 300 tokens 的详细要点,L2 Full 则是完整 Markdown 全文;

  • 按相关度动态选档:检索命中后,相关度 score > 0.8 注入 L1、score ≤ 0.8 降级为 L0、用户或 Agent 主动 Read 时才展开 L2,单次注入 Token 稳定压在 100–300 的小窗口内;

  • 短会话直通,长会话采样:当整段会话字符数在预算之内时直通不压缩,零信息损失;一旦超预算,优先截断单条 assistantText,而不是整段丢弃问答对,保住推理链条的完整性;

  • 硬预算 + 软降级:每条链路都设有明确的性能预算(如 UserMessage 注入 3 秒、PreToolUse 注入 100 毫秒内完成),超时即走降级路径,宁可少注入也不阻塞主流程。

这一套组合拳下来,单次注入的 Token 消耗下降约 80%,同时因为 L2 完整内容始终"一键可达",信息完整性反而得到了更好的保证。

4. 渐进式工具加载,破解 Token 瓶颈

在真实的 K8s 运维场景中,Agent 面临数十乃至上百个可选工具。如果将全部 Tool Schema 一次性塞入 Prompt,不仅浪费 Token,还会触发大模型的中间注意力丢失(Lost in the Middle),导致工具选择错乱。

为此,易点天下设计了"渐进式工具加载(Deferred Tool Registry)"机制:初始态仅激活 list_pods 等核心工具,其余长尾工具仅在 Prompt 中保留极简描述;当模型推理需要时,通过内部的 tool_search 能力按需动态唤醒并加载对应工具。

这一工程手段带来了跨越式的效果提升:工具调用准确率由 V1 的约 70% 提升至 V2 的约 90%;由于记忆层可直接命中已解决过的故障模式,重复性问题的处理时间由原先的 60 秒量级缩短至 5 秒以内,响应周期实现了数量级改善。

5. 压缩续接:让长任务不"失忆"

即便做了严格的预算治理,真实运维场景下的长链路排障仍可能逼近上下文上限。为此,系统在窗口接近阈值时会触发 PreCompact 钩子:将既有对话按"问题—行动—观察—结论"的结构化摘要格式进行压缩,生成 { overview, steps, todos } 三段式的会话摘要,并在下一轮启动时作为 Warm 层(最近 10 次会话摘要,FIFO 淘汰)注入。这使得 Agent 即使跨越数小时的多阶段任务,也能"记得上次做到哪一步、还有哪些 TODO 没闭环",彻底告别了 V1 阶段"关掉对话就失忆"的窘境。

可以说,如果 L1–L6 回答的是信息放在哪里,主动注入解决的是什么时候送进去,那么 Token 预算治理与压缩续接要回答的则是怎么在有限窗口里把每一个 Token 花在最有价值的地方——这三件事合在一起,才构成了易点天下真正意义上的"上下文工程"。

3 安全底线:五道防线确保可控性

将确定性要求极高的生产环境(如操作海量 K8s 集群)交由概率性的大模型去决策,安全是不可逾越的底线。在易点天下的治理理念中,"AI 是加速器,而不是刹车"——但加速器必须跑在有护栏的赛道上。

为此,系统在 Agent 操作链路上设计了五层结构化的纵深防御闸门。在这套体系中,仅有 1 层允许大模型(LLM)参与决策,其余 4 层全部交由严谨的规则代码进行物理兜底:

  1. 白名单准入(NamespaceGuard):在中间件代码层面直接屏蔽 LLM 对 kube-system 等核心命名空间的可见性与操作权限,风险从源头隔离;

  2. 试执行与人工介入(Dry Run + HITL):LLM 生成的运维指令先进行空跑校验,敏感操作强制触发人工审批流(这是 LLM 唯一参与验证判断的层级);

  3. 资源锁与爆炸半径限制:通过代码硬编码单次操作的资源配额与影响范围,防止级联雪崩;

  4. 规则校验(不轻信 LLM):指令执行后,系统拒绝依赖大模型的自然语言回复,而是通过代码重新调用系统接口,对比实际状态是否符合预期;

  5. 强制回滚机制:系统约束所有修改类工具在注册时必须附带降级与回滚逻辑,出现异常可一键退回安全态。

通过这套防御机制,易点天下将复杂集群操作的误执行率压低至接近于零,在效能与安全之间取得了稳定平衡。

4 未来洞察:生产力重构与开发者的新身份

在工程化落地的推动下,AI 的定位已经发生质变。正如其内部实践总结中所提出的预判:在 2026 年的 AI Coding 时代,开发者的工作姿势将被彻底重构——"由 AI 负责执行,人负责 Taste(审美与逻辑判断)"。

目前,Agent 在易点天下早已突破底层运维实验室的边界,作为"数字搭子"深度渗透到业务毛细血管之中。依托坚实的 AI 中台架构,公司内部已活跃运行着近百个不同职能的 Agent,覆盖营销业务(策略洞察、自动化投放)、内部运营(BI 分析、审批协同)、技术运维、客户服务等多个维度。

当大模型基座逐渐趋同,真正的技术壁垒将建立在三件事之上:企业对上下文工程的理解深度、多云架构的掌控力,以及把组织经验沉淀为可执行 Skill 的能力。易点天下的工程化实践再一次证明:在这场生产力重构的浪潮中,用极客的确定性去驾驭 AI 的不确定性,是企业走向智能化的必由之路。

(注:文中提及的相关数据均来源于易点天下,最终解释权归易点天下所有。)

会议推荐

测完 MBTI,快来解锁技术人专属 AITI !前沿探索家、大模型工程师、Agent 实战拆解师、行业赋能师… 你是哪一种?6.26-27 # AICon 上海站等你面基同频人!世界模型与多模态智能突破、Agent 架构与工程化实践、Agent 安全与可信治理、企业级研发体系重构等 14 大专题全面开启,诚挚邀请你登台分享实战经验。AICon 2026,期待与你同行。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
李国庆自曝往事:净身出户后不舍请司机,老下属月薪8500不离不弃

李国庆自曝往事:净身出户后不舍请司机,老下属月薪8500不离不弃

洲洲影视娱评
2026-05-08 15:25:45
哈工大博士…崩了

哈工大博士…崩了

勋哥教你填志愿
2026-05-08 07:02:39
演员张颂文片场收工后,将粉丝赠送的茶叶原路退回,并叮嘱“你们自己工作挣的钱给自己和家人花,我收收你们的信就好了”

演员张颂文片场收工后,将粉丝赠送的茶叶原路退回,并叮嘱“你们自己工作挣的钱给自己和家人花,我收收你们的信就好了”

洪观新闻
2026-05-07 15:18:54
许家印认罪10天后,“保护伞”终于被扒出,谁都别想跑!

许家印认罪10天后,“保护伞”终于被扒出,谁都别想跑!

历史伟人录
2026-05-08 17:54:57
紫牛头条 | 网购时发现所在街道被“拉黑”,商家称该片地址恶意退货的人太多

紫牛头条 | 网购时发现所在街道被“拉黑”,商家称该片地址恶意退货的人太多

扬子晚报
2026-05-08 09:48:44
14岁神童手搓发动机被曝造假!漏洞百出吹上天,普通人拿什么比?

14岁神童手搓发动机被曝造假!漏洞百出吹上天,普通人拿什么比?

社会日日鲜
2026-05-08 04:18:01
演都不演了!吴宜泽夺冠不到48小时,恶心的事情发生,还不止一件

演都不演了!吴宜泽夺冠不到48小时,恶心的事情发生,还不止一件

丁丁鲤史纪
2026-05-08 18:04:41
访华仅剩8天,美国抛出1890亿美元,中方底牌亮了

访华仅剩8天,美国抛出1890亿美元,中方底牌亮了

爱看剧的阿峰
2026-05-08 17:01:38
按下暂停键?日媒:中国多所顶尖大学已停止向日本派遣交换留学生

按下暂停键?日媒:中国多所顶尖大学已停止向日本派遣交换留学生

小兰聊历史
2026-05-08 12:41:25
真没想到!吴宜泽刚拿世界冠军,丁俊晖的幕后付出终于被公开

真没想到!吴宜泽刚拿世界冠军,丁俊晖的幕后付出终于被公开

十点街球体育
2026-05-08 15:38:58
光地皮就值2个亿的美国驻华大使馆,为何修成一座封闭式碉堡?

光地皮就值2个亿的美国驻华大使馆,为何修成一座封闭式碉堡?

贱议你读史
2026-05-07 14:58:39
可人传人,30人下船,多国追踪汉坦病毒

可人传人,30人下船,多国追踪汉坦病毒

中国新闻周刊
2026-05-08 18:24:45
江西省人大常委会委员喻晓社被查

江西省人大常委会委员喻晓社被查

新京报
2026-05-08 16:08:06
中国光伏的堡垒,被印度从内部攻破

中国光伏的堡垒,被印度从内部攻破

观察者网
2026-05-08 09:00:37
自己录音不让游客录,上海迪士尼被指“双标”!客服:介意录音可以不来电…

自己录音不让游客录,上海迪士尼被指“双标”!客服:介意录音可以不来电…

北京商报
2026-05-08 16:09:22
再表忠心!克雷桑穿上国足20号球衣:明年4月即可归化!

再表忠心!克雷桑穿上国足20号球衣:明年4月即可归化!

邱泽云
2026-05-08 18:18:08
日本高层访华无果后,不甘心的高市决定亲自访华,中方态度坚决

日本高层访华无果后,不甘心的高市决定亲自访华,中方态度坚决

潋滟晴方DAY
2026-05-08 05:03:41
空腹抽血,喝水算不算破坏?很多人意外!检验科医生权威解答

空腹抽血,喝水算不算破坏?很多人意外!检验科医生权威解答

环球网资讯
2026-05-06 13:46:09
班主任良心提醒:数学好的聪明和英语好的优秀根本不一样

班主任良心提醒:数学好的聪明和英语好的优秀根本不一样

朗威谈星座
2026-05-07 20:33:52
官方:咪咕视频、爱奇艺体育将转播U17亚洲杯第2轮中国vs日本

官方:咪咕视频、爱奇艺体育将转播U17亚洲杯第2轮中国vs日本

懂球帝
2026-05-08 15:57:17
2026-05-08 21:16:49
InfoQ incentive-icons
InfoQ
有内容的技术社区媒体
12345文章数 51878关注度
往期回顾 全部

科技要闻

SK海力士平均奖金600万 工服成相亲神器

头条要闻

媒体:"4只皮皮虾1035元"店主去世仅43岁 触发人们反思

头条要闻

媒体:"4只皮皮虾1035元"店主去世仅43岁 触发人们反思

体育要闻

他把首胜让给队友,然后用一年时间还清账单

娱乐要闻

古天乐被曝隐婚生子,新娘竟是她

财经要闻

特朗普全球关税又受阻,也能退款?

汽车要闻

MG 4X实车亮相 将于5月11日开启盲订

态度原创

艺术
手机
数码
本地
公开课

艺术要闻

探索施密德的油画,感受无法抵挡的艺术魅力!

手机要闻

给手机加个外挂:无损缩放首次下放安卓 PC大作帧率直冲三位数!

数码要闻

海信不卷电视了?六大3C潮品首发,全场景杀向年轻人

本地新闻

用苏绣的方式,打开江西婺源

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版