驯兽、筑境、套辔：AI工程语言的演变与人机关系的悄然位移|翻译|代码|术语|上下文|新论文|ai工程

驯兽、筑境、套辔：AI工程语言的演变与人机关系的悄然位移

2026-05-21 13:00:27　来源: 澎湃新闻

北京举报

分享至

一、词语先于现实

技术界有一种惯性：用词语的更迭来宣告范式的终结与重生。每隔一两年，总有新的行话涌现，带着无可置疑的前瞻感席卷从业者的话语空间——仿佛只要掌握了正确的术语，就掌握了通往未来的钥匙。

过去三年，人工智能领域依次经历了三个彼此嵌套、层层递进的工程概念：提示词工程（Prompt Engineering）、上下文工程（Context Engineering）、驾驭工程（Harness Engineering）。它们的诞生与流行，不仅记录了AI技术能力的阶梯式跃升，也在无声中折射出人类与AI关系的结构性变迁——而这一变迁，远比技术文档所呈现的更值得深究。

电影《普罗米修斯》

二、提示词工程：我们曾以为语言是咒语

2022年底，ChatGPT横空出世，公众第一次以如此低的门槛与大语言模型对话。随之而来的，是“提示词工程”这一概念在科技媒体和LinkedIn上的爆炸性传播。一时间，人人都是“提示词工程师”——这个头衔的迷人之处在于，它将与机器对话的技艺包装成了一门严肃的工程学科，给平凡的键盘敲击赋予了某种专业的光晕。

所谓“提示词工程”，本质上是一种针对单次交互的语言优化实践：通过精心设计指令的措辞、结构与范例，诱导模型生成更接近预期的输出。它的内核是”零样本提示词”、“少样本示例”、“思维链推理”等技巧，作用范围是单一的对话窗口，关注的核心是“如何问”。

这种实践确实奏效，尤其对于自足的单次任务——摘要、翻译、改写、代码片段生成。但它的隐患同样内在于其逻辑之中：提示词工程预设了一种语言拜物教，相信只要找到正确的“咒语”，模型便会臣服。互联网上随之出现了大量“神奇提示词”的攻略，声称某段特定的措辞可以解锁模型的隐藏能力，其叙事逻辑颇类于中世纪的符文学。

等到任务真的复杂起来，这套东西的问题就藏不住了。多轮对话、跨步骤推理、需要在第七轮还记得第一轮说过的前提——提示词工程在这里基本交白卷。模型丢掉关键信息、在不该自信的地方一本正经地胡说、前后给出相互打架的答案，这些毛病一一浮出水面。

人们的本能反应是继续优化提示词。措辞再精准一点，结构再清晰一点，也许就能更好。但这个方向从根本上就走歪了——这些故障的根源不是语言表达的问题，是模型本身没有持续运转的工作记忆，每次对话对它而言都是重新开机，之前发生的事情它并不真的“知道”，只是在上下文窗口里还看得见而已。窗口一满，就消失了。语言技巧解决不了这个，就像一封写得再好的信，也替代不了一套运转正常的档案管理系统。

电影《她》

三、上下文工程：从语言技艺到信息建筑

2025年中前后，“上下文工程”这个词开始在AI开发社区里密集出现。直接的触发点之一是Andrej Karpathy的一句话——他把上下文工程描述为”将上下文窗口以恰当信息填满、以服务于下一步目标的精妙艺术与科学”（the delicate art and science of filling the context window with just the right information for the next step）。这句话被反复转引，大概是因为它说出了很多人已经在做、但没想清楚自己在做什么的那件事。

两者的核心差异说起来并不复杂。提示词工程问的是“怎么开口”，上下文工程问的是“开口之前，模型需要知道什么”。前者是在反复推敲一封信的措辞，后者是在想这封信送达之前，信使的包里还应该带上哪些材料、从哪取、按什么顺序放好，关注的层次不一样。

技术上，这意味着要处理的东西多了一个量级：系统提示怎么写、历史对话保留多少、什么时候从外部知识库拉取相关内容、工具调用的结果如何回流进语境、跨会话的记忆怎么维护...... 这些合在一起，是一套信息调度的问题，不是单个指令能覆盖的范围。Gartner在2025年的分析中把它定义为“设计和构建相关数据、工作流与环境，使AI系统能够理解意图、做出更优决策的系统性实践”：语言退成了配角，信息架构才是台面上真正的东西。

从认识论的角度看，这个转变值得记一笔。它说明从业者开始真正放弃“语言魔法”那套幻想了，不再寄望于找到某个神奇措辞去撬动模型，而是老实地去问：这个系统要正常运转，需要在正确的时间获得正确的信息，我该怎么把这件事做成系统性的设计。这是一种认知上的成熟，尽管来得有点迟。

不过上下文工程也有它绕不过去的问题。它把人的角色从“发话者”升格为“信息架构师”，听上去是一次提升，但模型本身的处境并没有变，它还是那个被动等待投喂的执行方，在人设定的信息范围内运转，称不上真正意义上的协作者。这个结构性的不对等并没有被解决，只是在“工程化”的新话语里暂时搁置了。等到下一个概念出场，它会被推到更难回避的位置。

四、驾驭工程：当AI成为需要“套辔”的存在

2026年初，OpenAI公开了一项内部实验的细节：一个由三名（后扩展至七名）工程师组成的小组，在约五个月内构建了一个包含逾百万行代码的生产级应用：其中没有任何一行代码出自人类之手。工程师们的工作是设计和维护一套使AI代理能够可靠、自主地完成任务的基础设施，这套基础设施便被称为“驾驭”（harness）。

“驾驭工程”（Harness Engineering）由此迅速获得关注。“harness”一词本源于马具：缰绳、鞍具、嚼铁，那套用于驾驭强壮而不羁之兽、使其力量得以被有方向地利用的全套装备。这个隐喻本身已经大有深意，容后详论。

在技术层面，驾驭工程是对上下文工程的进一步延伸与升格。如果说提示词工程关注单个指令，上下文工程关注信息生态，那么驾驭工程关注的则是整个智能体系统的约束、反馈与熵控：代码库的结构设计（使其对AI“可读”）、工具权限的精确划定、质量规则的自动化执法、失败后的自动恢复机制、以及人类介入节点的系统性嵌入。

一个有力的隐喻来自技术社区：模型是CPU，上下文窗口是RAM，驾驭则是操作系统。你不会将软件直接运行于裸露的芯片之上；同理，你也不会让AI代理在没有操作系统的情况下独立运转。驾驭工程师的工作，不是写代码，而是设计让AI可以写出可靠代码的环境。

五、一个值得警惕的隐喻

三个概念的演进轨迹呈现出某种令人不安的逻辑：人类与AI之间的关系，在话语层面正悄然经历一次深刻的重构。提示词工程时代，人类是问话者，AI是应答的神谕。

上下文工程时代，人类是信息管理员，AI是需要被正确喂养的推理引擎。驾驭工程时代，人类是驯兽师/系统设计者，AI是一匹强壮但需要被套辔的马，或者更直白地说，是一种功能强大但“不知自己该往哪里去”的存在。

这一隐喻并非中性的技术描述。正如研究者亚当·格林菲尔德（Adam Greenfield）早年对“智慧城市”概念的批判，城市的话语框架本身就预设了某种权力配置。“驾驭”这一隐喻同样内嵌着特定的权力想象：被套辔者没有参与设计辔具的发言权；驾驭旨在传递能量的同时阻止不受欢迎的行为；使用者部署了一个训练有素的AI，应当在任务完成后自身保持原封不动，不受任何影响。

这第三个假设尤为值得质疑。研究者在分析“AI驾驭”这一话语时指出：驾驭的目标是从模型中提取有用的工作，而不改变用户自身。但这是一个难以成立的假设。人类与AI系统的长期互动，必然双向地影响着交互双方：人类的思维习惯、判断路径、注意力模式，不可能对这种持续的协作结构保持免疫。我们不应将这种改变视为副作用加以最小化，而应将其作为需要被认真审视的核心议题。

电影《2001太空漫游》

六、“工具论”的幽灵

贯穿这三个概念的，是一个挥之不去的哲学预设：AI是工具。这一立场的渊源可以追溯至亚里士多德对“自然物”（physis）与“技术物”（techne）的区分：技术物的存在理由完全外在于自身，服务于使用者的目的，而非自身的“善”。当代技术哲学中，这一观点以“工具中立论”的面目持续活跃：技术本身无善恶，善恶在于使用方式；AI只是工具，责任在于掌控它的人。

这种立场的吸引力在于它的道德简洁性：只要我们把辔具做好，马跑哪里是我们的事。但这种简洁恰恰是它的危险之处。它将人类的道德责任局限于“如何使用”，而回避了“是否应当使用”、“谁来决定使用目的”、“被使用的过程中什么被改变了”等根本问题。

驾驭工程所描述的未来，是一个人类工程师设计约束系统、AI代理在约束中自主生成大量输出、而人类因输出量太大无法逐一审查、因此必须将审查本身也交给更多自动化系统的循环。这是一种递归的外包：注意力稀缺倒逼监督自动化，监督自动化进一步释放AI产能，产能扩大再次压缩人类注意力。在这个循环中，“人类监督”逐渐从实质性介入萎缩为形式性存在。

这不是对AI技术本身的否定，而是对一种特定发展路径的叩问：当“人类注意力是真正稀缺资源”成为工程圈的共识性表述，当工程师的核心工作从写代码转变为“设计让AI写代码的环境”，我们是否应当停下来问一句：在这个新的分工结构中，“人类理解”究竟被保留了多少，还是也被悄然外包了出去？

尾声：警惕”工程化”的话语霸权

三个概念的共同修辞策略是将一切纳入“工程”的框架——工程意味着系统性、可重复性、去艺术化、去偶然性。这一话语运动本身耐人寻味：它将本应是人文与社会议题的问题（人与AI如何共处、谁来决定AI的行动边界、AI对人类认知的影响）悄悄还原为技术设计问题。

“工程”语言的强势渗透，并非只是无害的命名习惯。当我们用“驾驭”来描述人机关系，当我们以“上下文”来理解意义传递，我们也在接受这些隐喻所携带的权力关系与世界观。博格斯的图书馆里，每一本书都沉默地包含着对世界的某种特定分类；每一个工程术语，也同样包含着对人与技术关系的某种特定假设。

我无意否认这三个概念在技术层面的实质推进，也无意鼓吹某种技术虚无主义。提示词工程确实推动了AI的民主化；上下文工程确实提升了系统的可靠性；驾驭工程确实使大规模自主代理成为可能。这些都是真实的进步。但真实的进步需要真实的批判作为伴行者。

当下最值得追问的，或许不是“如何把驾驭做得更好”，而是：当驾驭AI的基础设施本身变得足够复杂、足够自动化，当设计驾驭的权力掌握在少数工程师和科技企业手中，驾驭里的“人类判断”，究竟还有多少是真正属于人类的？

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.