一、词语先于现实
技术界有一种惯性:用词语的更迭来宣告范式的终结与重生。每隔一两年,总有新的行话涌现,带着无可置疑的前瞻感席卷从业者的话语空间——仿佛只要掌握了正确的术语,就掌握了通往未来的钥匙。
过去三年,人工智能领域依次经历了三个彼此嵌套、层层递进的工程概念:提示词工程(Prompt Engineering)、上下文工程(Context Engineering)、驾驭工程(Harness Engineering)。它们的诞生与流行,不仅记录了AI技术能力的阶梯式跃升,也在无声中折射出人类与AI关系的结构性变迁——而这一变迁,远比技术文档所呈现的更值得深究。
![]()
电影《普罗米修斯 》
二、提示词工程:我们曾以为语言是咒语
2022年底,ChatGPT横空出世,公众第一次以如此低的门槛与大语言模型对话。随之而来的,是“提示词工程”这一概念在科技媒体和LinkedIn上的爆炸性传播。一时间,人人都是“提示词工程师”——这个头衔的迷人之处在于,它将与机器对话的技艺包装成了一门严肃的工程学科,给平凡的键盘敲击赋予了某种专业的光晕。
所谓“提示词工程”,本质上是一种针对单次交互的语言优化实践:通过精心设计指令的措辞、结构与范例,诱导模型生成更接近预期的输出。它的内核是”零样本提示词”、“少样本示例”、“思维链推理”等技巧,作用范围是单一的对话窗口,关注的核心是“如何问”。
这种实践确实奏效,尤其对于自足的单次任务——摘要、翻译、改写、代码片段生成。但它的隐患同样内在于其逻辑之中:提示词工程预设了一种语言拜物教,相信只要找到正确的“咒语”,模型便会臣服。互联网上随之出现了大量“神奇提示词”的攻略,声称某段特定的措辞可以解锁模型的隐藏能力,其叙事逻辑颇类于中世纪的符文学。
等到任务真的复杂起来,这套东西的问题就藏不住了。多轮对话、跨步骤推理、需要在第七轮还记得第一轮说过的前提——提示词工程在这里基本交白卷。模型丢掉关键信息、在不该自信的地方一本正经地胡说、前后给出相互打架的答案,这些毛病一一浮出水面。
人们的本能反应是继续优化提示词。措辞再精准一点,结构再清晰一点,也许就能更好。但这个方向从根本上就走歪了——这些故障的根源不是语言表达的问题,是模型本身没有持续运转的工作记忆,每次对话对它而言都是重新开机,之前发生的事情它并不真的“知道”,只是在上下文窗口里还看得见而已。窗口一满,就消失了。语言技巧解决不了这个,就像一封写得再好的信,也替代不了一套运转正常的档案管理系统。
![]()
电影《她》
三、上下文工程:从语言技艺到信息建筑
2025年中前后,“上下文工程”这个词开始在AI开发社区里密集出现。直接的触发点之一是Andrej Karpathy的一句话——他把上下文工程描述为”将上下文窗口以恰当信息填满、以服务于下一步目标的精妙艺术与科学”(the delicate art and science of filling the context window with just the right information for the next step)。这句话被反复转引,大概是因为它说出了很多人已经在做、但没想清楚自己在做什么的那件事。
两者的核心差异说起来并不复杂。提示词工程问的是“怎么开口”,上下文工程问的是“开口之前,模型需要知道什么”。前者是在反复推敲一封信的措辞,后者是在想这封信送达之前,信使的包里还应该带上哪些材料、从哪取、按什么顺序放好,关注的层次不一样。
技术上,这意味着要处理的东西多了一个量级:系统提示怎么写、历史对话保留多少、什么时候从外部知识库拉取相关内容、工具调用的结果如何回流进语境、跨会话的记忆怎么维护...... 这些合在一起,是一套信息调度的问题,不是单个指令能覆盖的范围。Gartner在2025年的分析中把它定义为“设计和构建相关数据、工作流与环境,使AI系统能够理解意图、做出更优决策的系统性实践”:语言退成了配角,信息架构才是台面上真正的东西。
从认识论的角度看,这个转变值得记一笔。它说明从业者开始真正放弃“语言魔法”那套幻想了,不再寄望于找到某个神奇措辞去撬动模型,而是老实地去问:这个系统要正常运转,需要在正确的时间获得正确的信息,我该怎么把这件事做成系统性的设计。这是一种认知上的成熟,尽管来得有点迟。
不过上下文工程也有它绕不过去的问题。它把人的角色从“发话者”升格为“信息架构师”,听上去是一次提升,但模型本身的处境并没有变,它还是那个被动等待投喂的执行方,在人设定的信息范围内运转,称不上真正意义上的协作者。这个结构性的不对等并没有被解决,只是在“工程化”的新话语里暂时搁置了。等到下一个概念出场,它会被推到更难回避的位置。
四、驾驭工程:当AI成为需要“套辔”的存在
2026年初,OpenAI公开了一项内部实验的细节:一个由三名(后扩展至七名)工程师组成的小组,在约五个月内构建了一个包含逾百万行代码的生产级应用:其中没有任何一行代码出自人类之手。工程师们的工作是设计和维护一套使AI代理能够可靠、自主地完成任务的基础设施,这套基础设施便被称为“驾驭”(harness)。
“驾驭工程”(Harness Engineering)由此迅速获得关注。“harness”一词本源于马具:缰绳、鞍具、嚼铁,那套用于驾驭强壮而不羁之兽、使其力量得以被有方向地利用的全套装备。这个隐喻本身已经大有深意,容后详论。
在技术层面,驾驭工程是对上下文工程的进一步延伸与升格。如果说提示词工程关注单个指令,上下文工程关注信息生态,那么驾驭工程关注的则是整个智能体系统的约束、反馈与熵控:代码库的结构设计(使其对AI“可读”)、工具权限的精确划定、质量规则的自动化执法、失败后的自动恢复机制、以及人类介入节点的系统性嵌入。
一个有力的隐喻来自技术社区:模型是CPU,上下文窗口是RAM,驾驭则是操作系统。你不会将软件直接运行于裸露的芯片之上;同理,你也不会让AI代理在没有操作系统的情况下独立运转。驾驭工程师的工作,不是写代码,而是设计让AI可以写出可靠代码的环境。
五、一个值得警惕的隐喻
三个概念的演进轨迹呈现出某种令人不安的逻辑:人类与AI之间的关系,在话语层面正悄然经历一次深刻的重构。提示词工程时代,人类是问话者,AI是应答的神谕。
上下文工程时代,人类是信息管理员,AI是需要被正确喂养的推理引擎。驾驭工程时代,人类是驯兽师/系统设计者,AI是一匹强壮但需要被套辔的马,或者更直白地说,是一种功能强大但“不知自己该往哪里去”的存在。
这一隐喻并非中性的技术描述。正如研究者亚当·格林菲尔德(Adam Greenfield)早年对“智慧城市”概念的批判,城市的话语框架本身就预设了某种权力配置。“驾驭”这一隐喻同样内嵌着特定的权力想象:被套辔者没有参与设计辔具的发言权;驾驭旨在传递能量的同时阻止不受欢迎的行为;使用者部署了一个训练有素的AI,应当在任务完成后自身保持原封不动,不受任何影响。
这第三个假设尤为值得质疑。研究者在分析“AI驾驭”这一话语时指出:驾驭的目标是从模型中提取有用的工作,而不改变用户自身。但这是一个难以成立的假设。人类与AI系统的长期互动,必然双向地影响着交互双方:人类的思维习惯、判断路径、注意力模式,不可能对这种持续的协作结构保持免疫。我们不应将这种改变视为副作用加以最小化,而应将其作为需要被认真审视的核心议题。
![]()
电影《2001太空漫游》
六、“工具论”的幽灵
贯穿这三个概念的,是一个挥之不去的哲学预设:AI是工具。这一立场的渊源可以追溯至亚里士多德对“自然物”(physis)与“技术物”(techne)的区分:技术物的存在理由完全外在于自身,服务于使用者的目的,而非自身的“善”。当代技术哲学中,这一观点以“工具中立论”的面目持续活跃:技术本身无善恶,善恶在于使用方式;AI只是工具,责任在于掌控它的人。
这种立场的吸引力在于它的道德简洁性:只要我们把辔具做好,马跑哪里是我们的事。但这种简洁恰恰是它的危险之处。它将人类的道德责任局限于“如何使用”,而回避了“是否应当使用”、“谁来决定使用目的”、“被使用的过程中什么被改变了”等根本问题。
驾驭工程所描述的未来,是一个人类工程师设计约束系统、AI代理在约束中自主生成大量输出、而人类因输出量太大无法逐一审查、因此必须将审查本身也交给更多自动化系统的循环。这是一种递归的外包:注意力稀缺倒逼监督自动化,监督自动化进一步释放AI产能,产能扩大再次压缩人类注意力。在这个循环中,“人类监督”逐渐从实质性介入萎缩为形式性存在。
这不是对AI技术本身的否定,而是对一种特定发展路径的叩问:当“人类注意力是真正稀缺资源”成为工程圈的共识性表述,当工程师的核心工作从写代码转变为“设计让AI写代码的环境”,我们是否应当停下来问一句:在这个新的分工结构中,“人类理解”究竟被保留了多少,还是也被悄然外包了出去?
尾声:警惕”工程化”的话语霸权
三个概念的共同修辞策略是将一切纳入“工程”的框架——工程意味着系统性、可重复性、去艺术化、去偶然性。这一话语运动本身耐人寻味:它将本应是人文与社会议题的问题(人与AI如何共处、谁来决定AI的行动边界、AI对人类认知的影响)悄悄还原为技术设计问题。
“工程”语言的强势渗透,并非只是无害的命名习惯。当我们用“驾驭”来描述人机关系,当我们以“上下文”来理解意义传递,我们也在接受这些隐喻所携带的权力关系与世界观。博格斯的图书馆里,每一本书都沉默地包含着对世界的某种特定分类;每一个工程术语,也同样包含着对人与技术关系的某种特定假设。
我无意否认这三个概念在技术层面的实质推进,也无意鼓吹某种技术虚无主义。提示词工程确实推动了AI的民主化;上下文工程确实提升了系统的可靠性;驾驭工程确实使大规模自主代理成为可能。这些都是真实的进步。但真实的进步需要真实的批判作为伴行者。
当下最值得追问的,或许不是“如何把驾驭做得更好”,而是:当驾驭AI的基础设施本身变得足够复杂、足够自动化,当设计驾驭的权力掌握在少数工程师和科技企业手中,驾驭里的“人类判断”,究竟还有多少是真正属于人类的?
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.