网易首页 > 网易号 > 正文 申请入驻

OpenAI 3年砸下2亿用户,工程师却集体吐槽"提示词工程"是

0
分享至

2024年,全球开发者每天向大模型发送的提示词超过100亿条。但一位在OpenAI工作过4年的工程师最近扔出一句话:「提示词工程不是方法论,软件工程才是。」

这话像一盆冷水。毕竟过去三年,「提示词工程师」年薪炒到33万美元,招聘网站上相关岗位涨了51倍。现在有人告诉你,这可能是个伪概念?

从「咒语」到「代码」:提示词的三次变形

2022年的GPT-3时代,提示词确实像魔法咒语。写得好坏全看语感,有人用「让我们一步步思考」能让准确率暴涨40%,有人换种说法就失效。那时候流传着各种「咒语手册」,比如「你是一个有帮助的助手」开头比「你好」效果好17%——数字精确到可疑,但没人深究。

2023年,情况变了。Anthropic的Claude团队发现,同样的任务,用结构化提示(JSON格式约束)比自由文本的稳定性高出3倍。这不是语感问题,是工程问题。提示词开始被当作代码管理:版本控制、单元测试、A/B对比。GitHub上涌现出一批提示词框架,比如LangChain把提示词模块化,像搭积木一样组合。

2024年的最新趋势更激进。OpenAI的o1模型、Anthropic的Claude 3.5 Sonnet都内置了「思维链」推理,用户不再需要写「让我们一步步思考」——模型自己就会拆步骤。提示词的角色从「指挥家」变成「边界设定者」:你定义输入输出格式,中间过程交给模型自主完成。

那位工程师的核心论点就在这儿:当提示词复杂到需要版本控制、测试用例、异常处理时,它本质上就是代码。而代码就该用软件工程的方法论来管,不是另起炉灶搞什么「提示词学」。

33万美元年薪买的是幻觉?

2023年3月,旧金山一家AI创业公司开出33万美元年薪招「提示词工程师」,要求只有一条:「会和GPT-4聊天」。这职位存在了18个月,公司CTO后来承认:「我们当时不知道自己在招什么。」

数据更能说明问题。LinkedIn 2023年报告显示,「提示词工程师」岗位数量同比增长5100%,但2024年Q2开始下滑23%。与此同时,「AI软件工程师」岗位持续上升,JD里 increasingly 出现一条要求:「能用传统工程方法管理AI系统。」

一位从提示词工程师转岗的开发者描述了他的日常变化:以前花4小时调一句提示词的措辞,现在花4小时写评估脚本——自动跑1000条测试用例,量化对比两个提示词版本的F1分数。「措辞玄学变成了数据科学。」

这背后是成本结构的倒逼。2024年,企业级大模型调用成本下降了70%,但调试成本上升了。提示词越复杂,「幻觉」和「边界失效」越难预测。没有工程化流程,生产环境就是定时炸弹。

软件工程的「老办法」为什么能赢

那位OpenAI工程师举了个具体例子:他们的内部系统处理用户查询时,提示词模板超过2000行。怎么管?

第一,模块化拆分。把提示词切成「意图识别」「参数提取」「安全过滤」「输出格式化」四个独立模块,每个模块有明确接口。一个模块改动,不影响其他部分。

第二,回归测试。每次模型版本更新,自动跑历史查询库,对比输出差异。差异超过阈值就报警,人工介入审查。

第三,类型约束。用Pydantic(Python数据验证库)强制限定模型输出的JSON结构,字段缺失或类型错误直接触发重试,而不是依赖模型「自觉」。「我们不相信模型会听话,我们用代码确保它必须听话。」

这些全是软件工程的基本功:抽象、测试、防御式编程。提示词没有创造新范式,只是把旧范式应用到了新载体上。

有个反直觉的发现:2024年NeurIPS(神经信息处理系统大会)上,Google Research的论文显示,用传统软件工程方法管理的提示词系统,长期维护成本比「提示词原生」方法低58%。原因是后者缺乏可观测性——你不知道为什么某个提示词昨天有效今天失效,只能从头调试。

那「提示词工程」彻底没用了吗

也不是。在特定场景下,提示词技巧仍有价值。比如创意写作、头脑风暴、一次性的探索任务——这些不需要稳定性,要的是涌现性。但企业级应用不同:医疗诊断、金融风控、代码生成,容错率接近于零。

更关键的区分在于「人机协作模式」。提示词工程假设人类是主导,模型是工具;软件工程视角下,人类设计系统,模型是系统中的一个组件。后者的抽象层级更高,也更适合规模化。

Anthropic的开发者关系负责人最近在一个播客里打了个比方:「提示词是和大模型的API协议,但协议本身需要工程化实现。你不会因为懂HTTP协议就叫自己'HTTP工程师',对吧?」

这个类比有点毒,但准确。2024年的招聘市场正在验证这一点:「提示词工程师」岗位 increasingly 要求计算机科学学位,JD里「软件工程经验」从「加分项」变成「必需项」。纯靠「语感」调提示词的人,正在被淘汰。

一位在2023年靠提示词技巧拿到高薪、2024年被裁的开发者,在Hacker News上写了条评论:「我以为我掌握了一门新技能,其实只是赶上了泡沫。现在我在学Rust,从头开始。」

当模型能力每6个月翻倍,提示词的「最佳实践」保质期可能只有18个月。但软件工程的原则——模块化、测试、可观测性——已经稳定了半个世纪。如果必须押注一个,你会选哪个?

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
菲律宾万万想不到!精心安排在"仁爱礁"的破船,却助力了中国?

菲律宾万万想不到!精心安排在"仁爱礁"的破船,却助力了中国?

易昂杨
2026-04-11 17:01:13
亚锦赛:连爆大冷世界第1凤凰组合与第2第3都出局,决赛对阵出炉

亚锦赛:连爆大冷世界第1凤凰组合与第2第3都出局,决赛对阵出炉

求球不落谛
2026-04-11 13:23:02
土葬百万奔驰后续:主事人身份曝光,父亲生前爱奔驰,已认错挖车

土葬百万奔驰后续:主事人身份曝光,父亲生前爱奔驰,已认错挖车

江山挥笔
2026-04-11 21:36:59
开药收15元挂号费引争议?卫健委明确:单纯开药别挂普通号!

开药收15元挂号费引争议?卫健委明确:单纯开药别挂普通号!

今朝牛马
2026-04-09 17:22:11
女子假信佛与多位高僧发生不当关系,秘密录制5600段视频。

女子假信佛与多位高僧发生不当关系,秘密录制5600段视频。

特约前排观众
2026-02-09 00:05:05
印度首富300斤儿子庆生,全国大象享盛宴,戴百万表看贫儿惹争议

印度首富300斤儿子庆生,全国大象享盛宴,戴百万表看贫儿惹争议

译言
2026-04-10 13:41:11
4月10日俄乌最新:万斯再开黄腔

4月10日俄乌最新:万斯再开黄腔

西楼饮月
2026-04-10 16:09:59
争议?姆巴佩被打脸+流血!主裁拒判点球 皇马官方:西甲暗箱操作

争议?姆巴佩被打脸+流血!主裁拒判点球 皇马官方:西甲暗箱操作

我爱英超
2026-04-11 06:15:26
心源性猝死的人越来越多?医生强调:宁可打打牌,建议别做这7事

心源性猝死的人越来越多?医生强调:宁可打打牌,建议别做这7事

医学原创故事会
2026-03-29 23:50:13
马克龙签涉台声明后,中方双管齐下,朱凤莲强硬发声,法国赌输了

马克龙签涉台声明后,中方双管齐下,朱凤莲强硬发声,法国赌输了

云舟史策
2026-04-11 07:31:16
首盘吞蛋决胜盘送蛋,王欣瑜2-1逆转伦纳德晋级WTA250鲁昂资格赛次轮

首盘吞蛋决胜盘送蛋,王欣瑜2-1逆转伦纳德晋级WTA250鲁昂资格赛次轮

懂球帝
2026-04-11 21:08:47
【特稿】承诺多兑现少 “和平委员会”被曝囊中羞涩

【特稿】承诺多兑现少 “和平委员会”被曝囊中羞涩

新华社
2026-04-11 15:48:19
31岁施工员:娶一个农村女孩,一天好日子也没有,但我乐意

31岁施工员:娶一个农村女孩,一天好日子也没有,但我乐意

施工员小天哥
2026-04-10 21:07:04
预告:国新办4月14日举行新闻发布会 介绍2026年一季度进出口情况

预告:国新办4月14日举行新闻发布会 介绍2026年一季度进出口情况

财联社
2026-04-10 19:23:42
印度:我们每家都有电视,中国行吗?法国:人家中国居民不用偷电

印度:我们每家都有电视,中国行吗?法国:人家中国居民不用偷电

离离言几许
2026-04-10 14:51:25
优酷肠子都悔青了!3亿砸的“S+顶流剧”,播到第9集广告商全跑光

优酷肠子都悔青了!3亿砸的“S+顶流剧”,播到第9集广告商全跑光

许三岁
2026-04-10 09:30:06
国乒用人失误!刚公布世乒赛阵容就出问题,邓亚萍却点出王皓无奈

国乒用人失误!刚公布世乒赛阵容就出问题,邓亚萍却点出王皓无奈

三十年莱斯特城球迷
2026-04-10 21:16:39
单依纯武汉演唱会造型狂野的不忍直视!脚上那双鞋子起码有20厘米

单依纯武汉演唱会造型狂野的不忍直视!脚上那双鞋子起码有20厘米

小娱乐悠悠
2026-04-11 11:07:54
苹果高管晒娃照片,开发者集体盯上键盘数字

苹果高管晒娃照片,开发者集体盯上键盘数字

报错免疫体
2026-04-11 08:42:53
印度向中国释放求援信号,希望11天内尽快给答复,别耽误他们进度

印度向中国释放求援信号,希望11天内尽快给答复,别耽误他们进度

老鹈爱说事
2026-04-11 15:21:19
2026-04-11 22:24:49
薛定谔的BUG
薛定谔的BUG
有态度网友ytd
1184文章数 32关注度
往期回顾 全部

科技要闻

半夜被燃烧瓶砸醒,OpenAI CEO发文反思

头条要闻

特朗普:美方开始清理霍尔木兹海峡

头条要闻

特朗普:美方开始清理霍尔木兹海峡

体育要闻

换帅之后,他们从降级区冲到升级区

娱乐要闻

郑钧回应儿子走路:会监督他挺直腰板

财经要闻

从日本翻身看:这次谁能扛住高油价?

汽车要闻

焕新极氪007/007GT上市 限时19.39万起

态度原创

本地
时尚
房产
公开课
军事航空

本地新闻

12吨巧克力有难,全网化身超级侦探添乱

普通人穿衣其实很简单!构造腰线、一衣多穿,大方舒适又自然

房产要闻

土地供应突然暴跌!2026海口楼市,格局大变!

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

伊朗议长带四名遇难儿童照片赴美伊谈判

无障碍浏览 进入关怀版