22小时。这是作者用AI工作流每周省下的时间。但比数字更值得看的是:他扔掉了什么。
提示词(prompt)这东西,有点像你手机里的备忘录——写的时候觉得每个都重要,回头看一大半是垃圾。区别在于,没人愿意把自己的提示词公开。作者打了个比方:这就像给人看你的购物清单,或者你思考问题的具体路径。既暴露隐私,又可能泄露竞争力。
但他还是全抖出来了。用了18个月,每天迭代,最后剩下5个每天在跑的,3个彻底废弃的,以及废弃的原因。
先搞清楚:好提示词的标准是什么
直接复制别人的提示词,就像照搬别人的健身计划却不知道每个动作练哪块肌肉。作者的原则很直接:提示词本身不是优势,设计提示词的思维方式才是。
他花了18个月才明白这一点。前期疯狂收集提示词,以为找到"完美咒语"就能一劳永逸。后来意识到,每个提示词都是特定问题的临时解,问题变了,提示词就得跟着变。
他淘汰提示词的标准有三条:输出质量不稳定、维护成本太高、或者AI能力进化后原提示词反而成了累赘。
这三条标准帮他筛掉了至少十几套早期提示词。有些在当时很惊艳,现在看纯属过度工程。
他每天运行的5个提示词
作者没把提示词原文贴出来——这符合他的逻辑,直接复制没用。但他详细描述了每个提示词的功能边界和设计思路。
第一个用于晨间信息筛选。不是简单的"总结邮件",而是设定了一个具体标准:只保留需要他在24小时内做出决策的事项。其他全部归档。这个标准是他迭代了7版后才固定下来的,早期版本会漏掉紧急但不重要的,或者抓住重要但不紧急的。
第二个处理会议准备。输入是会议议程和参会人背景,输出不是长篇大论,而是三个具体问题。作者发现,准备三个好问题比准备十页笔记更有用——这其实是他自己开会风格的延伸,AI只是加速了这个过程。
第三个用于写作草稿。他特别强调这不是"让AI写文章",而是"让AI把他说不清楚的话先胡乱说出来"。关键设计是:输出必须包含至少一个他明确反对的观点。这逼着他快速定位自己的真实立场。
第四个做决策记录。每次重要决定后,输入当时的考虑因素和最终选择,输出是一个结构化日志。作者的原话是:「不是为了复盘对错,是为了下次遇到类似情况时,能调出当时的脑回路。」
第五个最特殊:每周运行一次的"提示词审计"。检查其他四个提示词的输出质量,标记需要调整的地方。这是他从软件测试里借来的概念——没有持续测试的代码会腐烂,提示词也一样。
被他扔进垃圾桶的3个
作者对废弃提示词的描述比保留的更详细。这符合产品经理的直觉:失败案例比成功案例更能说明问题。
第一个是"深度研究助手"。设计目标是让AI自动检索资料并生成报告。废弃原因很具体:幻觉率(hallucination rate,即AI编造信息的概率)在涉及具体数据时高到无法容忍,而验证成本超过了手动检索。他尝试过加验证层,但提示词复杂度爆炸,维护时间省下来的研究时间又还回去了。
第二个是"邮件自动回复"。听起来很美好,实际废弃得最快。作者发现,任何需要他签名的沟通,AI代写的语气要么过于正式显得假,要么过于随意显得轻慢。更麻烦的是,收件人回复后,他得花额外精力理解"自己"之前说了什么。省下的5分钟,换来了20分钟的上下文重建。
第三个最可惜:"创意发散器"。早期版本确实帮他突破过思路瓶颈,但用了4个月后,他发现自己的创意输出开始呈现某种固定模式——正是那个提示词的输出结构。换句话说,工具反过来塑造了思维。他果断停用,花了两周才找回原来的思考节奏。
提示词设计的真正门槛
作者反复强调一个反直觉的点:提示词工程(prompt engineering)的难点不是技术,是自我认知。
你得先搞清楚自己到底要什么,才能把"要什么"翻译成AI能执行的指令。很多人跳过这一步,直接抄提示词,结果就像穿别人的定制西装——尺寸对了,版型别扭。
他举了个具体例子。那个晨间筛选提示词,早期版本写的是"总结我的邮件",输出总是太长或太薄。改成"识别需要24小时内决策的事项"后,质量立刻稳定。区别不在于提示词技巧,在于他终于想清楚了:早上看邮件的真正目的不是了解信息,是确定当天必须处理什么。
这个认知转变花了三周。期间他每天早上手动分类邮件,记录自己的判断标准,最后才把标准写进提示词。
另一个关键认知:提示词和AI能力是动态博弈的。GPT-4刚出时,他需要很复杂的提示词才能获得稳定输出;现在同样的任务,简单指令就够了。反过来,有些早期能用的技巧,现在反而触发新的限制。
作者的原话:「我的提示词库每三个月大清洗一次。不是喜新厌旧,是AI在进化,我的用法必须跟着进化。」
对读者的具体建议
作者没有给通用模板,但给了三个可操作的检验标准。
第一,运行一周后,能否不看原始提示词,准确复述它的筛选逻辑?如果不能,说明提示词里的标准不是你的真实标准,是抄来的。
第二,输出是否需要大量后期编辑?如果需要,提示词要么目标不清,要么AI当前能力确实够不到,考虑降级或放弃。
第三,停用一周后,是否想念它?这个情感指标 surprisingly 有效。真正嵌入工作流的工具,停用会有明显摩擦感;可有可无的工具,停用后你会发现自己根本没注意到。
作者最后提到,他现在的5个提示词,有3个是过去两个月才定型的。那个"提示词审计"本身就是今年才加的——之前没有这个机制,提示词腐烂了都不知道。
所以22小时周节省是结果,不是起点。起点是接受一个事实:提示词需要持续维护,没有一劳永逸的"完美咒语"。
你现在的提示词库里,有几个能通过那个"停用一周"测试?
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.