18个月迭代后，这个产品经理每天只留5个提示词，3个被扔进垃圾桶|词库|翻译|工作流|电子表格

18个月迭代后，这个产品经理每天只留5个提示词，3个被扔进垃圾桶

2026-04-14 13:34:42　来源: 摸鱼算法

北京举报

分享至

22小时。这是作者用AI工作流每周省下的时间。但比数字更值得看的是：他扔掉了什么。

提示词（prompt）这东西，有点像你手机里的备忘录——写的时候觉得每个都重要，回头看一大半是垃圾。区别在于，没人愿意把自己的提示词公开。作者打了个比方：这就像给人看你的购物清单，或者你思考问题的具体路径。既暴露隐私，又可能泄露竞争力。

但他还是全抖出来了。用了18个月，每天迭代，最后剩下5个每天在跑的，3个彻底废弃的，以及废弃的原因。

先搞清楚：好提示词的标准是什么

直接复制别人的提示词，就像照搬别人的健身计划却不知道每个动作练哪块肌肉。作者的原则很直接：提示词本身不是优势，设计提示词的思维方式才是。

他花了18个月才明白这一点。前期疯狂收集提示词，以为找到"完美咒语"就能一劳永逸。后来意识到，每个提示词都是特定问题的临时解，问题变了，提示词就得跟着变。

他淘汰提示词的标准有三条：输出质量不稳定、维护成本太高、或者AI能力进化后原提示词反而成了累赘。

这三条标准帮他筛掉了至少十几套早期提示词。有些在当时很惊艳，现在看纯属过度工程。

他每天运行的5个提示词

作者没把提示词原文贴出来——这符合他的逻辑，直接复制没用。但他详细描述了每个提示词的功能边界和设计思路。

第一个用于晨间信息筛选。不是简单的"总结邮件"，而是设定了一个具体标准：只保留需要他在24小时内做出决策的事项。其他全部归档。这个标准是他迭代了7版后才固定下来的，早期版本会漏掉紧急但不重要的，或者抓住重要但不紧急的。

第二个处理会议准备。输入是会议议程和参会人背景，输出不是长篇大论，而是三个具体问题。作者发现，准备三个好问题比准备十页笔记更有用——这其实是他自己开会风格的延伸，AI只是加速了这个过程。

第三个用于写作草稿。他特别强调这不是"让AI写文章"，而是"让AI把他说不清楚的话先胡乱说出来"。关键设计是：输出必须包含至少一个他明确反对的观点。这逼着他快速定位自己的真实立场。

第四个做决策记录。每次重要决定后，输入当时的考虑因素和最终选择，输出是一个结构化日志。作者的原话是：「不是为了复盘对错，是为了下次遇到类似情况时，能调出当时的脑回路。」

第五个最特殊：每周运行一次的"提示词审计"。检查其他四个提示词的输出质量，标记需要调整的地方。这是他从软件测试里借来的概念——没有持续测试的代码会腐烂，提示词也一样。

被他扔进垃圾桶的3个

作者对废弃提示词的描述比保留的更详细。这符合产品经理的直觉：失败案例比成功案例更能说明问题。

第一个是"深度研究助手"。设计目标是让AI自动检索资料并生成报告。废弃原因很具体：幻觉率（hallucination rate，即AI编造信息的概率）在涉及具体数据时高到无法容忍，而验证成本超过了手动检索。他尝试过加验证层，但提示词复杂度爆炸，维护时间省下来的研究时间又还回去了。

第二个是"邮件自动回复"。听起来很美好，实际废弃得最快。作者发现，任何需要他签名的沟通，AI代写的语气要么过于正式显得假，要么过于随意显得轻慢。更麻烦的是，收件人回复后，他得花额外精力理解"自己"之前说了什么。省下的5分钟，换来了20分钟的上下文重建。

第三个最可惜："创意发散器"。早期版本确实帮他突破过思路瓶颈，但用了4个月后，他发现自己的创意输出开始呈现某种固定模式——正是那个提示词的输出结构。换句话说，工具反过来塑造了思维。他果断停用，花了两周才找回原来的思考节奏。

提示词设计的真正门槛

作者反复强调一个反直觉的点：提示词工程（prompt engineering）的难点不是技术，是自我认知。

你得先搞清楚自己到底要什么，才能把"要什么"翻译成AI能执行的指令。很多人跳过这一步，直接抄提示词，结果就像穿别人的定制西装——尺寸对了，版型别扭。

他举了个具体例子。那个晨间筛选提示词，早期版本写的是"总结我的邮件"，输出总是太长或太薄。改成"识别需要24小时内决策的事项"后，质量立刻稳定。区别不在于提示词技巧，在于他终于想清楚了：早上看邮件的真正目的不是了解信息，是确定当天必须处理什么。

这个认知转变花了三周。期间他每天早上手动分类邮件，记录自己的判断标准，最后才把标准写进提示词。

另一个关键认知：提示词和AI能力是动态博弈的。GPT-4刚出时，他需要很复杂的提示词才能获得稳定输出；现在同样的任务，简单指令就够了。反过来，有些早期能用的技巧，现在反而触发新的限制。

作者的原话：「我的提示词库每三个月大清洗一次。不是喜新厌旧，是AI在进化，我的用法必须跟着进化。」

对读者的具体建议

作者没有给通用模板，但给了三个可操作的检验标准。

第一，运行一周后，能否不看原始提示词，准确复述它的筛选逻辑？如果不能，说明提示词里的标准不是你的真实标准，是抄来的。

第二，输出是否需要大量后期编辑？如果需要，提示词要么目标不清，要么AI当前能力确实够不到，考虑降级或放弃。

第三，停用一周后，是否想念它？这个情感指标 surprisingly 有效。真正嵌入工作流的工具，停用会有明显摩擦感；可有可无的工具，停用后你会发现自己根本没注意到。

作者最后提到，他现在的5个提示词，有3个是过去两个月才定型的。那个"提示词审计"本身就是今年才加的——之前没有这个机制，提示词腐烂了都不知道。

所以22小时周节省是结果，不是起点。起点是接受一个事实：提示词需要持续维护，没有一劳永逸的"完美咒语"。

你现在的提示词库里，有几个能通过那个"停用一周"测试？

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

手机 / 数码

房产 / 家居

18个月迭代后，这个产品经理每天只留5个提示词，3个被扔进垃圾桶

先搞清楚：好提示词的标准是什么

他每天运行的5个提示词

被他扔进垃圾桶的3个

提示词设计的真正门槛

对读者的具体建议

小鹏最贵SUV预售39.98万！L4架构3000TOPS算力

欧洲100万人请愿要求制裁以色列 以总理:欧洲道德软弱

欧洲100万人请愿要求制裁以色列 以总理:欧洲道德软弱

三球准绝杀戴大金链：轰30+10自我救赎

谢娜现身环球影城，牵手女儿温馨有爱

业绩失速的Lululemon:"健康"人设崩塌?

空间丝毫不用妥协 小鹏GX首发评测

态度原创

重磅调规！341亩商改住+中小学用地！宝龙城这把稳了？

骁龙8 Elite Gen6曝光！台积电2nm+2+3+3架构，小米18系列稳了

12吨巧克力有难，全网化身超级侦探添乱

天才！修车模拟器撞档《地平线6》：赛完车去修车

欧洲100万人请愿要求制裁以色列以总理:欧洲道德软弱

欧洲100万人请愿要求制裁以色列以总理:欧洲道德软弱

空间丝毫不用妥协小鹏GX首发评测