网易首页 > 网易号 > 正文 申请入驻

歸藏:从 Prompt 到 Harness,上下文就是一切

0
分享至

我们发起「」时,想支持的,是在 AI 时代涌现出的新一代创业者和创造者。

歸藏就是这群人的一个缩影。

他原本是一位 UI/UX 设计师,从 ChatGPT 问世起就不断写出神级提示词,有人说他几乎「养活了半个 AI 自媒体圈」。最近几个月,他开始尝试 vibe coding,做出了 CodePilot。这个项目最初只是「给 Claude 命令行做一个 UI」的想法,最终却演变成一片关于 Harness、上下文和 AI Native 产品形态的实验田。

真正驱动这一切的,不是传统意义上的编程能力,而是对问题的理解、对产品的判断,以及持续调动 AI 完成复杂任务的能力。他把 10 年经验都写进了 skill。

Token Grant 想支持的正是这些站在变化之处的人。

我们希望它成为你起跑时的推力: 如果你已经在用 AI 构建新的工具、产品或组织,不必等到万事俱备。

先做出来,先发布,先让用户找到你,先让世界给你反馈。

然后,让未来自己长出来。

真格投资合伙人 Koji


从 Prompt 到 Harness

Q:请介绍一下你自己以及现在做的事。

歸藏:我之前是一位 UI/UX 设计师,最近几个月开始 vibe coding,做了一个产品叫 CodePilot。


Q:Harness Engineering 带来最大的变化是什么?作为一个很会写 prompt 的人,你觉得现在还有优势吗?

歸藏:Prompt 的核心不是提示词,是其中蕴含的一整套解决问题的思路和思维模式。

如果你真的是会写提示词的人,Harness 反倒会把你的上限提高很多。以前你只能在一个非常有限的上下文和长度里规划任务,但现在你有了一整套工具,包括 memory、skill、CLI、MCP。

你的代码、图像,甚至不同模态的提示词,都可以被组合进一整套工作流里。你的提示词会变得更长、更通用,上限也更高。

Q:在上限提高之后,你觉得最重要的能力会是什么?

歸藏:第一是主观能动性,第二是学习能力,第三是品位。

这不一定是某一类的品位,而是你在当前行业里的独特经验,是你过去学习、工作、内容消费沉淀在身体里的那套审美和判断。

每个人的上下文都不一样。

Q:当时是什么契机让你来申请 Token Grant?整个流程里,有没有什么特别打动你的瞬间?

歸藏:海辛(实验电影人、AIGC 艺术家)转给我一个表单,我点进去一看就觉得:「呀,这个东西好。」

我很好奇真格资助 agent 的理念是什么,于是就填了申请。

最打动我的是整个流程特别精简。我觉得这代表了一种信任和尊重。我最怕复杂流程和各种约束,但这次体验下来完全没有,所以我最近一直在疯狂跟开发者朋友们安利 Token Grant。


Token 是虚拟世界的原料

Q:拿到 Token Grant 之后,你做第一件事是什么?

歸藏:充 Token,再买两个号。

Q:对于你来说,Token 像是什么东西?

歸藏:Token 就是虚拟世界里 3D 打印机的原料。3D 打印最常用的就是 PLA。它是通用的,但最后打印出来的东西都不一样。

Q:你今天花了多少 Token?

歸藏:我今天早上起来一直在忙物理世界的事情。我最多的一个月花了 7600 万 Token。很多人都在说「1 亿 Token 俱乐部」,但我发现我的产出很高,Token 消耗量却不算多。很多人消耗大,是因为会并发使用 Token,开好几个 worktree 或 agent teams,但我把握不住,我审核不过来。

Q:最近一次觉得「这个 TOKEN 花得特别值」是什么时候?

歸藏:我现在所有精力都在维护一个项目。

它整体 TOKEN 消耗没有多夸张,但产出非常可怕。我拉了个数据,现在这个项目累计已经写了超过 30 万行代码,来来回回删减之后,项目里还保留着 11 万行代码。

还有一个是最近在玩 Claude Buddy。我给它写了一个硬件固件,是一个墨水屏。我第一次发现,做 AI 硬件的成本已经低到了这种程度。



另外还有一个特别重要的是产品思考。

我把它通过 USB 插到 Mac 上,然后告诉 Claude Code:「这里有个官方项目,但我的设备跟它不一样,我现在用的是这个设备,你帮我改一下。」结果它一个小时就帮我做出了一个完整的固件。

它不是普通软件,是一个完整系统。整个设备只为这一件事服务。

这件事对我影响特别大。以前我根本不想碰硬件,学校里也学过面包板、Arduino,过程特别痛苦,因为它的代码逻辑跟普通开发完全不一样。现在不管了,直接怼上去就完事了。

搞完这个之后,我又买了一堆别的硬件,想继续试试看。

Q:如果有一天有了无限 TOKEN,你会做什么?

歸藏:现在限制我的不是 Token 了,而是我自己。

对我来说,Token 其实已经接近无限了,因为我根本消费不完。在有限的 24 小时里,我还得吃饭、睡觉、维持正常生活。

但 Token 的质量可以提高。

我之前拉过一个统计,我到现在已经有几百个 commit 了,其中 47% 都是 fix。

所以核心问题不是 Token 的量,是单位 Token 能解决多少问题。就像现在 47% 的 commit 都在修 bug,如果未来这个比例降到 20%,剩下 27% 就会变成功能增量,让我构建更多东西。


Q:你现在一天的生活是什么状态?

歸藏:我现在的生活大概分成几个部分。

早上起来第一件事是开发,写 CodePilot。每晚睡觉前,我都会给 Codex 和 Claude Code 布置定时任务,让它们从凌晨 5 点开始工作。这样我起床之后,就能直接拿到一个版本去测试和审核。

第二部分是内容和信息消费。我的 skills 会自动爬取我常看的一些 newsletter、网站和邮件,也会结合我的日程做提醒、生成报告。我自己也会刷 X。

再往后就是内容发布。短的内容,我一般直接语音输入,因为它自带润色。长的内容,我会交给 AI。我有一整套内容生产流程会自动跑完,我只需要完成第一步:给上下文定调。

我一整天都在这个循环里。

很多人觉得做这些都不睡觉,但我睡觉很正常,一般 1 点就睡了,下午还会去健身。正常生活还是能保证的。AI 解放了很多时间,但同时你也会去做更多事情。


一个小时,产品的第一版

Q:当时是哪个具体瞬间让你意识到要做 CodePilot?

歸藏:我跟很多人讲过这个故事。

我现在这个项目最开始的文件夹名字叫「Opus 4.6 test」。

我一直觉得 Claude 命令行有一个很烦的问题,就是看不到聊天历史记录。但聊天历史是很重要的资产。虽然能调出来,但过程特别复杂,看着也不爽。所以我当时就想:那我给它做个 UI 吧。

刚好那时候 Opus 4.6 发了,我就想试试看,给它一个特别大、特别难搞、但又要求很稳的任务。结果它一个小时就给我做出了第一版,且第一版已经非常可用了。

后来我就把它发出来了。发出去之后,很多人说特别需要这个东西。我就把它简单打了个包发给大家用。结果用着用着,大家成了你的用户,你没法不继续做下去了。很多人会在 GitHub 提 issue、提 PR,然后你就会被用户推着往前走。

卷着卷着,你自己也开始想做更多。

我自己的想法是把它当成一个 Harness 的实验田。因为做 Harness 不只是把一些能力暴露出来而已。你研究越深,就越会发现:上下文控制才是最核心的东西。

Q:你现在怎么理解 Harness ?

歸藏:我觉得它就是整套 agent 本身。这个定义现在已经跟 AGI 一样,被无限泛化了。

我们今天想到的所有东西,比如提示词、skills、MCP、CRM,这些都是 Harness 的一部分。它们最后都会汇聚成 context,再传给模型。

它本质上是一整套流程。如果从模型往外倒着看,第一层是 context,也就是上下文的组织和管理。再往外,就是各种组件:工具调用、function call、MCP、scale、CRM、memory……这些全部都属于 Harness。

某种意义上,模型之外的一切都算 Harness。


对大多数人来说,只要你愿意花钱,一个月买 200 块的 Max,Token 就已经接近无限了。

Q:你在迭代的过程有什么感受?

歸藏:我现在慢慢迭代出了一套自己的方法。

因为我之前没用 Vibe coding 写过这么大的项目,所以现在整个开发流程已经变成了文档驱动。所有东西都是文档,整个 Harness 也是靠文档来完成的。

其中有三个最核心的文档:Claude Code 文档、目录路由文档,还有护栏文件。

Claude Code 文档本质上就是 AI 的宪法:什么绝对不能做,什么绝对必须做。

目录文档包含整个项目里所有文档的入口和结构。

护栏文件则要保护两个东西:一个是上下文,另一个是接口。我是一个多服务商的平台,会接各种 code plan。一旦这里坏掉,用户整个软件都没法用,这属于 P0 级问题。其它 bug 都不算 bug。

我现在基本不用 code 自带的计划模式,我觉得那个很弱。我大约 70% 的时间都花在调研上。我会不断和 AI 讨论技术方案、反复审核计划文档,再让它按文档执行。你计划得越细,后面出问题的概率就越小。

这样它才能长时间、连续地完成任务。

一个任务拆成 10 个 pass,它一晚上就能全部做完,还会自动调用 MCP、跑测试、做 smoke test。


另外还有一个特别重要的是产品思考。

因为你做的东西不是给机器用的,是给人用的。Vibe coding 最终是产品,不只是代码。你要不断思考:这个功能对用户意味着什么?产品层面应该怎么设计?未来会怎么演化?

AI 不知道很多东西。

第一,它不了解用户真实的运行环境。AI 默认世界上只有 macOS。如果你做多端产品,它最后一定会把 Windows 忘掉。

第二,它缺乏特定领域的知识。对于没见过、已经过时的事实性信息,它非常容易出错。就像它以为 Anthropic 只更新到了 Opus 4.0,实际上都 4.7 了。

最可怕的不是它不知道,是它以为自己知道,但知道的是过时信息。而过时的信息,本质上就是错误信息。

最后一个问题是决策。AI 不知道什么东西是好的,也不知道你真正想要什么。长期磨合之后,通过 memory 和文档,它会慢慢对你的偏好产生感知。但遇到一些全新的、你从来没做过决策的事情时,它还是不解。

Q:你怎么帮他判断就是什么好,什么不好?

歸藏:我自己判断。它只需要给我足够的信息就行。

我自己其实不写代码,一行都没写,到现在整个软件我一行代码都没碰过。我也不懂代码,最多懂点 HTML、CSS,但现在这些也不用我碰。

遇到我不懂的,它会给我讲。我懂,我就自己做判断。

Q:不管是你之前写提示词,还是现在跟 AI 一起写代码,很重要的一环都是调研,把知识沉淀下来。

歸藏:我之前对外分享的时候,经常有人问我什么最重要。我说得最多的一句话是:上下文就是一切。

对于使用者来说,你要给 agent 准备足够精准、足够丰富的上下文;对于开发者来说,你 agent 里最核心的组件也是上下文。

上下文都是一切。


一个人能做的事没有上限

Q:你理想中的 AI Native 产品应该是什么样?

歸藏:我昨天参加了一个会,大家一直在聊产品。但我后来觉得,有一个东西比产品本身更重要:组织。

以前我没有意识到这个事,因为我一直是单打独斗。但后来我发现,当一个组织本身是 AI Native 的时候,它产出的东西天然就会是 AI Native 产品。

看组织有时候比看产品更精准。

因为「产品」这个词现在已经被泛化了。比如你说 Notion,它最开始肯定不是按 AI Native 去设计的,但它现在几乎所有地方都在加 AI。你宽泛一点说,它也算 AI Native,但严格一点又不算。

但如果一个公司本身就是 AI Native 的,即便它产出的产品跟 AI 一点关系都没有,里面没有任何 AI 功能,我觉得它依然算 AI Native。

Q:OPC 组织层面最大的挑战会是什么?

歸藏:最大的挑战还是跟物理世界接触。

作为公司、主体、自然人,你始终要跟这个世界交互,要建立信任。公司的财税、身份认证,这些其实才是最核心的挑战,也是 AI 短期解决不了的部分。

但我觉得今天,一个人能做到的事情已经没有上限了。

像我一个人 70 天写了几十万行代码,同时还作为自媒体一个人更新 9 个平台,而且都在持续更新。这在以前是完全不可能做到的。

现在 TOKEN 对我们来说已经接近无限了。但当生产力上来后,真正重要的东西就变了。


Q:如果 CodePilot 只留下一种功能,会是什么?

歸藏:聊天输入框,再加一个语音按钮。

Q:为什么?

歸藏:因为 agent 产品最后都可以被砍成这样。这是最自然的形态。我自己也是这么工作的。

所有东西都从上下文来,最后也要回到聊天框去。

AI 可以感知一切上下文,产品里的所有东西理论上它都能感知。只要它能感知,它就可以自己改、自己迭代、自升级。

坏了以后,它甚至还能自己修。

Q:有什么是你希望 AI 可以做,但现在还做不到的?

歸藏:是我们的互联网基建限制了 AI。

即便像 Vercel 这种已经算最简单的工具了,它里面依然有很多复杂部分,服务器配置还是繁琐。且它本身也不是 AI Native。

我们真正需要的是 AI Native 的基础设施。

我之前分享过一句话:AI 的能力等于你给它提供的工具。

Q:你预期一年之后自己会有什么变化?

歸藏:我希望 AI 能替我做更多事情,让我有更多时间去线下做一些事。

我觉得 AI 这两年一定会大规模转向物理世界。

我过年的时候写过一篇文章。当时很多人都觉得,AI 改变物理世界的形态会是机器人。但我一直觉得,最先真正落地 AI 的一定是汽车。

因为车本身就有电池、有轮子,移动速度比机器人更快,想去哪就去哪。

现在很多电车已经像 AI 的物理载体了。它是多卡并发网络,跟一个超强 Wi-Fi 一样稳定。它还有很大的电池、空间,车里的屏幕可以直接当副屏。

现在 OPC 越来越多,整个组织形态也在慢慢解体。如果再跟 AI、跟新的工作方式结合,我觉得这里面的未来想象空间特别大。

还有一个让我很震撼的是硬件。

做了替代 Claude Buddy 的墨水屏设备后,我发现中国的硬件生态非常厉害。有个设备才 500 块,还有更小的是 200 块钱,里面带麦克风、全键盘、蓝牙、Wi-Fi、声音、摄像头,还能自己跑 Linux 系统。

你完全可以在里面装一个 agent,挂在背包上,让它实时跟你的手机交互。

这些东西现在人人都能做。200 块钱,一根 USB 线插上就能开始。

大部分技术已经齐备了。很多事情发生会比大家想象得更快。


智能又往前迈了一步

Q:让你印象最深的一次发布是什么?

歸藏:还是 ChatGPT。

如果你跟得足够久,后面多少都是有预期的。但 GPT 当时是完全没有预期,它带来的震撼是最大的。

接下来一个是 Sora,再往后是 NanoBanana。所有让我感觉到「智能」本身在提升的东西,都会让我特别震撼。

我觉得它真正重要的不是美学,是智能本身。它又往前迈了一步。

Q:你还记得第一次跟 NanoBanana 交互的场景吗?

歸藏:我第一次让 NanoBanana 去处理一些需要推理的信息,看它把排版展示在图片上的时候,非常惊喜。那个瞬间我就意识到,我们整个多模态的新时代要来了。

Q:CodePilot 让你最意料之外的是什么?

歸藏:我健身教练给我印象很深。

我每次健身中间休息的时候都会跟他闲聊,也会聊 AI。他原来一直自称「电脑白痴」,复制粘贴都不太会,甚至分不清 macOS 和 Windows。

但有一天我练完之后,顺手给他装了一个 CodePilot。

结果过了两天,他特别兴奋地跑来跟我说,他做出了一个自己一直想做的东西。

他干这行十年,从来没请过假,但那段时间天天请年假。

仅仅一个月,他就从一个完全的小白,快速完成了很多原本像是计算机专业四年才会积累下来的基础能力。后来我跟他说很多东西,他都能接得上。他自己做了很多 skills,甚至还开发了一个软件。

Q:你觉得一个产品做到什么程度就可以发布了?

歸藏:现在 X 上有很多产品构建的方法分享。

在你开始做第一版,甚至还没开始写第一行代码的时候,你就应该发布它。

当你起心动念的时候,就应该先发出来,然后不断迭代、不断获取反馈。

不用担心没人看,你的用户会自己找到你。等你第一个版本真正上线的时候,你可能已经积累了一批用户了。

最重要的是避免陷入完美主义。

尤其是设计师,我们这个群体天然会特别在意品质、特别想精益求精。我不是说完美主义有问题,只是在 AI 时代做产品,快速迭代、快速曝光非常重要。

Q:给那些还在申请 Token Grant 的开发者一句话,你会说什么?

歸藏:上下文就是一切。




特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
曹操撩寡妇时说的金句,如今成了约会开场白,男人经常挂在嘴边

曹操撩寡妇时说的金句,如今成了约会开场白,男人经常挂在嘴边

掠影后有感
2026-05-11 11:31:38
万万没想到,苏林去跟莫迪见了一面,竟把印度的祸水引进了南海!

万万没想到,苏林去跟莫迪见了一面,竟把印度的祸水引进了南海!

梦史
2026-05-13 04:58:32
男子2天内嫖娼2次被行拘

男子2天内嫖娼2次被行拘

观威海
2026-05-12 10:47:08
方腊仅有8员大将,为何却让梁山损失了70名好汉?原因很简单

方腊仅有8员大将,为何却让梁山损失了70名好汉?原因很简单

掠影后有感
2026-05-11 11:28:59
1987年,马季宴请冯巩等几位徒弟,这一桌菜,可不便宜

1987年,马季宴请冯巩等几位徒弟,这一桌菜,可不便宜

喜文多见01
2026-05-12 10:54:13
广州中考名额分配详细结果出炉:谁家拿到9个二中名额?

广州中考名额分配详细结果出炉:谁家拿到9个二中名额?

南方都市报
2026-05-12 19:06:26
申花签下马莱加三年长约,锋线补强球迷期待新赛季

申花签下马莱加三年长约,锋线补强球迷期待新赛季

漫川舟船
2026-05-13 00:16:35
刚刚,四川突发地震!

刚刚,四川突发地震!

吉刻新闻
2026-05-12 21:53:03
“可偏转弹丸!中国研发出鳄鱼结构装甲”

“可偏转弹丸!中国研发出鳄鱼结构装甲”

观察者网
2026-05-12 14:04:05
磷化铟热度退潮!AI算力又一刚需新材料,刚被资金盯上

磷化铟热度退潮!AI算力又一刚需新材料,刚被资金盯上

侃故事的阿庆
2026-05-12 18:33:56
血赚!曼联力压切尔西捡漏顶级中卫,3650 万水货离队倒计时

血赚!曼联力压切尔西捡漏顶级中卫,3650 万水货离队倒计时

澜归序
2026-05-13 04:38:16
《放羊的星星》男演员李威卷入精舍杀人案,被判1年10个月有期徒刑,缓刑5年

《放羊的星星》男演员李威卷入精舍杀人案,被判1年10个月有期徒刑,缓刑5年

蓬勃新闻
2026-05-12 13:02:22
女学霸发明“咯噔字体”,老师低分警告:别用个性挑战考试底线

女学霸发明“咯噔字体”,老师低分警告:别用个性挑战考试底线

蝴蝶花雨话教育
2026-05-07 00:05:04
我故意在家里跑两套Wi-Fi,不只是为了安全

我故意在家里跑两套Wi-Fi,不只是为了安全

我是一个养虾人
2026-05-12 07:36:25
48岁欧阳夏丹现状:离开央视,被教授邀请现身挪威,至今未婚未育

48岁欧阳夏丹现状:离开央视,被教授邀请现身挪威,至今未婚未育

白面书誏
2026-05-07 17:50:08
没有外援就拔刀相向?神权杖硬刚枪杆子,塔利班进入内斗阶段!

没有外援就拔刀相向?神权杖硬刚枪杆子,塔利班进入内斗阶段!

寰球经纬所
2026-05-10 10:55:10
41岁C罗获评6.4分:拼尽全力,目睹球队遭绝平,无缘率队提前夺冠

41岁C罗获评6.4分:拼尽全力,目睹球队遭绝平,无缘率队提前夺冠

侧身凌空斩
2026-05-13 04:13:15
5-5,2-0!亚洲杯悲喜夜!沙特日本出线,8强诞生6席:国足晋级!

5-5,2-0!亚洲杯悲喜夜!沙特日本出线,8强诞生6席:国足晋级!

小徐讲八卦
2026-05-13 06:35:16
41:0全票通过!欧盟突然对华重磅表态,中方直接正面回应

41:0全票通过!欧盟突然对华重磅表态,中方直接正面回应

标体
2026-05-13 03:09:00
169.7万!民政部一纸数据震动全国,比战争更可怕的警报正在拉响

169.7万!民政部一纸数据震动全国,比战争更可怕的警报正在拉响

青梅侃史啊
2026-05-12 09:59:53
2026-05-13 07:52:49
真格基金 incentive-icons
真格基金
创业,来真格的。
1550文章数 3671关注度
往期回顾 全部

科技要闻

谷歌剧透安卓重大升级 Gemini深度集成底层

头条要闻

凯文·沃什出任美联储主席 其岳父是特朗普总统的老友

头条要闻

凯文·沃什出任美联储主席 其岳父是特朗普总统的老友

体育要闻

骑士终于玩明白了?

娱乐要闻

白鹿风波升级!掉粉20万评论区沦陷

财经要闻

利润再腰斩 京东干外卖后就没过过好日子

汽车要闻

吉利银河“TT”申报图曝光 电动尾翼+激光雷达

态度原创

家居
房产
数码
游戏
手机

家居要闻

极简主义下的居住场域与空间

房产要闻

穗八条引爆楼市!万博宝藏红盘,五一劲销出圈

数码要闻

首发883.15元!小米路由器BE7200 Pro开售:全2.5GE网口 家里网关都省了

曝PS6或将被迫缩减内存规格 以应对零部件涨价

手机要闻

谷歌安卓17新增系统验证功能:Pixel手机首发,识别恶意仿冒系统

无障碍浏览 进入关怀版