创业者闭门探讨：Make for Agent ，其实还是 Make for Human|断点|调用|上下文|agent

分享至

本文作者「马多灵」，极客公园资深研究员。「Make for Agent」主题闭门 Meetup 的主持人。

上周六，我们组织了一场闭门 Meetup，主题是：Make for Agent 的产品应该怎么做？面向一线的 Agent 创业者和 Builders。

原本规划的议题是以「Agent IM → Agent 协作 / Workspace → Agent Habitat」，但在实际交流中，我们发现，大家关于第一层 Agent IM 的探讨花费了大部分的时间。这也传递出了当下 Agent 创业中一个非常实际的信号：当前业内做 agent 产品的真实卡点并不在一些远大的前景上，反而在离人最近的入口、身份、权限、上下文和控制感。

甚至，连「产品的用户不再是人」这个说法也需要打个问号。核心变化可能不再是当用户从 Human 变成了 Agent，而是 Human-AI 协作中的「责任链」被重新拆开了。

印象最深的，是来自现场的一位创业者感慨：「四五月份其实挺无聊的，因为大家太共识了。但今天交流发现，大家其实没什么共识，只有宏观上共识，在微观上差异很大。」

宏观共识太便宜了，大家都同意工作流会变、个人会被放大。都对，但没什么用。有价值的，其实是这场交流中的一些微观分歧：

Agent 到底要不要 IM？
人类到底管目标、过程还是结果？
Agent 是否应该拥有持续身份？
企业客户买的是效率，还是管控？
什么任务应该用 App，什么任务才值得上 Agent？
Agent 之间通信时，传的是消息、意图、状态，还是责任？
当 Agent 出错时，是用户负责、产品负责、模型负责，还是组织负责？

以下，是这次闭门交流中的部分精华内容。希望能抛砖引玉，给大家带来一些新的思考。

⬆️关注 Founder Park，最及时最干货的创业分享

Meetup是「AI 产品市集」的线下延伸活动，每期聚焦一个垂直赛道，邀请一线创业者、资深从业者与核心用户，围绕产品的应用现状及未来演进，进行集中体验与闭门研讨。

活动参与者均来自「AI 产品市集」飞书群。「AI 产品市集」已经面向行业推荐了超 200 个 AI 产品，聚集了包括产品人、开发者、创始人、投资人在内的超过 23000 位 AI 行业从业者。

欢迎希望参与下一期 Meetup 活动的 AI 从业者、开发人员和创业者，飞书扫码加群：

01Agent 不需要像人一样聊天，但它需要被追责

现场争论最久的问题，是 Agent 之间到底需不需要「即时通信」。

一开始，大家其实并没有在同一个问题上争论。有人从产品形态出发：Agent 要不要被拉进群？要不要像同事一样在 IM 里出现？要不要跟人一起开会、看文档、接收图片和文件？一位做 AI Workspace 的创业者给出的理由很直接：

「AI 其实需要的是 context，人需要的是人与人之间的交流协作……AI 不需要一个 IM，其实 IM 是人需要的，因为人在过去 30 年里面，他的协作可能都是发生在 IM 上的。」

这个观点，其实是把第一层问题解释清楚了：IM对 Agent 来说不是目的，而是上下文入口。在现有的组织里，很多真实工作不是发生在结构化数据库里，更多是发生在群聊、会议、文件、转发、私聊、口头承诺和临时对齐里。IM 沉淀了组织里大量未被正式命名的 Context。Agent 如果进不去这些空间，就很难真正成为个人助理或组织协作者。

但另一边很快反驳：这并不意味着 Agent 需要人类式聊天。有创业者直接抛出暴论：

「Agent 不需要即时通信，需要即时通信的是人。现在 Agent 都在兼容人，因为人看不懂 Agent 之间是怎么样通信的，所以需要用到我们人类的工具、文档以及 IM。」

因为如果 Agent 之间只是为了交换状态、传递事件、调用工具、交接任务，那它们确实不需要寒暄、表情、已读未回，也不需要复制人类群聊里的低效噪音。

现场一位做了 22 年即时通讯、做过多个十亿级 IM 平台的创业者，直接把问题重新拆开来看：

「即时通讯里其实有最核心的两个东西，第一个是寻址……另外一个是 reliable，我有一条消息要 deliver 给你，你是确定、一定以及肯定能收到的。」

大家对即时通讯本身的理解是存在差异的。随后，现场又把这个问题往前推进了一步：

「Agent 之间不需要即时通信，不需要自然语言之间的这种即时通信……这个问题我个人的理解是，人需不需要看到 Agent 之间即时通信？这个是产品形态的问题。」

这句话几乎重新校正整个问题。

真正该问的不是 Agent 要不要即时通信，而是：人需不需要看见 Agent 的即时通信？我的判断是：大多数时候不需要，但关键时刻必须能看见。这不是一个二选一的问题，更多是一个产品层的设计决策。

Agent 之间的日常通信可以完全退到后台——协议、事件、任务队列、API 调用，人不需要盯着每一条消息。但当 Agent 要做一个不可逆的动作、要越过某个权限边界、或者出了问题需要溯源时，人必须能调出完整的通信记录，看清楚谁授权了什么、谁把什么转包给了谁。

换句话说，Agent 通信的可见性不是一个开关，更多是一个可调节的产品层。如果人需要看见，那通信就不只是系统内部的消息传递，是一种产品界面，一种解释机制，一种让用户感到「我知道它在干活」的控制感；如果人不需要看见，Agent 间通信完全可以退到协议、事件、任务队列、API 调用或文档引用里。

所以 Agent 不一定需要 IM 产品，但一定需要通信基础设施：寻址、可靠送达、事件总线、状态同步、上下文引用。更重要的是，它需要一种可追责的通信。如果一个 Agent 给另一个 Agent 发消息，却没有携带任务边界、权限范围、上下文来源、失败处理和结果验收方式，那它不是协作，只是把不确定性转包出去。

Agent 不需要社交型IM，但需要责任型通信；用户不一定需要参与通信，但可能需要看见通信。人类 IM 的核心是表达和关系；Agent 通信的核心应该是授权、状态、上下文和可追责。至于这些通信要不要被展示给人，则取决于产品要给用户多少控制感。

02真正的问题不是「通信」，而是「身份」

在现场讨论里，最深的一层其实不是聚焦在 IM，而是再近一步，Agent 身份。

一位创业者举了 GitHub 的例子：今天我们让 AI 访问 GitHub，常见方式是给它 personal access token，或者用 OAuth 授权。但如果 AI 真的是一个可协作的执行单元，它是不是应该像一个真实成员一样，被邀请进 GitHub organization 或 repository？他描述了的做法是：给每个 AI 一个邮箱，让它像人一样收到 GitHub 邀请，自己打开浏览器，自己加入仓库，自己拉代码，自己开始开发。这件事听起来像拟人化，但背后的关键不是像人，而是独立身份。

「如果这个 AI 拿你的 key，然后把事情搞砸了，那这个事情应该算谁的？」

没有独立身份，就没有细粒度权限；没有细粒度权限，就没有清晰责任；没有清晰责任，Agent 越能干，组织越不敢用。

「人是有这种社会契约的，AI 其实是没有的。」

当然，这里还有一个更细的区别是：人会变，Agent 也会变，但变的方式不一样。

「人类社会里面人是会变的，人会变分成人的技能会变，人的记忆会变，还有人的心思会变，还有人对一个人的看法也会变。」

Agent 当然也会被更新、被追加记忆、被改 prompt、被换模型、被装上新的 skill。但目前看，很多 Agent 的变化并不本质：它可能记住了你的名字、一次活动、一个偏好，却不一定真的形成对你的持续理解，也不一定能把关系、心思、组织角色和历史互动转化成稳定判断。它们在更新状态，但未必在形成身份。这也是为什么身份和权限不能只做成账号系统。账号只是入口，真正难的是让一个非人执行体在变化中保持可理解、可治理、可追责。人进入组织，不只是拿到账号和权限。人背后有劳动关系、法律身份、社会信用、职级、汇报链条、同事评价等等。AI 没有这些默认契约。所以当 AI 拥有邮箱、账号、浏览器、银行卡、代码仓库权限时，产品不能只问「它能不能完成任务」，必须问：

它代表谁行动？
它的权限来自谁？
它的行为如何被记录？
它泄露信息时算谁的事故？
它造成损失时谁承担？

在现场，一位创业者还提到一个很典型的企业事故：某个 AI 功能把年终奖名单发到了公司大群。这就不是模型能力的问题了，这是身份和权限问题。

Make for Agent 的第一性问题不是界面，是身份系统，即一个非人执行体如何在组织里获得有限身份、有限权限和有限责任。

03人类介入不是「什么时候」，而是「管什么」

现场讨论的一个议题是：人类应该在什么时机介入 Agent 的协作流程？

大家的共识是：人对 Agent 的介入，不要再问什么时候介入，应该问「人类介入后管什么」。有创业者提到，过早介入会让 Agent 无法发挥；过晚介入又会导致交付结果无人兜底。因为在人类社会里，即使你是用 Agent 做的，最后老板 blame 的还是你。

有人从产品经理视角给了一个例子：

「我永远给我的 Agent 的要求就是：你去写代码，你不要跟我确认任何东西，你只给我看结果……你怎么干我不管，最终给我结果就行。」

但他也补充：对于开发者来说，技术方案、代码结构、中间环节可能都需要介入。所以问题不是一个统一时机，更多是不同角色在不同任务上需要不同程度的控制感。

「人应该什么时机介入？这个问题也是有问题的。介入不应该由时机去判断，而是应该讨论你该在什么事情上介入。」

这是关于 Human-in-the-loop 讨论的关键。过去很多 Human-in-the-loop 的设计，都默认人是在流程中间做审批。Agent 做一步，人看一眼；Agent 做一步，人点确认。看似安全，实际很容易把 Agent 退化成一个高级牛马。但如果 Agent 真正开始承担任务，人类就不可能、也不应该盯住每一个中间动作。中间过程可能太快、太碎、太长，也太不适合用人类注意力来监控。人真正该管是这三件事：

目标：到底要完成什么，不要完成什么；
权力边界：可以访问什么、修改什么、代表谁行动到什么程度；
结果验收：这个结果是否符合意图，是否可以进入真实世界；

引用游戏中一个的概念是：空气墙。

「开放世界的游戏里会有空气墙，你不走到坑前、门前你就不知道过不去……对 AI 来讲需要的是这样的，它只有在撞上的时候才会感知到这地方有限制，而不能一上来就限制它的发挥。」

边界不一定要以「持续审批」的形式出现。更好的 Agent 产品，不是让人类随时盯着它，而是在敏感动作、越权行为、不可逆操作、外部发送、资金流动、公开发布时设置空气墙，让 Agent 在可控空间内自由探索，在关键边界处被拦下、升级、请求授权。

Human-in-the-loop 不应该是「人在流程里」，准确的说是「人在责任链的关键断点上」。

控制感是产品需要提供给用户的核心能力，但它应该是可调节的，不同用户、不同任务、不同风险水平，对控制感的需求完全不同。产品设计要做的不是规定同一种介入方式，是把控制感做成可调节的产品层：可见度、确认点、空气墙、日志、回放、权限边界和异常升级。

04Make for Agent 的生意，仍然是 Make for Human

现场探讨的一个议题是「当 Agent 成为主要使用者，产品的商业模式应该面向谁设计？」大家给了一个很现实的判断：口号可以是 Make for Agent，生意仍然是 Make for Human。

「如果最后买单的是人，他要的一定是控制。」（即便我们现场提到多次 Context not control，大家也都认可）

很多协作产品最后都会长成权限、管理流程、报表、薪酬这些东西。因为 Agent 不付钱，人付钱、企业付钱、组织里的某个预算负责人付钱。更重要的是，付钱的人买的是控制感。协作软件发展到最后，几乎都会长出权限、流程、审计、报表。因为企业客户真正购买的是可治理性。越靠近生产系统，越不可能只卖效率，必须同时卖责任边界。这也解释了为什么目前真正赚钱的 Agent 产品，最确定的一类仍然是 Vibe Coding。

「真正能够产生一些效果的产品……也只有一类生产力工具现在是赚钱的，叫 Vibe Coding。」

为什么是 Coding？软件工程已经提前准备好了责任基础设施。Git、PR、CI、测试、review、rollback、diff，这些东西让 Agent 的行动可以被框住、看见、撤销、追责。

一个 Coding Agent 改坏了代码，至少还有版本控制、测试和 review 把错误挡在生产环境之外。如果换到报销、招聘、合同、投放、金融、医疗、公司内部权限系统，情况完全不同。

判断一个场景是否适合 Agent，不是看 Agent 能不能做，而是看这个场景有没有足够好的责任容器。如果没有，Agent 做得越多，组织越焦虑。能用 App 解决，就用 App。能用规则解决，就用规则。能用自动化脚本解决，就用脚本。Agent 适合的不是所有任务，而是那些目标相对明确、路径不完全确定、需要动态上下文判断、且允许一定探索空间的问题。

05企业 AI 落地的瓶颈不是模型，是上下文和想象力

在企业落地方向，现场一个有意思的判断是：Agent 在公司里跑不起来，很多时候不是模型不够强，是人和组织都还不够 AI native。

「目前看起来很大的一个卡点就是在公司的业务，人没有那么 AI native……他想象空间是有限的，他可能不太清楚说我在这样的一个 IM 产品里面到底怎么样去用它。」

企业里的上下文，比个人场景复杂太多。个人用 Agent，很多上下文在脑子里。你知道自己想要什么，知道哪些文件重要，知道哪些输出能接受，知道失败了怎么补救。企业用 Agent，上下文散落在权限系统、知识库、飞书群、历史文档、CRM、代码库、业务流程、组织政治和未写下来的默契里。

现场，我们抛出了一个框架：

「Context is infrastructure. 分成三层：data context、knowledge context、identity context。」

第一层是用户说了什么、做了什么；第二层是组织隐性知识、协作共识和项目背景；第三层是角色、风格、价值偏好，以及那些没有明说但会影响判断的身份信息。这三层 context，决定了 Agent 能不能真正进入生产。

现场，另一位企业实践者补充了一个很好的说法：群聊是人的 context，但 AI 要执行，需要的是干净上下文。

「群聊里面 90% 都是 AI 不需要知道的信息……要把有用的信息提炼出来，真正变成一个个小项目进行执行。」

这其实也把 Agent Workspace 的核心讲清楚了。Agent 不是把所有聊天记录吃进去就能干活。它需要过滤、提炼、结构化、共识化。它需要知道什么是噪音，什么是任务，什么是背景，什么是边界，什么是最新状态。所以「demo 很多，真正进生产的很少」不是偶然。Demo 的特点是上下文被精心摆好，边界被人为缩窄，失败成本被隐藏。但生产系统的特点正好相反：上下文脏、边界乱、责任重、失败不可爱。

让 Agent 进入生产，不是喂更多数据，更多是先建立上下文基础设施。Data context、knowledge context、identity context 三层都需要被显式化、结构化、可治理。Agent 需要的上下文和人类协作沉淀的上下文不是同一套东西，前者需要干净、结构化、有边界；后者天然是嘈杂、松散、充满隐性的。产品设计要在两者之间做翻译和过滤，而不是简单地把群聊丢给 Agent。

06最危险的误判：把 Agent 当新人

在我们的现场讨论，非常有意思的观点是：

「把 Agent 当人看是对的，但是把 Agent 当人看是错的。」

这个观点其实同时指出了两个陷阱。第一个陷阱，是把 Agent 当工具。如果只把 Agent 当工具，就会低估它的自主性、连续性、上下文迁移能力和任务承担能力。你会一直试图用按钮、菜单、表单去控制它，最后得到一个被阉割的自动化系统；第二个陷阱，是把 Agent 当新人。如果把 Agent 当新人，就会下意识套用人类组织的协作习惯：拉群、对齐、汇报、确认、寒暄、角色扮演、上级审批。你会得到一个表面像团队、实际低效混乱的拟人化剧场。Agent 既不是传统工具，也不是组织新人，更像是一种新的执行单元：可以接收目标，调用工具，携带上下文，拆解任务，生成中间状态，并把结果交还给责任人。

在产品设计层面，不要只问「Agent 的界面是什么」，更多要思考「Agent 在责任链里的位置是什么」。它什么时候是工具，什么时候是代理人，什么时候是协作者，什么时候只是一个后台进程？它能否代表用户说话？能否代表用户花钱？能否邀请另一个 Agent？能否修改共享文档？能否把结果发给外部客户？每一个「能否」，背后都不是功能问题，是授权问题。

07产品也要讲究 Agent 友好度：不只是服务人，也要尊重 Agent 的工作方式

讨论到后半段时，现场出现了一个容易被忽略但很重要的视角：即使最终付费者和责任承担者仍然是人，产品也不能只按人的习惯来设计。有人说：

「除了人的需求之外，也要去尊重 Agent 的主体性的需求。」

这个说法其实指向的是非常实际的产品问题。比如，流式输出。人喜欢看到一个字一个字往外蹦，因为这能缓解等待焦虑，让人确认它还在干活。但从 Agent 自身的工作方式看，它未必天然需要流式输出。更像是一次性生成、一次性返回，然后由系统决定如何展示给人。所以 Agent 友好度不是讨好 Agent，是承认 Agent 和人的交互节奏、信息处理方式、输入输出结构不同。现场把 Agent 友好度拆成了几个很具体的点：

接口友好：能不能 CLI？能不能通过文本、API、文件、事件流接入？
多模态友好：当 Agent 需要图片、语音、视频、传感器输入时，产品能不能提供合适的输入形态？
上下文经济性：不能把所有历史记录、所有文档、所有群聊都一股脑塞给 Agent。窗口有限，注意力有限，成本也有限。
局限性友好：产品要知道 Agent 不是全知全能的，它需要被提供经过筛选、压缩、结构化的上下文。

面向人的设计要满足控制感，面向 Agent 的设计要满足经济性和主体性。前者回答「人如何放心把权力让出去」，后者回答「Agent 如何在不被人类界面拖累的情况下完成任务」。Make for Agent 不是把人类 UI 改成 Agent UI，而是在同一个产品里同时处理两种完全不同的需求：人需要理解、控制、确认和负责；Agent 需要结构化输入、明确权限、低噪声上下文和可执行接口。

08Make for Agent，其实是 Make for Responsibility

最后一个开放式探讨的问题是：下一代 AI 产品应该如何设计？我们应该创造什么样的产品？在这场 Meetup 中，没有给出现成答案，但至少给了我们七点产品洞察。按照「先想清楚 Agent 是谁，再想它怎么通信，再想人怎么介入，最后想整个产品怎么设计」的顺序，重新排列一下：

有限身份：Make for Agent 的第一性问题不是界面，而是身份系统——非人执行体如何在组织里获得有限身份、有限权限和有限责任。没有独立身份，就没有细粒度权限；没有细粒度权限，就没有清晰责任。
责任型通信：Agent 不需要社交型 IM，但需要可追责的通信；用户不一定参与通信，但在关键时刻必须能看见通信。通信的可见性是一个可调节的产品层，不是开关。
责任容器优先：判断一个场景是否适合 Agent，先看它有没有足够好的责任容器。没有就别硬上——不是技术问题，是责任归属问题。
关键断点介入：Human-in-the-loop 不应该是「人在流程里」，而应该是「人在责任链的关键断点上」。控制感要做成可调节的产品层，不同角色、不同任务需要不同粒度。
上下文基础设施：让 Agent 进入生产，不是喂更多数据，而是建立 data / knowledge / identity 三层 context 的结构化与可治理。
责任链定位：产品设计不能只问「Agent 的界面是什么」，要问「Agent 在责任链里的位置是什么」——它代表谁行动，权限来自谁，出错时谁买单。
双面设计：面向人要满足控制感，面向 Agent 要满足经济性和主体性。同一个产品要同时处理两种需求，这是 Make for Agent 和传统产品设计最根本的区别。

Make for Agent，核心其实是 Make for Responsibility。不是因为 Agent 会成为新的用户，所以我们要为它设计产品。而是因为 Agent 让产品里的目标、权限、上下文、行动和后果第一次被系统性拆开了。过去由「用户」这个词含糊包住的一整套责任，现在必须重新显影。产品的用户也许会变。但更重要的是：产品终于不能再逃避责任链设计了。

转载原创文章请添加微信：founderparker

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.