Vibe Working：这一次，轮到白领了|调用|数据源|kimi|agent|命令提示符

分享至

机器之心编辑部

昨天，OpenAI 在 Intelligence at Work 直播活动上宣布了一项重大决定：未来几周内，Codex 的核心能力会直接并入 ChatGPT

也就是说，曾经作为程序员及 Vibe Coder 们专属工具的 Codex，即将成为所有 ChatGPT 用户触手可及的东西。

这个新闻背后，有一组非常值得关注的数据：Codex 的周活用户已突破 500 万，其桌面版用户数量自今年 2 月上线后更是翻了 6 倍多！其中，增速最快的群体不是程序员，而是知识工作者，也就是做报告、做表格、做 PPT 的「普通白领」——他们正以开发者三倍以上的速度涌入这一平台，目前占全部用户的约 20%。

这是一个清晰的信号：AI Agent 的主战场，正在从写代码迁移到普通人的日常工作上

OpenAI 看到了这一趋势，决定把 Codex「并入」ChatGPT 这个高频入口；Anthropic 还要更早，在 2 月就率先推出了面向金融、工程等场景的企业 Agent 计划，5 月又专门上线了一批深度面向金融行业的 Agent 产品。越来越多的人意识到，Coding Agent 不只能写代码，也能整理文件、分析数据、自动化工作流，乃至完成过去需要助理才能做的事。

Vibe Coding 之后，下一个词是 Vibe Working。

这个背景下，月之暗面发布了一款他们自己也承认「还是个 Baby」的新产品：Kimi Work

下载地址请访问官方公告《Kimi Work Beta 版邀你体验：你的工作，分我一半》。

Kimi Work 是什么？

Kimi Work 是 Kimi 电脑客户端全新推出的一项本地通用 Agent 模式，面向更广泛的知识工作者。

据介绍，在 K2.6 模型参与共创的情况下，Kimi Work 很快完成了 Beta 版的开发与上线。

Kimi Work 的内核源自他们自家的 Coding Agent：Kimi Code。最大的区别在于，程序员习惯的运行界面是黑框框的「命令行」或「终端」，而 Kimi Work 为知识工作者提供了我们最熟悉的软件形态 GUI，也就是图形用户界面。

这也与 OpenAI Codex、Claude Cowork 等产品的方向相似：Agent 不再只是开发者工具，而是开始进入更通用的专业工作场景。

要做到这一点，仅仅把模型接进一个界面并不够。Agent 真正难的地方，在于模型能力、工具环境和任务执行流程能否紧密配合。它需要理解用户意图，拆解任务步骤，调用合适工具，并在执行过程中根据结果不断修正。

与在云端运行的网页版 Agent 不同，Kimi Work 沿用了 Coding Agent 的核心优势——将 Harness 搬到了用户自己的电脑上，完成了从程序员终端到通用桌面的下放。

你的电脑就是 Agent 的工作台。Kimi 可以直接获取并操作你日常用的文件、应用和浏览器。电脑不再只是等你点一下动一下的东西，它可以自己转起来了。

在此基础上，Kimi Work 还引入了Agent 集群能力。串行工作是人类受限于精力的默认设定，但 AI 天生就应该是并行的。Kimi Work 测试版上线即支持 Agent 集群能力，它最多可以为你自主创建 300 个分身，同时处理多线程任务。你可以让它一边跑数据、一边写材料，同时还在自动化处理流程，提升工作效率。

为了让知识工作者真正做到开箱即用，Kimi Work 做了这两件事：

内置 Kimi WebBridge（浏览器桥接）：它能直接操作你当前正在使用的浏览器（包含你自己的登录状态和习惯），而不是去新建一个空白的 AI 专用浏览器。基本上你在浏览器上能做的 50% 的事情，它都能直接帮你操作。
内置专业金融数据源：出厂自带同花顺、天眼查、世界银行经济数据库等权威环境。金融人士无需再去头疼如何购买和配置各种 API，开箱即用。

到底好用不？我们试了试

说了这么多，Kimi Work 实际用起来是什么感觉？我们构建了 5 个测试场景，从调研、本地文件处理、浏览器操控，到长任务稳定性和金融专项，挨个试了一遍。

首先，来个基础点的调研任务：「整理 2025 年以来国内新能源汽车行业的融资事件，按轮次和金额排序，输出一份可读的 Excel。」

收到指令后，Kimi Work 没有从头到尾地慢慢做，而是直接启用了K2.6 Agent 集群模式，一口气派出了 4 个子 Agent（界面上称之为「研究员」），同时展开信息搜集。这 4 个研究员各自独立工作，互不等待。

搜集阶段完成后，Kimi Work 又自动创建了两个专职 Agent：一个负责数据清洗，一个负责 Excel 制作。整个过程不需要人工拆解任务、安排分工，它自己就把「项目管理」这件事做掉了。

最终产出的结果，信息量相当足，粗细都有——既有完整的融资事件列表，也有按轮次分类的汇总视图。

这个测试验证了一件重要的事：Kimi Work 的并行能力不是一个开关，而是它的默认工作方式。面对稍有规模的调研任务，它会主动判断哪些部分可以同时推进，而不是等你告诉它。

接下来，我们又试了试 Kimi Work 在本地工作场景中能力。

对我们这种 AI 媒体来说，选题管理是日常工作的核心之一。我们把近期的选题文件下载到了一个本地文件夹，然后直接在 Kimi Work 里打开，给出指令：这是我们的选题文件夹，请整理出近一个月与「具身智能」和「机器人」相关的选题并进行分类整理。

Kimi Work 几乎没有停顿，飞快完成了任务。它不仅检索出了相关选题，还自动做了分类，输出结构清晰。

这个场景的意义不只是「快」。更关键的是，它操作的是真实的本地文件，不需要上传，不需要复制粘贴，文件夹直接打开就能用。对于习惯在本地管理内容资产的团队来说，这种无缝感是以往任何云端 AI 工具都给不了的。

接下来测试的是最具想象力的那个功能：WebBridge。我们想看看它能不能真正「带着你的账号去干活」。

指令是：「我已经在当前浏览器中登录了微博。请直接通过 WebBridge 替我发布一条新微博，内容是感叹《给阿嬷的情书》这部电影非常好看。发布成功后，请将你最终发布的完整文案和微博链接反馈给我。」

结果，Kimi Work 全程没有离开自己的交互界面，但在后台调用了我们默认浏览器的登录状态，完成了内容撰写、页面打开、文本填入、发布确认的完整操作链路，最后还把微博链接反馈回来了。

这件事的意义值得细想。以往讨论 AI 自动化，要么是给 AI 一个专用的沙盒浏览器（里面没有你的账号、没有你的 Cookie），要么需要用户自己手动授权、配置 API。WebBridge 的思路是另一种：AI 直接「借用」你现有的浏览器环境，那些你登录过的账号、保存过的状态，都直接成了它可以使用的资源。这让整个过程的摩擦感降到了最低。

顺带一提，在以上实测视频中可以看到 Kimi Work 发起了多次授权请求，但其实 Kimi Work 也内置了类似 claude --dangerously-skip-permissions 的「全部允许」模式：用户只需指定一个具体的项目文件夹，选择「全部允许」即可——反正 Kimi Work 足够安全，并不会超出文件夹行事。当然，如果是关键目录，还是「请求权限」更好。

接下来再测试一下长任务稳定性。为此，我们构建了一个需要长时间持续执行的创意任务：

我有一个创意，我想举办一个虚拟的天才峰会，邀请古今中外 30 位天才发言，比如商业天才 Elon Musk、科学天才爱因斯坦、诗歌天才李白等等。你需要找到 30 位天才，并为这些天才撰写各自的演讲稿（1000-3000 字），需要符合他们各自的人物历史背景和个性。另外，出具一份日程安排表，合理安排各位演讲者的发言时间。

30 人、每人至少千字、风格各异、还要统筹日程……这不只是一个「生成任务」，更是一个中间不能掉链子的长程马拉松。

Kimi Work 的处理方式是分批次推进：先完成选角和结构规划，再逐批撰写演讲稿，最后汇总输出。整个过程耗时 50 多分钟，全程无需人工介入。

中间有一个值得记录的细节：在撰写莫扎特的演讲稿时，Kimi Work 超时了。任务直接失败。但它随后自动重新启动，接着从断点继续完成了后续内容，而不是从头再来，也没有丢失之前的进度。

最终产物是一份 104 页的 Word 文档，涵盖古今中外 30 位天才的完整演讲稿与日程安排——当真是人类群星闪耀！

成果部分页面截图

这个测试真正考验的不是字数，而是「长程连贯性」：前面选了哪 30 个人、每个人确立了什么风格基调，后面的撰写必须和这些设定保持一致。在长达 50 分钟、跨越数十个子任务的执行链条里，Kimi Work 没有出现前后矛盾，也没有在超时后选择放弃……这对于一个刚发布的 Beta 版产品来说，已经相当能打。

最后这个测试，专门针对 Kimi Work 的内置金融数据源。需求很直接：「使用内置专业金融数据源，分析英伟达 2023 年以来的股价走势，出具一份分析报告。」

Kimi Work 没有去联网搜索一篇现成的分析文章，而是真正调用了数据源——整个过程共使用 20 个工具、执行 20 条命令，逐步完成数据拉取、清洗、计算和报告撰写。

最终产出是一份 11 页的完整分析报告，内容涵盖英伟达近年股价走势、累计收益率、波动率分析等核心维度，数据基本准确，结构完整，达到了投资参考的基本标准。

报告部分页面截图

这个测试想验证的是一个根本问题：内置金融数据源到底是真的「接了数据管道」，还是只是换了个说法的联网搜索？从结果来看，20 条工具调用指令的背后，是一套真实的数据获取和处理流程，而非从某篇文章里摘出来的结论。对金融从业者来说，能用自然语言驱动一套完整的数据分析流程，这才是这个功能真正的价值所在。

下一场战争，在你的桌面上打响

Kimi Work 的发布时间很微妙。

就在 OpenAI 宣布 Codex 将进入 ChatGPT 的同一天，Kimi 也推出了一个定位相近的桌面 Agent 产品。

巧合背后，是这两件事背后共同指向的那个趋势：通用 Agent 的战场正在从云端迁移到本地

Kimi 网页版 Agent、OpenAI 的 cloud sandbox、谷歌的 Project Mariner……这批第一代 Agent 产品的共同特点是：在云端启动一个独立的工作环境，帮用户把任务做完再交付结果。这种模式的好处是安全隔离、易于部署，但代价是与用户真实工作环境的割裂：它看不到你的本地文件，用的不是你的账号，每次任务之间没有记忆和上下文的积累。

Kimi Work 和 Claude Cowork 代表的是另一条路：Agent 住在你的本地，用你的环境，操作你的文件，带着你的登录状态去工作。理论上讲，这种本地 Agent 的边界就等于用户桌面工作的全部边界

这个转变背后是一个更深的行业判断：AI 长任务的真正挑战，不再是上下文窗口有多长，而是 Harness 搭建得好不好。模型再强，如果没有一个好的运行环境来对接真实工作流（包括调用正确的工具、访问正确的数据、在正确的时机介入），能力就无法落地。

从这个角度看，模型公司在通用 Agent 产品上确实拥有天然优势。

为什么？因为只有同时掌握模型能力和 Agent 运行环境的公司，才能做到两者的深度协同：模型知道什么时候该调用什么工具，Harness 知道模型需要什么样的上下文。这种协同是外部集成商很难复制的。

Kimi 在这条路上并非刚刚起步。2025 年 7 月发布的万亿参数开源模型 Kimi K2，这也是国内最早一批将 Agentic Coding、工具调用和自主任务执行能力作为核心目标打造的基础模型之一。同年 9 月，Kimi 就开始内测 Agent 模式（彼时代号「OK Computer」）。Kimi Work 是这条技术路径在桌面端的自然延伸，而不是一个临时起意的新赛道。

当然，Kimi Work 还是个 Beta 版，Kimi 自己也没有回避这一点。Agent 产品从「能用」到「好用」之间，还有大量的工程细节需要打磨：任务失败时的恢复机制、长时任务的中断与恢复、用户意图的准确理解……每一项都不简单，也值得我们期待。

但正如月之暗面官方博客介绍的那样：「Kimi Work 正以一天 N 版的速度迭代中」，这表明 Kimi Work 发布本身并不是表明这个产品有多完善，而是这个方向上的竞争已经进入了一个新的速度节奏。

结语

Vibe Coding 让不懂编程的人开始用 AI 写代码。Vibe Working 想做的是让不懂技术的人开始用 AI 完成知识工作。

两者的核心逻辑是一样的：把执行权交给 AI，把判断权留给人

OpenAI 选择把 Codex 这个执行利器并进 ChatGPT 这个高频入口，走的是规模渗透路线；Kimi 今天发布的是一个住在你桌面上的本地 Agent，走的是深度嵌入路线。两条路都在通向同一个地方：一个 AI 真正参与知识工作日常流程的未来。

那个未来，比大多数人预想的，要来得要早一些。

文中视频链接：https://mp.weixin.qq.com/s/Qyd8mHuR5ryfztgqQtSgGw

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.