![]()
机器之心编辑部
昨天,OpenAI 在 Intelligence at Work 直播活动上宣布了一项重大决定:未来几周内,Codex 的核心能力会直接并入 ChatGPT
也就是说,曾经作为程序员及 Vibe Coder 们专属工具的 Codex,即将成为所有 ChatGPT 用户触手可及的东西。
这个新闻背后,有一组非常值得关注的数据:Codex 的周活用户已突破 500 万,其桌面版用户数量自今年 2 月上线后更是翻了 6 倍多!其中,增速最快的群体不是程序员,而是知识工作者,也就是做报告、做表格、做 PPT 的「普通白领」——他们正以开发者三倍以上的速度涌入这一平台,目前占全部用户的约 20%。
这是一个清晰的信号:AI Agent 的主战场,正在从写代码迁移到普通人的日常工作上
OpenAI 看到了这一趋势,决定把 Codex「并入」ChatGPT 这个高频入口;Anthropic 还要更早,在 2 月就率先推出了面向金融、工程等场景的企业 Agent 计划,5 月又专门上线了一批深度面向金融行业的 Agent 产品。越来越多的人意识到,Coding Agent 不只能写代码,也能整理文件、分析数据、自动化工作流,乃至完成过去需要助理才能做的事。
Vibe Coding 之后,下一个词是 Vibe Working。
这个背景下,月之暗面发布了一款他们自己也承认「还是个 Baby」的新产品:Kimi Work
![]()
下载地址请访问官方公告《Kimi Work Beta 版邀你体验:你的工作,分我一半》。
Kimi Work 是什么?
Kimi Work 是 Kimi 电脑客户端全新推出的一项本地通用 Agent 模式,面向更广泛的知识工作者。
据介绍,在 K2.6 模型参与共创的情况下,Kimi Work 很快完成了 Beta 版的开发与上线。
Kimi Work 的内核源自他们自家的 Coding Agent:Kimi Code。最大的区别在于,程序员习惯的运行界面是黑框框的「命令行」或「终端」,而 Kimi Work 为知识工作者提供了我们最熟悉的软件形态 GUI,也就是图形用户界面。
这也与 OpenAI Codex、Claude Cowork 等产品的方向相似:Agent 不再只是开发者工具,而是开始进入更通用的专业工作场景。
要做到这一点,仅仅把模型接进一个界面并不够。Agent 真正难的地方,在于模型能力、工具环境和任务执行流程能否紧密配合。它需要理解用户意图,拆解任务步骤,调用合适工具,并在执行过程中根据结果不断修正。
与在云端运行的网页版 Agent 不同,Kimi Work 沿用了 Coding Agent 的核心优势——将 Harness 搬到了用户自己的电脑上,完成了从程序员终端到通用桌面的下放。
你的电脑就是 Agent 的工作台。Kimi 可以直接获取并操作你日常用的文件、应用和浏览器。电脑不再只是等你点一下动一下的东西,它可以自己转起来了。
在此基础上,Kimi Work 还引入了Agent 集群能力。串行工作是人类受限于精力的默认设定,但 AI 天生就应该是并行的。Kimi Work 测试版上线即支持 Agent 集群能力,它最多可以为你自主创建 300 个分身,同时处理多线程任务。你可以让它一边跑数据、一边写材料,同时还在自动化处理流程,提升工作效率。
为了让知识工作者真正做到开箱即用,Kimi Work 做了这两件事:
- 内置 Kimi WebBridge(浏览器桥接):它能直接操作你当前正在使用的浏览器(包含你自己的登录状态和习惯),而不是去新建一个空白的 AI 专用浏览器。基本上你在浏览器上能做的 50% 的事情,它都能直接帮你操作。
- 内置专业金融数据源:出厂自带同花顺、天眼查、世界银行经济数据库等权威环境。金融人士无需再去头疼如何购买和配置各种 API,开箱即用。
到底好用不?我们试了试
说了这么多,Kimi Work 实际用起来是什么感觉?我们构建了 5 个测试场景,从调研、本地文件处理、浏览器操控,到长任务稳定性和金融专项,挨个试了一遍。
首先,来个基础点的调研任务:「整理 2025 年以来国内新能源汽车行业的融资事件,按轮次和金额排序,输出一份可读的 Excel。」
![]()
收到指令后,Kimi Work 没有从头到尾地慢慢做,而是直接启用了K2.6 Agent 集群模式,一口气派出了 4 个子 Agent(界面上称之为「研究员」),同时展开信息搜集。这 4 个研究员各自独立工作,互不等待。
![]()
搜集阶段完成后,Kimi Work 又自动创建了两个专职 Agent:一个负责数据清洗,一个负责 Excel 制作。整个过程不需要人工拆解任务、安排分工,它自己就把「项目管理」这件事做掉了。
![]()
最终产出的结果,信息量相当足,粗细都有——既有完整的融资事件列表,也有按轮次分类的汇总视图。
![]()
这个测试验证了一件重要的事:Kimi Work 的并行能力不是一个开关,而是它的默认工作方式。面对稍有规模的调研任务,它会主动判断哪些部分可以同时推进,而不是等你告诉它。
接下来,我们又试了试 Kimi Work 在本地工作场景中能力。
对我们这种 AI 媒体来说,选题管理是日常工作的核心之一。我们把近期的选题文件下载到了一个本地文件夹,然后直接在 Kimi Work 里打开,给出指令:这是我们的选题文件夹,请整理出近一个月与「具身智能」和「机器人」相关的选题并进行分类整理。
Kimi Work 几乎没有停顿,飞快完成了任务。它不仅检索出了相关选题,还自动做了分类,输出结构清晰。
![]()
这个场景的意义不只是「快」。更关键的是,它操作的是真实的本地文件,不需要上传,不需要复制粘贴,文件夹直接打开就能用。对于习惯在本地管理内容资产的团队来说,这种无缝感是以往任何云端 AI 工具都给不了的。
接下来测试的是最具想象力的那个功能:WebBridge。我们想看看它能不能真正「带着你的账号去干活」。
指令是:「我已经在当前浏览器中登录了微博。请直接通过 WebBridge 替我发布一条新微博,内容是感叹《给阿嬷的情书》这部电影非常好看。发布成功后,请将你最终发布的完整文案和微博链接反馈给我。」
![]()
结果,Kimi Work 全程没有离开自己的交互界面,但在后台调用了我们默认浏览器的登录状态,完成了内容撰写、页面打开、文本填入、发布确认的完整操作链路,最后还把微博链接反馈回来了。
这件事的意义值得细想。以往讨论 AI 自动化,要么是给 AI 一个专用的沙盒浏览器(里面没有你的账号、没有你的 Cookie),要么需要用户自己手动授权、配置 API。WebBridge 的思路是另一种:AI 直接「借用」你现有的浏览器环境,那些你登录过的账号、保存过的状态,都直接成了它可以使用的资源。这让整个过程的摩擦感降到了最低。
顺带一提,在以上实测视频中可以看到 Kimi Work 发起了多次授权请求,但其实 Kimi Work 也内置了类似 claude --dangerously-skip-permissions 的「全部允许」模式:用户只需指定一个具体的项目文件夹,选择「全部允许」即可——反正 Kimi Work 足够安全,并不会超出文件夹行事。当然,如果是关键目录,还是「请求权限」更好。
![]()
接下来再测试一下长任务稳定性。为此,我们构建了一个需要长时间持续执行的创意任务:
我有一个创意,我想举办一个虚拟的天才峰会,邀请古今中外 30 位天才发言,比如商业天才 Elon Musk、科学天才爱因斯坦、诗歌天才李白等等。你需要找到 30 位天才,并为这些天才撰写各自的演讲稿(1000-3000 字),需要符合他们各自的人物历史背景和个性。另外,出具一份日程安排表,合理安排各位演讲者的发言时间。
30 人、每人至少千字、风格各异、还要统筹日程……这不只是一个「生成任务」,更是一个中间不能掉链子的长程马拉松。
Kimi Work 的处理方式是分批次推进:先完成选角和结构规划,再逐批撰写演讲稿,最后汇总输出。整个过程耗时 50 多分钟,全程无需人工介入。
![]()
中间有一个值得记录的细节:在撰写莫扎特的演讲稿时,Kimi Work 超时了。任务直接失败。但它随后自动重新启动,接着从断点继续完成了后续内容,而不是从头再来,也没有丢失之前的进度。
最终产物是一份 104 页的 Word 文档,涵盖古今中外 30 位天才的完整演讲稿与日程安排——当真是人类群星闪耀!
![]()
成果部分页面截图
这个测试真正考验的不是字数,而是「长程连贯性」:前面选了哪 30 个人、每个人确立了什么风格基调,后面的撰写必须和这些设定保持一致。在长达 50 分钟、跨越数十个子任务的执行链条里,Kimi Work 没有出现前后矛盾,也没有在超时后选择放弃……这对于一个刚发布的 Beta 版产品来说,已经相当能打。
最后这个测试,专门针对 Kimi Work 的内置金融数据源。需求很直接:「使用内置专业金融数据源,分析英伟达 2023 年以来的股价走势,出具一份分析报告。」
Kimi Work 没有去联网搜索一篇现成的分析文章,而是真正调用了数据源——整个过程共使用 20 个工具、执行 20 条命令,逐步完成数据拉取、清洗、计算和报告撰写。
![]()
最终产出是一份 11 页的完整分析报告,内容涵盖英伟达近年股价走势、累计收益率、波动率分析等核心维度,数据基本准确,结构完整,达到了投资参考的基本标准。
![]()
报告部分页面截图
这个测试想验证的是一个根本问题:内置金融数据源到底是真的「接了数据管道」,还是只是换了个说法的联网搜索?从结果来看,20 条工具调用指令的背后,是一套真实的数据获取和处理流程,而非从某篇文章里摘出来的结论。对金融从业者来说,能用自然语言驱动一套完整的数据分析流程,这才是这个功能真正的价值所在。
下一场战争,在你的桌面上打响
Kimi Work 的发布时间很微妙。
就在 OpenAI 宣布 Codex 将进入 ChatGPT 的同一天,Kimi 也推出了一个定位相近的桌面 Agent 产品。
巧合背后,是这两件事背后共同指向的那个趋势:通用 Agent 的战场正在从云端迁移到本地
Kimi 网页版 Agent、OpenAI 的 cloud sandbox、谷歌的 Project Mariner……这批第一代 Agent 产品的共同特点是:在云端启动一个独立的工作环境,帮用户把任务做完再交付结果。这种模式的好处是安全隔离、易于部署,但代价是与用户真实工作环境的割裂:它看不到你的本地文件,用的不是你的账号,每次任务之间没有记忆和上下文的积累。
Kimi Work 和 Claude Cowork 代表的是另一条路:Agent 住在你的本地,用你的环境,操作你的文件,带着你的登录状态去工作。理论上讲,这种本地 Agent 的边界就等于用户桌面工作的全部边界
这个转变背后是一个更深的行业判断:AI 长任务的真正挑战,不再是上下文窗口有多长,而是 Harness 搭建得好不好。模型再强,如果没有一个好的运行环境来对接真实工作流(包括调用正确的工具、访问正确的数据、在正确的时机介入),能力就无法落地。
从这个角度看,模型公司在通用 Agent 产品上确实拥有天然优势。
为什么?因为只有同时掌握模型能力和 Agent 运行环境的公司,才能做到两者的深度协同:模型知道什么时候该调用什么工具,Harness 知道模型需要什么样的上下文。这种协同是外部集成商很难复制的。
Kimi 在这条路上并非刚刚起步。2025 年 7 月发布的万亿参数开源模型 Kimi K2,这也是国内最早一批将 Agentic Coding、工具调用和自主任务执行能力作为核心目标打造的基础模型之一。同年 9 月,Kimi 就开始内测 Agent 模式(彼时代号「OK Computer」)。Kimi Work 是这条技术路径在桌面端的自然延伸,而不是一个临时起意的新赛道。
当然,Kimi Work 还是个 Beta 版,Kimi 自己也没有回避这一点。Agent 产品从「能用」到「好用」之间,还有大量的工程细节需要打磨:任务失败时的恢复机制、长时任务的中断与恢复、用户意图的准确理解……每一项都不简单,也值得我们期待。
但正如月之暗面官方博客介绍的那样:「Kimi Work 正以一天 N 版的速度迭代中」,这表明 Kimi Work 发布本身并不是表明这个产品有多完善,而是这个方向上的竞争已经进入了一个新的速度节奏。
结语
Vibe Coding 让不懂编程的人开始用 AI 写代码。Vibe Working 想做的是让不懂技术的人开始用 AI 完成知识工作。
两者的核心逻辑是一样的:把执行权交给 AI,把判断权留给人
OpenAI 选择把 Codex 这个执行利器并进 ChatGPT 这个高频入口,走的是规模渗透路线;Kimi 今天发布的是一个住在你桌面上的本地 Agent,走的是深度嵌入路线。两条路都在通向同一个地方:一个 AI 真正参与知识工作日常流程的未来。
那个未来,比大多数人预想的,要来得要早一些。
文中视频链接:https://mp.weixin.qq.com/s/Qyd8mHuR5ryfztgqQtSgGw
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.