OpenAI 又一次悄悄地给 Codex「补课」了。
北美世界 5 月 7 日,OpenAI 官宣 Codex for Chrome 扩展功能上线,让 Codex 可以直接调用用户电脑上的 Chrome 浏览器,进入已经登录的网站和工具里完成任务。
按照官方的说辞,接入这个扩展功能之后,Codex 可以读取网页内容、操作内部系统、查看后台、填写表单等,用户还可以控制它访问哪些网站。以雷科技的理解就是,现在的 Codex,可以接管你的 Chrome 浏览器了。
![]()
(图源:OpenAI)
不过,只看官方介绍,这的确是一个美好的新功能,可体验过当年 OpenAI 推出的 ChatGPT Altas 的朋友应该都明白,理想和现实还是有一点点差距的。既然如此,我们雷科技AGI(ID:leikejiagi)决定还是亲自去体验看看。
接入 codex,浏览器自己「动」起来了
Codex for Chrome 扩展功能的上手难度并不高,一共就分为两步。第一步是去 Chrome 浏览器里找到扩展功能,进入 Chrome 应用商店,搜索「Codex」安装即可。完成安装后,它会出现在浏览器的右上角,但此时的状态是未连接。
接着打开 Codex,找到设置里的「电脑操控」,把「Google Chrome」这个插件安装上,完成后点击激活即可连接成功。
![]()
第一轮测试我们来点简单的,让 Codex for Chrome 整理我们的标签页。发出指令之后,Codex 开始思考,这一个过程我们不需要去关注 Chrome 正在干什么,它能够在后台自动运行。
虽然是简单的操作,反倒让 Codex 犯了难。Codex 最开始并不能完全识别到所有的标签页,且没有一个专门的控件能够执行这个操作,但它想到了可以先关闭所有标签页,再按分类顺序打开。可惜,第一步 Codex 就误操作把所有页面关闭了,但没有记录下具体的网址,因此无法打开。
![]()
接下来就是测试Codex for Chrome 在整理数据上的一个能力,我们直接在 Codex 上让它唤醒 Chrome,收集苹果、华为、小米最新款旗舰手机信息,输出资料卡,同时给我们 5 个选题建议。这一次就非常顺利了,我们能清晰看到它调用了 Chrome 的网页,在进行信息搜索和整理,整个过程大概耗时三分多钟。
![]()
给出的 5 个选题,我认为也是超出预期的,针对影像、屏幕、AI 大模型这几个大家比较在意的部分均有涉及,Codex 还是挺懂读者想要看哪些内容。
![]()
既然这个不算难,那干脆上一个长任务好了。我让 Codex 在 Chrome 浏览器里找到 Deepseek,并写一篇符合雷科技风格的文章,主题就用之前分析三款旗舰给的建议选题题目,全程让它自主操作。
![]()
这次Codex for Chrome 的响应速度很快,基本上 30 秒就把指令完整贴到了 Deepseek 上,开始写文章,直至完成文章也只花了 1 分钟左右。
![]()
接着我们又尝试了更复杂的操作,让Codex for Chrome 做一份 AI 新闻日报的表格。由于我一开始就已经给 Codex 安排上了做 AI 日报总结的 Skill,因此这部分进展还是相对顺利的,大概 1 分钟就完成了信息的收集。然后就到了开启腾讯文档,新建表格,将内容粘贴进去,整个过程进展还算顺利,中间偶尔会出现识别不准确的问题,但也能及时纠正。
![]()
目前来看,Codex for Chrome 的实用性还是挺高的,一方面,Codex 的能力在当前来说的确是第一梯队的,以它为轴心去执行的操作,基本上不会出现很大的岔子,至少我们尝试了这几种方案,都没有说完全做不到的情况;另一方面,打通 Chrome 和 Codex,最大的优势其实还是不需要专门更换其他 AI 浏览器也能做到相同的效果,降低了换新的门槛。
辅助浏览器而不是替代,OpenAI 这次学聪明了
在看到 OpenAI 官宣做了这么个扩展应用时,我们下意识会想起被冷落了很久的 ChatGPT Atlas,作为 OpenAI 推出的首款 AI 浏览器,它其实承载了很大的希望。不过,大家也都知道,ChatGPT Atlas 并没有掀起多大的波澜。
包括 Firefox、Atlas、美团光年之外团队打造的 Tabbit 浏览器在内的这些 AI 浏览器,一直都在教育用户,现在的浏览器不应该只是一个看网页的工具,它应该能理解你正在看的内容,知道你接下来可能要干什么,甚至在某些时候直接帮你把操作做完。
比如Atlas,它能在你打开网页、查资料、做研究、整理信息,AI 都在旁边跟着看,必要的时候还能进入 agent mode,帮你自动化处理任务。但问题是,大家还是按照习惯,每天的工作基本都在 Chrome 上处理,为啥呢?我认为这很简单,浏览器毕竟不是一个普通的 App,它承载了书签、密码、历史记录、插件、登录状态,还有使用习惯,很多人就是喜欢某些按钮在某个位置。更别提,Chrome 依然是目前扩展功能最丰富的浏览器。
![]()
所以回过头来看 Codex for Chrome,我反而觉得这一招有点鸡贼,或许是 ChatGPT Atlas 没能成功引起了 OpenAI 的另一个思考,那就是,既然改变不了用户的习惯,我们在用户习惯的范畴里给更强的能力。
都是 AI 为主,这里面还是有区别的。Atlas、Tabbit 更像是浏览器+AI,浏览器本身就是产品主角,AI 是它的核心体验,它在搜索、信息总结这些基于网页的能力上,表现非常亮眼。而Codex for Chrome 本质上是借 Codex 的能力落地,Codex 本身就是 OpenAI 打造的专门做任务的 Agent,优势自然就是「干实事」。
![]()
从我们前面的实测看,也确实如此,比如让它整理旗舰手机资料、生成选题建议、调用 DeepSeek 写稿、去腾讯文档新建表格,这些事情 Codex for Chrome 都能做,而且整体不算慢。尤其是调用 DeepSeek 写稿那次,体验其实比我预想中顺,它能唤起 Chrome,进入对应页面,找到输入区域,把内容写进去。整个过程都不需要我去监看 Chrome 正在发生什么事,也没有要接管的情况。
我认为Codex for Chrome 最有价值的地方还是做一些日常比较琐碎的工作,就像我把 AI 日报做成表格,实际上作为科技数码行业从业者来说,这可能是每天都需要完成的一项任务,而交给Codex for Chrome ,可以节省不少时间和精力。
![]()
和所有 AI 浏览器一样,Codex for Chrome 目前也还是存在一些问题。我们自己操作浏览器的时候,哪些网页没加载出来、哪些按钮不要随便按,登录、广告位置在哪里,我们都能判断,但是 AI 还是需要花很长的时间识别。比如小雷最担心的是,万一它直接点了发布,把没写完的文章发布出去,那就酿成大祸了。
所以我现在更愿意把 Codex for Chrome 看成一个已经能干活的半自动助手,在不涉及安全、金融、隐私等方面的工作时,会放心交给它,但还是需要有人在旁边盯着,以防出现问题。
当然,浏览器 Agent 对普通用户来说,形态倒是没有那么重要,反而是查资料、写稿、填表、整理网页的时候,它能不能给到帮助。
从这次体验看,Codex for Chrome 已经能做到一部分。它可以帮你跑一些中间步骤,也能把几个原本需要来回切换的网页任务串起来。只不过,它现在还没有到“你说一句话就彻底不用管”的程度。
至于涉及关闭标签页、提交表单、修改后台数据这些动作,现阶段还是要谨慎一点。不是说它完全不能做,而是用户最好知道它做到了哪一步,也最好在关键节点看一眼。说白了,你还是得盯着,不要完全让它全权接管浏览器。
这可能也是 Codex for Chrome 眼下最现实的价值:它没有把浏览器 Agent 一步带到终点,但至少让人第一次感觉到,这件事不是只能停留在演示里。等它再稳一点、再少翻车一点,用户自然会给它更多活干。到那时候,浏览器会不会被 AI 改掉,反而不用急着下结论。先看它能不能把眼前这些小事做好,就够了。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.