一个能自己开浏览器、记你习惯、还能画图的AI同事来了。但最讽刺的是:它越能干,人类越像流水线质检员。
电脑控制权:AI终于长出了"手"
![]()
OpenAI这次给Codex(代码智能体)装了完整的桌面操控能力。不是模拟,是真能看到你的Mac屏幕、移动光标、点击按钮、输入文字。
关键是并行运行。Codex可以在后台开多个智能体干活,不抢你的鼠标键盘。按官方说法,这适合测试App、反复调前端界面——那些让开发者抓狂的重复劳动。
但有个地理歧视:欧盟和英国用户暂时用不了这功能。OpenAI没说原因,大概率是合规卡壳。技术越激进,监管越谨慎,这个等式在AI时代反复上演。
记忆系统:从工具变成"熟人"
以前的AI每次对话都失忆。现在Codex会记住你的偏好、常用工作流、技术栈选择。
更实用的是自动化续工。它能从暂停处恢复,用已有对话线程接着干,还能给自己排期——今天没做完的,下周自动续上。跨天、跨周的任务执行,对长期项目是个质变。
不过企业版和教育版用户暂时享受不到。OpenAI的 rollout 策略很明显:先喂饱个人开发者,再谈B端合规。这种"先民间后庙堂"的路子,和当年ChatGPT如出一辙。
浏览器内置:注释比聊天更高效
Codex现在内置浏览器,支持直接在网页上批注给指令。这比在聊天框里描述"第三张图下面的按钮"精准得多。
未来还会开放完整浏览器能力:开网站、跑用户流程、截图、检查结果。翻译一下:AI能独立完成"打开竞品页面→截图对比→输出分析报告"这种完整工作流。
产品经理们应该警惕了。很多初级竞品分析、用户调研,很快会被这类工具吃掉。
图像生成:产品经理的草图外包
Codex接入了gpt-image-1.5,能在应用内直接出图。官方定位很明确:产品概念图、设计稿 mockup。
这对非设计背景的开发者是刚需。以前要开Figma、找模板、或者求设计师,现在一句话生成。但别指望它能替代专业设计——mockup 到可落地UI,中间还隔着十万八千里。
真正的影响是压缩了"想法→可视化"的周期。验证成本越低,试错越快,这是创业公司的隐形杠杆。
90+插件:生态比功能更重要
这次更新了90多个新插件,能组合技能、接入应用、连MCP(模型上下文协议)服务器。MCP是Anthropic去年推的标准,现在OpenAI也跟进了。
插件生态的玩法很清晰:Codex本身不做重,靠连接器吃遍各家数据。GitHub评论处理、多终端标签、PDF和表格的侧边栏预览——这些不是炫技,是减少上下文切换的摩擦力。
摩擦力每少一点,AI替代人类决策的边界就推进一点。
实用判断:三类人的应对清单
这次更新释放的信号很直白:AI编码工具正在从"辅助写代码"转向"代理完整任务"。对三类人有具体影响:
开发者:尽快建立"AI first"的工作习惯。把Codex当实习生用——给明确边界、验收标准、迭代反馈。你的价值转向任务拆解和质量把控,而非代码产量。
技术管理者:评估团队人效结构。如果Codex能并行跑多个任务,单人产出模型要重算。但别急着砍人头,先观察3个月真实使用率,很多"强大功能"会被闲置。
欧盟/英国从业者:地理限制是双刃剑。短期少了工具红利,长期可能倒逼出更规范的AI协作流程——当别人的AI在野蛮生长时,你有窗口期建立人机协作的标准操作手册。
最后一点冷观察:Codex越像"同事",人类越像"监工"。这个身份转换比任何技术细节都更值得警惕——当你习惯只验收不创造,创造力本身会萎缩。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.