网易首页 > 网易号 > 正文 申请入驻

OpenAI突发AI智能体大招,像人一样操作电脑,解放打工人神器

0
分享至


智东西
编译 程茜
编辑 云鹏

OpenAI的首款AI智能体来了!

智东西1月24日消息,今天凌晨,OpenAI CEO萨姆·阿尔特曼(Sam Altman)发起直播,发布了首款可以像人类一样操作电脑独立完成任务的AI智能体——Operator


打开Operator,用户只需要输入自己的需求,就可以双手离开键盘,静静等待Operator“表演”,订票、买日用品、填写表格等诸多任务能被迅速搞定。

用户可以实时查看它的进度,并随时介入。遇到需要用户的付款信息、家庭住址这些隐私信息,Operator也会主动暂停让用户接管操作。

从今天开始,Operator将向美国ChatGPT Pro用户提供。未来,OpenAI计划把Operator扩展到Plus、Team和Enterprise用户,并将这些功能集成到ChatGPT中。

阿尔特曼将Operator的发布称作是:“进入Level 3的开始。”

他还在直播中预告,Operator是OpenAI首批智能体之一,他们将在未来几周和几个月内推出更多智能体

一、解放双手,搞定手写list到送货上门、全额退款、许可证更新

用户只需要描述任务,Operator就可以完成后续的步骤。用户可以随时选择接管远程浏览器的控制权,遇到登录、付款详细信息或输入验证码等涉及用户隐私的环节,Operator会主动要求用户接管。

用户在纸上记录的日用品购买list,可以直接拍照上传发送给Operator,它就会自动识别任务,然后执行一系列的购买操作。

此外预订时,遇到需要确认的时间点,Operator也会及时询问用户在获得反馈后执行下一步操作。

Operator还能帮助用户完成订单的全额退款。

为用户检索合适的露营地。

用户可以通过为所有站点或特定站点添加自定义说明,例如为Booking.com上的航空公司设置首选项,Operator在执行相应操作时就会优先考虑用户的设置。

此外,Operator允许用户保存提示以便在主页上快速访问,例如在订购日用百货等重复性任务。与在浏览器上使用多个选项卡类似,用户可以通过创建新对话让Operator同时运行多个任务,例如在订购桌子的同时询问用户聚会需要的食物类型。

二、底层模型CUA,自主完成输入、单击、滚动

Operator由新模型Computer-Using Agent(CUA)提供支持。CUA通过强化学习将GPT-4o的视觉功能与高级推理相结合,经过训练可以与人们在屏幕上看到的按钮、菜单和文本字段等图形用户界面(GUI)交互。

具体的操作方式包括,查看浏览器(通过屏幕截图)和与浏览器交互(使用鼠标和键盘允许的所有操作),这使能够在浏览器上执行操作,无需自定义API集成。

CUA的具体操作通过集成感知、推理和操作的迭代循环运行:

感知:计算机的屏幕截图将添加到模型的上下文中,从而提供计算机当前状态的可视化快照。

推理:CUA使用思维链推理后续步骤,同时考虑当前和过去的屏幕截图和操作。这使模型能够评估其观察结果、跟踪中间步骤并动态适应,从而提高任务绩效。

操作执行单击、滚动或键入操作,直到确定任务已完成或需要用户输入。虽然CUA会自动处理大多数步骤,但会寻求用户确认敏感操作。

如果在操作中遇到问题,Operator可以利用其推理能力进行自我纠正。且如果需要帮助,该智能体就会将控制权交给用户。

虽然CUA仍处于早期阶段并且存在局限性,但它在WebArena和WebVoyager这两个关键的浏览器使用基准测试中,在OSWorld上实现38.1%的完全计算机使用任务的成功率,在WebArena上实现58.1%的成功率,在WebVoyager上实现87%的基于浏览器的任务成功率。

三、三层保障,限制Operator操作

为了确认Operator的安全性,OpenAI设置了三层保护措施。

首先,Operator经过培训,以确保使用它的人始终处于控制之中,并在关键点要求用户输入。

接管模式:Operator在浏览器中输入敏感信息(如登录凭证或支付信息)时要求用户接管。在接管模式下,Operator不会收集用户输入的信息或对其进行屏幕截图。

用户确认:在完成任何重大操作(例如提交订单或发送电子邮件)之前,Operator应请求批准。

任务限制:Operator接受过拒绝某些敏感任务的培训,例如银行交易或需要高风险决策的任务,例如对工作申请做出决定。

监视模式:在特别敏感的站点(例如电子邮件或金融服务)上,Operator需要密切监督其操作,使用户能够直接捕获任何潜在的错误。

其次,OpenAI简化了Operator管理数据隐私的过程。

训练选择退出:在ChatGPT设置中关闭“为每个人改进模型”意味着Operator中的数据不会用于训练其模型。

透明的数据管理:用户可以在Operator设置的Privacy部分下一键删除所有浏览数据并注销所有站点。Operator中的历史对话记录也可以一键删除。

最后,OpenAI建立了防御措施,抵御可能试图通过隐藏提示、恶意代码或网络钓鱼尝试来误导Operator的网站:

谨慎导航:Operator旨在检测和忽略提示注入。

监控:专用的“监控模型”会监视可疑行为,如果出现问题,可以暂停任务。

检测pipeline:自动化和人工审查流程持续识别新威胁并快速更新保护措施。

此外,OpenAI将Operator设计为拒绝有害请求并阻止不允许的内容,其审核系统会对重复的违规行为发出警告甚至撤销访问权限,并且集成了额外的审核流程来检测和解决滥用问题。

结语:Operator处理复杂工作流程仍有局限

Operator目前处于早期研究预览阶段,在面对制作PPT、管理日历等复杂任务方面它的表现并不好,但Operator目前已经能独立完成诸多用户日常会遇到的任务。下一步,OpenAI计划很快在API中公开为Operator提供支持的模型CUA,以便开发人员可以使用它来构建自己的计算机使用代理,同时会继续提高其处理更长、更复杂工作流程的能力。

此前谷歌、Anthropic、智谱AI都发布了类似支持自动检索并跨平台操作的智能体,这类智能体的出现进一步降低了用户与计算机的交互门槛,用户可通过简单指令让 智能体完成复杂任务,无需掌握专业技能或操作知识。

来源:OpenAI官网

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
吴向飞再回应李荣浩:这些年只要我参与的诉讼,最终对方全部败诉

吴向飞再回应李荣浩:这些年只要我参与的诉讼,最终对方全部败诉

小徐讲八卦
2026-03-30 07:47:00
国足战喀麦隆或变阵3中卫!训练曝光防线首发:朱辰杰+4位U23红星

国足战喀麦隆或变阵3中卫!训练曝光防线首发:朱辰杰+4位U23红星

我爱英超
2026-03-30 10:26:14
张雪峰女儿亲自辟谣!父母恩爱没离婚,回应三个问题,口才很意外

张雪峰女儿亲自辟谣!父母恩爱没离婚,回应三个问题,口才很意外

离离言几许
2026-03-27 14:42:23
张雪峰:想让孩子越来越自律?请把这5句话,刻进骨子里天天说

张雪峰:想让孩子越来越自律?请把这5句话,刻进骨子里天天说

户外阿毽
2026-03-29 18:57:08
昔日痞帅学长!张雪峰大学旧照,眼神桀骜不驯,自带野劲!

昔日痞帅学长!张雪峰大学旧照,眼神桀骜不驯,自带野劲!

乐悠悠娱乐
2026-03-30 11:05:46
A股分红派息转增一览(3月30日):1股今日股权登记

A股分红派息转增一览(3月30日):1股今日股权登记

每日经济新闻
2026-03-30 07:59:53
伊朗切断自己的退路,停战3条件震动全球,47年恩怨要做了断

伊朗切断自己的退路,停战3条件震动全球,47年恩怨要做了断

兴史兴谈
2026-03-29 12:13:24
老赖黄淑芬把人撞成植物人, 宁可坐牢也不赔偿, 后续结局大快人心

老赖黄淑芬把人撞成植物人, 宁可坐牢也不赔偿, 后续结局大快人心

观察鉴娱
2026-03-07 10:26:48
4月1日医保新政:家有高血压、糖尿病、心脏病的,抓紧办

4月1日医保新政:家有高血压、糖尿病、心脏病的,抓紧办

小谈食刻美食
2026-03-30 08:26:34
卡塔尔公主到访京东美术馆 章泽天与京东CEO许冉陪同

卡塔尔公主到访京东美术馆 章泽天与京东CEO许冉陪同

快科技
2026-03-30 09:29:05
教练内讧的背后,是泰山队教练组存在三股势力,韩鹏已被架空

教练内讧的背后,是泰山队教练组存在三股势力,韩鹏已被架空

姜大叔侃球
2026-03-30 11:10:10
晴天霹雳!武汉孕期女子哭诉丈夫突然被裁,房贷4500,生活或停摆

晴天霹雳!武汉孕期女子哭诉丈夫突然被裁,房贷4500,生活或停摆

火山詩话
2026-03-30 07:26:27
一艘俄罗斯油轮获美方“放行”驶向古巴,特朗普:不反对其他国家向古巴供应石油

一艘俄罗斯油轮获美方“放行”驶向古巴,特朗普:不反对其他国家向古巴供应石油

每日经济新闻
2026-03-30 11:08:09
中国为什么没有干预美伊战争?

中国为什么没有干预美伊战争?

宇视天下
2026-03-29 09:36:36
单依纯明目张胆侵权他人作品,拒不道歉,李荣浩4连问硬刚到底

单依纯明目张胆侵权他人作品,拒不道歉,李荣浩4连问硬刚到底

上观新闻
2026-03-29 17:56:07
交通运输部检查指导组在吉林检查时发现“百吨王”多发频发

交通运输部检查指导组在吉林检查时发现“百吨王”多发频发

界面新闻
2026-03-30 11:14:13
演员李尚宝去世终年45岁,曾患抑郁症街头狂奔精神异常,公司回应

演员李尚宝去世终年45岁,曾患抑郁症街头狂奔精神异常,公司回应

韩小娱
2026-03-28 13:31:17
CBA最新消息!广东男篮离队第三人曝光,天赋锋线或寻求交易?

CBA最新消息!广东男篮离队第三人曝光,天赋锋线或寻求交易?

绯雨儿
2026-03-30 12:31:30
学医后才知道,保护心血管最好的运动,不是快走慢跑,而是这个

学医后才知道,保护心血管最好的运动,不是快走慢跑,而是这个

健康之光
2026-03-29 13:25:06
家人突发心梗,第1步千万别先喂硝酸甘油!做对3件事,才真的救命

家人突发心梗,第1步千万别先喂硝酸甘油!做对3件事,才真的救命

冷眼看世界728
2026-03-28 20:11:50
2026-03-30 13:11:00
智东西 incentive-icons
智东西
聚焦智能变革,服务产业升级。
11463文章数 117018关注度
往期回顾 全部

科技要闻

DeepSeek性能异常问题已解决,服务恢复

头条要闻

牛弹琴:伊朗越打越聪明了 一场更猛烈的风暴即将到来

头条要闻

牛弹琴:伊朗越打越聪明了 一场更猛烈的风暴即将到来

体育要闻

绝杀卫冕冠军后,他单手指天把胜利献给父亲

娱乐要闻

单依纯凌晨发长文道歉!李荣浩再回应

财经要闻

油价冲击,有些亚洲货币先扛不住了!

汽车要闻

理想i9要来了!外形似小号MEGA 能冲击高端纯电市场?

态度原创

亲子
艺术
旅游
公开课
军事航空

亲子要闻

远嫁韩国,奶奶生病双胞胎主动照顾

艺术要闻

600 年前的「产亡孤魂」,藏着中国女性最痛的记忆

旅游要闻

相约文旅盛会 发现宝藏山东|走进山东古建筑博物馆

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

美两栖攻击舰载3500名增援到达

无障碍浏览 进入关怀版