网易首页 > 网易号 > 正文 申请入驻

ChatGPT智能体正式发布,多个创业赛道昨夜无眠

0
分享至

白交 雷刚 发自 纽凹非寺
量子位 | 公众号 QbitAI

实用,太实用了!这才是OpenAI Agent该有的样子。

就在刚刚,OpenAI最新发布来了,ChatGPT Agent正式对外亮相。

这是一个把“想”“干”统一了的智能体,之前深度研究的思考和分析能力,Operator的操作执行能力,在ChatGPT Agent实现了统一。

而且ChatGPT Agent还可以接管你的整个电脑——这几乎就是全新的操作系统了。

能做什么?

工作场景里,安排和改期会议、生成PPT、制定出差和外出议程、自动提交报销……几乎就是大厂高管才能配置的助理的核心工作。

生活场景下,你个人的旅游行程规划设计、重大活动如婚礼晚宴安排……一些定期需要手动更新的认证证明……差不多也是董事长CEO们个人秘书实现的能力。

但现在,ChatGPT Agent一夜之间人人都可拥有。OpenAI还专门配备了专用模型,创造了全新的SOTA,刷新了模型能力新纪录。

之前,通用Agent们只敢自称“实习生”,但OpenAI在自研底层模型能力的底气下,几乎就把“实习生”变成了“大秘书”。之前一个创业赛道,分分钟变成了大厂产品里的一个功能按钮。

这也是ChatGPT Agent注定不会让所有人都开心的地方。

此前不论是在“想”还是“做”上做产品功能创新的Agent创业者,今夜难眠,又要被重新审视核心壁垒和竞争力了。

总之,把Operator和深度研究实现“二合一”的ChatGPT Agent,不止于1+1。

ChatGPT Agent详解:All in ONE

这次新发布,名字简单直接:ChatGPT Agent。

入口没有变——还是在原来页面「工具」下拉激活「智能体模式」即可。只是ChatGPT已经不再是以前的ChatGPT了,而是具备“Agent”能力的ChatGPT了。

具体如何做的?

就是将以往Operator的「网站交互」能力,DeepResearch这种「整合高质量信息」的能力,以及ChatGPT的对话能力等等,全部All in One,形成一个统一的智能体系统

这样一来,能做的那就多了去了。

仅单一模型就可以主动与网站互动、筛选并获取最高效的结果。

比如它可以制作公司吉祥物漫画风贴纸,然后再订购500张并送到某个地址。

先整合搜索-再推理创作-再执行任务,一气呵成~

以往的浏览网页、制定行程、制作文档等各方面的体验,都实现了升维。

比如生成表格吧,它可以在这基础上保持原有格式的同时,用新的财务数据来随时更新表格。

不过这里有个华点,仔细看这个过程,它不是通过打开PPT插入文本框,而是编写代码生成一个看起来很像的表格。(Doge)

此外,你还可以设置固定时间执行,比如每周一生成周报啥的。

还有像规划并预订旅行行程,可以具体到某个环节的设计和预订,或者帮你寻找专业人士并安排预约。

他们强调,整个过程人类始终都掌握控制权,不仅可随时中断操作、接管浏览器或停止任务,它在执行重要操作前也会征得你的许可。

即日起,Pro、Plus 和Team版用户就可以感受到这种工作与生活的体验全面升维。

Pro版用户每月可执行近乎无限的任务,其他付费用户每月可执行 50 次任务,额外使用量可通过灵活的积分额度选项获取。

而企业版和教育版的用户将在7月获得使用权限。

免费等等党可以再蹲蹲,万一什么时候就有了呢。

不过需要明确的是,ChatGPT Agent也算不上全新的模型,而是与OpenAI o3 还是属于一个家族。

这个模型经过了专门的训练,能够在执行任务时会动态学习,通过优化速度、准确性和效率来调整其工作方式——

每个步骤中识别并运用最适合的工具,通过评估结果而非固守固定方法来优化流程。

他们也还配备了所有可用的网络工具:通过图形用户界面与网络交互的可视化浏览器、用于简单推理型网络查询的文本浏览器,以及直接API访问权限。

有了不同的访问和交互路径,保证ChatGPT能够在推理与执行之间流程转换。

比如它可以快速通过 API 获取财务数据或体育赛事比分,同时也能与主要面向人类设计的网页进行视觉交互。

ChatGPT Agent在专门优化之后,相比于以往几个模型,网页浏览、执行现实世界任务能力方面实现了SOTA。

比如在「人类最后的考试」中,一举取得了41.6分。该测试集是出了名的超难,刚推出时无模型得分能超过10分。

在 DSBench⁠ 测试中,该测试旨在评估智能体在涵盖数据分析和建模等现实数据科学任务中的表现,ChatGPT 智能体显著超越了之前的最先进模型。

尤其在数据分析任务中,其表现明显优于人类水平。

还有在SpreadsheetBench,同样实现了SOTA。

这个评测主要是是来评估模型处理真实场景中的电子表格编辑任务的表现。

结果ChatGPT Agent相比于GPT-4o提升了超过一倍。当具备直接编辑电子表格的能力时,ChatGPT Agent 的得分进一步提升至45.5%。

不过在最后,他们也强调了这个模型也存在一定的风险。他们自己的“防范框架”将其定义为具有“放大现有严重危害途径”能力的模型。

虽然目前还没有直接证明,但他们已经有了些额外的安全措施,比如有个实时监视器,在每次回答前会判断这个问题有没有风险,比如生物相关,是否会给人类带来威胁;还有那种高风险的金融投资啊、敏感法律任务等等,都会主动拒绝。并且为了防止滥用,还禁用了记忆功能

怎么看ChatGPT Agent带来的变革?

毫无疑问,ChatGPT Agent带来的变革,可能要比OpenAI之前的Agent试水要大得多深远得多。

Agent算是一个曾经科幻的概念,《钢铁侠》中的贾维斯,就是对Agent的“终极幻想”。

但AI Agent的推进,似乎又才刚刚开始。

在基础大模型能力不断强大之后,Agent开始被视为大模型应用的核心产品,Agent也成为了今年最热创新和创业赛道。

如果把视野拓展到企业级、工业级应用里,Agent的创新和发展就更早了。

AI客服实际就是最隐秘但又实际发展最快速的应用,而且带来的价值替代非常明显——现在找人工客服已经是相当困难了。

在AI客服之外,AI编程、AI绘图、AI PPT等垂直专用能力,也都在狂飙突进…

但更值得关注的是通用Agent的推进,即AI可以真正像人一样,接管你的上网甚至电脑。

OpenAI在这个方向推进上算是慢的。早在去年10月,Claude的母公司Anthropic就推出了名为“Computer Use”的工具,能够像人类一样使用电脑,“代表”用户完成任务。

如果只是“想”的层面,具体到撰写分析研究报告的Agent就更多了,海外有OpenAI、Google 和 Perplexity,国内则有秘塔、Kimi等等。

在手机端,华为、小米、OPPO、vivo和荣耀等等在内的公司,都在试水Agent,让AI自动帮你完成订咖啡、接推销电话——虽然那边也是AI打的,以及更多之前需要人自己“想”和“干”才能完成的工作。

而这就是趋势:一个全新的由AI贯穿始终的操作系统或者全新产品形态,正在汹涌而至。

如果保守来看,Agent会率先重塑如今互联网相关的一切,重塑我们互联网实现的对工作和生活的塑造。

PC时代的互联网核心塑造是“网站”,智能手机时代是“APP”,到了AI时代就是“Agent”。

PC互联网时代是千人一面,门户网站是其代表。

移动互联网时代可以千人千面,推荐算法下诞生了抖音Tiktok这样的全新超级应用。

那么Agent互联网在呢?会有怎样全新的应用?又有谁会站上浪潮之巅?

问题还没有答案,但问题的答案,已经在被深度研究、自动执行了。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
OPPO母亲节文案冒犯公序良俗,中广协、武大发声

OPPO母亲节文案冒犯公序良俗,中广协、武大发声

南方都市报
2026-05-10 20:27:01
北方迎高温“快闪” 之后,冷空气将“断崖式”降温

北方迎高温“快闪” 之后,冷空气将“断崖式”降温

中国能源网
2026-05-11 10:22:05
心理学上有个效应:父母越勤快,孩子越自私;学会“放手”这两件事,孩子未来越成功

心理学上有个效应:父母越勤快,孩子越自私;学会“放手”这两件事,孩子未来越成功

心理观察局
2026-05-09 09:10:22
把瑜伽裤穿成日常的松弛感美女

把瑜伽裤穿成日常的松弛感美女

只要高兴就好
2026-04-13 14:30:30
烂就是烂,永远不能指望的国民党

烂就是烂,永远不能指望的国民党

超级学爸蛋总
2026-05-11 07:58:42
华西村被骂死爱面子的3亿金牛,15年后成功逆袭!变身最强压舱石

华西村被骂死爱面子的3亿金牛,15年后成功逆袭!变身最强压舱石

三农雷哥
2026-05-10 17:46:34
有暴雨大暴雨!广东下一轮强对流天气时间,确定了

有暴雨大暴雨!广东下一轮强对流天气时间,确定了

鲁中晨报
2026-05-11 07:26:07
杨鸣一句话撕开山东遮羞布:没了打封闭的铁人,平民球队只剩绝望

杨鸣一句话撕开山东遮羞布:没了打封闭的铁人,平民球队只剩绝望

林子说事
2026-05-11 09:45:50
回顾深圳母子神秘失踪,14年后,房东在出租屋纸箱里发现干尸

回顾深圳母子神秘失踪,14年后,房东在出租屋纸箱里发现干尸

莫地方
2026-05-11 01:15:03
老伴凌晨心梗,我打女儿8个电话没人接,女婿:你能不能懂点分寸

老伴凌晨心梗,我打女儿8个电话没人接,女婿:你能不能懂点分寸

木言观
2026-05-10 07:02:33
高市早苗好狠:赶在特朗普访华前,给了他一刀,连中国都没想到!

高市早苗好狠:赶在特朗普访华前,给了他一刀,连中国都没想到!

次元君情感
2026-05-10 21:14:41
梁靖崑都没想到,王皓竟然因为一句话,直接被封神级赛场心理导师

梁靖崑都没想到,王皓竟然因为一句话,直接被封神级赛场心理导师

汪镛的创业之路
2026-05-11 11:53:15
分手29年后,肖战成国乒副总教练,而她嫁给富商,已是大学教授

分手29年后,肖战成国乒副总教练,而她嫁给富商,已是大学教授

做一个合格的吃瓜群众
2026-04-06 10:16:48
老兵不死!周鹏续写传奇,深圳晋级四强,冲冠之路仍有短板

老兵不死!周鹏续写传奇,深圳晋级四强,冲冠之路仍有短板

诺诺谈史
2026-05-11 12:24:56
这跟不穿有啥区别?内裤外露、开叉开到腰,有钱人的时尚真看不懂

这跟不穿有啥区别?内裤外露、开叉开到腰,有钱人的时尚真看不懂

潮鹿逐梦
2026-03-02 17:19:02
随巴萨夺得西甲冠军,拉什福德职业生涯首次夺得联赛冠军

随巴萨夺得西甲冠军,拉什福德职业生涯首次夺得联赛冠军

懂球帝
2026-05-11 05:17:17
“日光盘”重现、认购破千套:楼市的信心,涨回来了?

“日光盘”重现、认购破千套:楼市的信心,涨回来了?

秦朔朋友圈
2026-05-11 00:03:51
“太疯狂”!价格大跳水!深圳多家超市排长队,一上架遭疯抢!网友:刚买完

“太疯狂”!价格大跳水!深圳多家超市排长队,一上架遭疯抢!网友:刚买完

南方都市报
2026-05-11 07:55:34
尼克斯横扫费城:唐斯与恩比德的命运与角色

尼克斯横扫费城:唐斯与恩比德的命运与角色

张佳玮写字的地方
2026-05-11 06:55:13
坐不住?美企CEO放话:若中国搞定先进光刻机,就会掀翻芯片格局

坐不住?美企CEO放话:若中国搞定先进光刻机,就会掀翻芯片格局

Thurman在昆明
2026-05-10 12:13:29
2026-05-11 13:56:49
量子位 incentive-icons
量子位
追踪人工智能动态
12600文章数 176461关注度
往期回顾 全部

科技要闻

黄仁勋:你们赶上了一代人一次的大机会

头条要闻

媒体:特朗普确定本周访华 中美在东亚有个共同的敌人

头条要闻

媒体:特朗普确定本周访华 中美在东亚有个共同的敌人

体育要闻

那个曾让詹姆斯抱头的兄弟,40岁从大学毕业了

娱乐要闻

谢霆锋没想到,王菲靠张艺谋重返巅峰

财经要闻

"手搓汽车"曝光:伪造证件、电池以旧代新

汽车要闻

全球化成国内车企未来胜负手,谁是出海最强"水手"?

态度原创

教育
健康
旅游
家居
公开课

教育要闻

高中持续扩招,录取位次面临“大洗牌”,家长不用慌了?

干细胞能让人“返老还童”吗

旅游要闻

核心路线!四川剑门关空气清新氧气充足,一夫当关千年一叹!

家居要闻

多元生活 此处无声

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版