网易首页 > 网易号 > 正文 申请入驻

ChatGPT智能体上线,奥特曼:感受到AGI的瞬间,但风险不可忽视

0
分享至

当地时间7月17日,OpenAI推出ChatGPT智能体(ChatGPT agent),整合早期三项突破性进展,让具备思考与行动能力的智能体连接研究与实践。

ChatGPT智能体可以分析竞争对手并制作幻灯片,也可以计划并采购4人份早餐的食材。OpenAI CEO山姆·奥特曼表示,看着ChatGPT智能体借助计算机完成复杂任务,对他来说是一个“感受通用人工智能(AGI)”的瞬间,“那种看着计算机思考、规划并执行任务的感觉确实与众不同。”

不过他也提到,ChatGPT智能体的潜在风险也不容忽视,“如果向家人解释这款产品,我会说它处于技术前沿,尚属试验阶段。这是一个体验未来的机会,但在我们通过实际应用研究并改进它之前,不建议用于高风险场景或涉及大量个人信息的场合。”

具备思考与行动能力,用户可随时中断任务

如今的ChatGPT具备思考与行动能力,能主动从一系列工具库中选择合适工具,为用户从头到尾处理复杂任务。例如它可以查看日程表并结合近期新闻为用户简要介绍即将到来的客户会议、分析三家竞争对手并制作幻灯片。ChatGPT会智能浏览网站、筛选结果、在需要时提示用户安全登录、运行代码、开展分析,甚至生成可编辑的幻灯片和电子表格来汇总其研究成果。

它能帮助用户规划并预订旅行行程、设计并安排整场晚宴、计划并采购4人份早餐的食材。它还能借助ChatGPT连接器让用户关联Gmail、Github等应用,这样就能找到与用户提示词相关的信息并用于回应。用户也可以通过接管浏览器在任意网站登录,从而让它在研究与任务执行中探索得更深、范围更广。总之,它可以在访问和交互网页信息中选择最优路径、高效完成任务。

ChatGPT可以通过自身虚拟计算机执行这些任务,在推理与行动之间流畅切换,根据用户的指令处理复杂流程。最重要的是,控制权始终在用户手中。ChatGPT在执行重要操作前会请求许可,用户随时可以中断任务、接管浏览器或停止任务。

OpenAI表示,这些新功能的核心是一套统一的智能体系统。它整合了早期三项突破性进展的优势,即Operator智能体的网站交互能力、深度研究(deep research)智能体的信息整合能力以及ChatGPT本身的智能与流畅对话能力。

此前,Operator与深度研究各自具备独特优势,Operator能够在网页上滚动、点击和输入,深度研究则擅长分析与总结信息。两者的优势场景各有侧重,Operator无法深入分析或撰写详细报告,深度研究则无法与网站交互以优化结果,也无法访问需要用户身份验证的内容。因此,OpenAI将两者的优势融合在一起。

基准测试表现优异,潜在风险不容忽视

目前,ChatGPT智能体在基准测试中的性能表现优异。在“人类的最后考试”(Humanity’s Last Exam)这项通过广泛学科的专家级问题评估AI性能的测试中,ChatGPT智能体取得41.6的“单次通过率”(Pass@1 SOTA)新纪录。由于智能体动态规划并自主选择工具,面对同一任务时可在不同运行过程中采用多样解法,因此OpenAI通过并行策略扩展测试时,智能体得分进一步提升至44.4。

ChatGPT智能体在“人类的最后考试”中的表现。

FrontierMath是目前已知难度最高的数学基准测试,以未发表的新颖问题为特色,即便是专业数学家往往也需要数小时乃至数天解出。在该测试中,通过终端执行代码等工具,ChatGPT智能体的准确率达到27.4%,大幅超越以往的各类模型。

DSBench旨在评估智能体处理涵盖数据分析与建模的真实数据科学任务的能力。ChatGPT智能体在该测试中的表现显著超越人类水平。例如在DSBench的数据分析测试中,人类得分64.1%,ChatGPT智能体得分89.9%。

ChatGPT智能体在DSBench的数据分析测试中的表现。

即日起,Pro、Plus及Team用户可在任何对话的任意环节,选择“智能体模式”,直接激活ChatGPT的智能体功能。不过,OpenAI表示,尽管ChatGPT智能体已是处理复杂任务的强大工具,但今天的发布只是一个开始。OpenAI将持续迭代,定期推出重大改进,让它逐渐具备更强能力,为更多人提供更实用的帮助。

奥特曼也表示,尽管这款产品的实用性显著,但潜在风险也不容忽视。OpenAI内置了大量安全防护机制和警示功能,并从鲁棒训练、系统防护到用户控制部署了比以往任何时候都更全面的风险缓解措施,但无法预见所有可能的情况。本着迭代部署的原则,OpenAI会向用户发出充分警示,同时允许用户在谨慎考量后自主决定是否采取行动。“如果向家人解释这款产品,我会说它处于技术前沿,尚属试验阶段。这是一个体验未来的机会,但在我们通过实际应用研究并改进它之前,不建议用于高风险场景或涉及大量个人信息的场合。”

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
中国警告日本政府,一旦战争爆发,日本将会有4个方面的下场

中国警告日本政府,一旦战争爆发,日本将会有4个方面的下场

兴史兴谈
2026-01-13 01:18:53
二百多名军官被枪毙、撤职、处分,长津湖战役中失职的志愿军88师

二百多名军官被枪毙、撤职、处分,长津湖战役中失职的志愿军88师

丞丞故事汇
2025-12-28 00:13:54
利物浦球员穿上了新赞助商的服装,球迷调侃萨拉赫像火车司机

利物浦球员穿上了新赞助商的服装,球迷调侃萨拉赫像火车司机

懂球帝
2026-02-01 12:37:35
三大运营商宣布调整电信服务增值税税率,由6%调至9%

三大运营商宣布调整电信服务增值税税率,由6%调至9%

IT之家
2026-02-01 17:56:09
不是危言耸听!假如中美开战,中国输了,全世界都得回到石器时代

不是危言耸听!假如中美开战,中国输了,全世界都得回到石器时代

我心纵横天地间
2026-02-01 13:13:56
田华:一路好走,一家四口都是癌症,却拒绝200万广告代言

田华:一路好走,一家四口都是癌症,却拒绝200万广告代言

潘蠸旅行浪子
2026-01-14 03:43:09
山东明确了!2026年继续提高城乡居民基础养老金,能涨多少?

山东明确了!2026年继续提高城乡居民基础养老金,能涨多少?

财话连篇
2026-02-01 20:04:10
起风了,军权刚到手,委代总统就收命令,立即驱逐中方外交官?

起风了,军权刚到手,委代总统就收命令,立即驱逐中方外交官?

吴欣纯Deborah
2026-01-31 18:15:06
轮胎成为压垮电车车主的稻草,加上超高的保险费,省钱已成为笑话

轮胎成为压垮电车车主的稻草,加上超高的保险费,省钱已成为笑话

柏铭锐谈
2026-01-26 23:50:34
具俊跪在大S墓前哭泣,葛斯齐爆他放弃遗产,是因为交不起遗产税

具俊跪在大S墓前哭泣,葛斯齐爆他放弃遗产,是因为交不起遗产税

无人倾听无人倾听
2026-02-01 03:33:39
个人每次挣钱低于1000元不用交增值税

个人每次挣钱低于1000元不用交增值税

每日经济新闻
2026-02-01 12:25:05
国投白银LOF:本基金将于2月2日开市起至当日10:30停牌 价格涨跌幅限制比例为10%

国投白银LOF:本基金将于2月2日开市起至当日10:30停牌 价格涨跌幅限制比例为10%

每日经济新闻
2026-02-01 19:36:53
又翻车!媒体称赞39岁无腿外卖员很励志,却被网友一边倒怒批!

又翻车!媒体称赞39岁无腿外卖员很励志,却被网友一边倒怒批!

麦杰逊
2025-12-16 14:29:46
被上海街拍惊艳了!满大街都是“大衣裹围巾”,却个个时髦又高级

被上海街拍惊艳了!满大街都是“大衣裹围巾”,却个个时髦又高级

时尚穿搭生活馆
2026-01-27 21:21:35
数名院士呼吁糖尿病患者停止食用,比白糖还粘血管,趁早撤下餐桌

数名院士呼吁糖尿病患者停止食用,比白糖还粘血管,趁早撤下餐桌

王晓爱体彩
2026-01-31 07:20:06
山东大学顺利举办“马杜罗思想体系研讨会”

山东大学顺利举办“马杜罗思想体系研讨会”

必记本
2026-02-01 13:12:33
"反对一刀切!连中成药他们都要搞,简直了!最终受伤的还不是我们!"

"反对一刀切!连中成药他们都要搞,简直了!最终受伤的还不是我们!"

思如哲思
2026-01-31 08:13:53
无需额外硬件?星链配合iPhone18Pro全球联网,国行不能使用!

无需额外硬件?星链配合iPhone18Pro全球联网,国行不能使用!

眼光很亮
2026-01-31 14:00:26
1936年,孙科为讨新欢蓝妮开心,狠心抛弃怀孕的秘书严蔼娟

1936年,孙科为讨新欢蓝妮开心,狠心抛弃怀孕的秘书严蔼娟

古书记史
2026-01-27 00:38:02
可怕不是张本美和夺4冠王!而是赛后发言:要击败王曼昱,夺冠,冲世排第一

可怕不是张本美和夺4冠王!而是赛后发言:要击败王曼昱,夺冠,冲世排第一

好乒乓
2026-02-01 12:57:43
2026-02-02 05:27:00
澎湃新闻 incentive-icons
澎湃新闻
专注时政与思想的新闻平台。
874485文章数 5087775关注度
往期回顾 全部

科技要闻

10亿元宝红包突袭 复刻微信支付还是微视?

头条要闻

爱泼斯坦追逐女孩、安德鲁跪爬女子身上画面全公布

头条要闻

爱泼斯坦追逐女孩、安德鲁跪爬女子身上画面全公布

体育要闻

德约大度祝贺阿卡 幽默互动逗笑纳达尔

娱乐要闻

春晚第三次联排阵容曝光:全是实力派

财经要闻

黄仁勋台北"夜宴":汇聚近40位台企高管

汽车要闻

岚图汽车1月交付10515辆 同比增长31%

态度原创

旅游
艺术
游戏
时尚
教育

旅游要闻

春节必打卡10大榜单聚焦“京味年味”

艺术要闻

上海“高技派”地标:华润中心竣工,LV总部入驻!

末期癌症玩家圆梦《毁灭战士》!id公开致敬

“多巴胺风”又又又火了!这样穿时髦又减龄

教育要闻

鼓楼、玄武、建邺、秦淮多区教育局发布提醒!

无障碍浏览 进入关怀版