网易首页 > 网易号 > 正文 申请入驻

5分钟顶人类8小时!OpenAI Deep Research订阅全推送,端到端强化微调是关键

0
分享至

新智元报道

编辑:KingHZ 英智

【新智元导读】最近,OpenAI的研究团队在采访中表示,全新的Deep Research功能,可以为你节省几个小时甚至几天的时间!

Deep Research(深度研究)是继「Operator」之后,OpenAI推出的第二个智能体,利用模型的推理能力,综合分析浩瀚的互联网信息,从而完成复杂的研究任务。

月初,OpenAI首先向ChatGPT Pro用户开放了Deep Research功能。最近,进一步开放给了更多等级的订阅用户。

其中,Plus、Team、教育和企业用户每月10次查询机会,Pro用户每月120次机会。

OpenAI对新功能寄予厚望:

它能在几分钟内完成人类需要数小时才能完成的工作 。 综合知识的能力是创造新知识的先决条件。 因此,深度研究标志着我们在开发AGI(通用人工智能)这一更广泛目标上迈出了重要一步。 长期以来,我们一直设想AGI能够进行创新性科学研究。

奥特曼表示:这是他最喜欢的已发布的功能之一。

此次更新,固然给用户带来了新体验,「钱没白花」。

但考虑到每月最多使用10次,新功能显得「鸡肋」:

考虑到同一梯队的竞争对手,不仅类似功能推出的更早,而且免费,OpenAI这次发布,的确算不上出彩。

那这次OpenAI都推出哪些新特性?为什么这次落后竞争对手了呢?

技术报告发布

在X上,OpenAI连发多条消息,介绍深度研究相关更新情况。

除更多用户可用之外,本次更新的主要改进为:

在输出中嵌入带引用的图片 更好理解和参阅上传的文件

然后,其他改进呢?无。

至于,没什么落后竞争对手,OpenAI给出的解释是为了控制风险,保证安全:

在推出深度研究并将其提供给Pro用户之前,我们进行了严格的安全性测试、准备评估和治理审查。 我们还进行了额外的安全性测试,以更好地了解与深度研究浏览网页能力相关的逐步风险,并添加了新的缓解措施。重点工作包括加强对在线发布的个人信息的隐私保护,并训练模型抵抗在互联网搜索过程中,可能遇到的恶意指令。 在广泛发布深度研究之前,我们花时间进行了更多的人工探测和自动化测试,以评估特定风险。

在官网发布的系统卡(System card),OpenAI从提示注入、禁止内容、隐私、运行代码能力、偏见和幻觉等方面,全面测试、评估并缓解了系统安全问题。

OpenAI展示了一系列测试结果,最后认为

总体上,深度研究在准备框架(Preparedness Framework)中被归类为中等风险,并且已采取相应的保障措施和安全缓解措施,为这个模型做好了准备。

值得关注的是,在模型自主性方面,在处理更长时间跨度和智能体任务时,深度研究性能有所改进,尤其是在模型自主性风险相关的任务中。

比如,在SWE-Bench Verified评测中,深度研究展现了执行明确定义的编程任务的能力,被评定为中等风险水平。

已有网友给出了全面的总结:

更多安全测试结果与分析,参阅OpenAI官方系统卡:

文档链接:https://cdn.openai.com/deep-research-system-card.pdf

尴尬之处在于,已免费推出相关功能的Grok-3,以安全性著称。

红杉采访亮点

红杉资本合伙人Sonya和Lauren,与OpenAI Deep Research的产品负责人Isa和Josh展开了深度对话。

当问及2025年的风口时,Isa和Josh不约而同地回答:「智能体」。

Deep Research是OpenAI在「Operator」之后推出的第二个智能体。通过端到端的强化学习训练,Deep Research能像经验丰富的研究员一样,查资料、思考并完成全面的报告。

这不仅是节省5%时间,而是将原本需要8小时的任务缩减到5分钟!

Deep Research无法为你完成一切,但它能为你节省几个小时,甚至是几天。

Isa表示:「我确信它会成为人们生活中不可或缺的一部分。」

从行业分析到医学研究,再到计划生日派对,Deep Research几乎无所不能。

Deep Research不是普通的搜索工具,它能广泛收集有关来源的信息,擅长在互联网上找到小众的事实,并整合到一个漂亮、整洁的报告中,嵌入图表,并附上指向原始信息的引用。

当你想寻找特定的信息,并需要搜寻大量资料时,它才能发挥出最佳水平。它很擅长寻找和综合信息,但Isa不认为Deep Research当前能做出新的科学发现。

应用场景

Deep Research常被应用于科学研究、医学研究等领域。人们用它来了解市场、公司和房地产等。

Isa的朋友正考虑创办一家消费品公司,会用它来做竞品调研,查看特定域名是否被占用,以及估算市场规模。

出人意料的是,用户会用Deep Research搜索代码,查找关于某个软件包的最新文档,并帮他们编写脚本。

Deep Research不仅能用于工作,在购物和旅行建议上也很有用。比如想买一辆新车时,可以请它整理一份报告。在日本发布Deep Research功能时,它可以用来帮忙寻找餐厅。

个性化教育也是非常有趣的场景,如果想复习生物学知识,它会是个好帮手。

输入想了解的信息,它会为你整理出一份很棒的报告。

技术架构

驱动Deep Research的是o3模型的微调版本 ,o3是OpenAI最先进的推理模型。

模型针对困难的搜索和推理任务进行了训练,可以调用浏览工具和Python工具。通过在这些任务上进行端到端训练,模型学会了在线搜索和分析。

Deep Research最大的创新在于「端到端训练」。研究的过程中,很多事是无法预测的。Isa认为没有脚本能像训练出的模型那样灵活,能对实时的信息做出反应。

Deep Research在做有创造性的搜索,查看思维链总结会发现,它在想出下一个要查找的内容方面非常聪明。

Josh表示「我们经常误以为自己写代码会比模型更聪明,但实际上,模型通常会提出更好的解决方案。」

强化学习微调很可能是构建强大智能体的关键!

Yann LeCun有个「蛋糕比喻」,无监督学习是蛋糕,监督学习是糖霜,强化学习是顶部的樱桃。

成功的秘诀是构建高质量的数据集,数据质量是决定模型质量的最大因素。

Josh认为「AGI」目前只是运营问题。

参考资料:

https://www.youtube.com/watch?v=bNEvJYzoa8A

https://cdn.openai.com/deep-research-system-card.pdf

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
德比大战热度飙升!米兰名宿称中场是关键,国米9号伤愈积极请战

德比大战热度飙升!米兰名宿称中场是关键,国米9号伤愈积极请战

星Xin辰大海
2025-11-18 12:17:46
看63岁林芳兵和59岁陶慧敏,才知上了年纪,会打扮比好身材更重要

看63岁林芳兵和59岁陶慧敏,才知上了年纪,会打扮比好身材更重要

大铁猫娱乐
2025-11-09 16:47:23
事实证明,“消失”7年的周立波,早已经走上了一条“不归路”

事实证明,“消失”7年的周立波,早已经走上了一条“不归路”

优趣纪史记
2025-08-13 18:46:36
耿宝昌先生遗体告别仪式,在京举行

耿宝昌先生遗体告别仪式,在京举行

新京报
2025-11-17 20:34:28
被抵毁的“东南互保”:实质是不抵抗的爱国

被抵毁的“东南互保”:实质是不抵抗的爱国

深度报
2025-11-17 23:00:01
中超第30轮:英博对阵海港,赛前传3喜4忧,海港有望取胜

中超第30轮:英博对阵海港,赛前传3喜4忧,海港有望取胜

小七七体育解说
2025-11-18 11:04:46
仅差262分!仅差569分!哈登迎来2项神级里程碑,快船不配拥有你

仅差262分!仅差569分!哈登迎来2项神级里程碑,快船不配拥有你

世界体育圈
2025-11-18 11:47:59
为什么“战略忽悠局局长”张召忠,突然消失了,去哪里了?

为什么“战略忽悠局局长”张召忠,突然消失了,去哪里了?

阿斚田侃故事
2025-11-03 22:56:11
抢在解放军演习前,自卫队叫嚣击沉福建舰,055抵近日本土亮剑

抢在解放军演习前,自卫队叫嚣击沉福建舰,055抵近日本土亮剑

梁讯
2025-11-18 11:45:34
王楚钦被牵扯!央视揭露令人震惊的“隐私链条”真相!

王楚钦被牵扯!央视揭露令人震惊的“隐私链条”真相!

舞指飞扬
2025-11-18 09:10:27
650万发炮弹打光,朝军血战波兰和美国雇佣兵,朝鲜帮了普京大忙,经过这一战,俄朝关系更紧密,而战后重建,朝鲜也能分一杯羹

650万发炮弹打光,朝军血战波兰和美国雇佣兵,朝鲜帮了普京大忙,经过这一战,俄朝关系更紧密,而战后重建,朝鲜也能分一杯羹

军霆说
2025-11-18 11:09:04
多部日本电影撤档!《鬼灭之刃》遭抵制,回本艰难退票人次超百万

多部日本电影撤档!《鬼灭之刃》遭抵制,回本艰难退票人次超百万

娱圈小愚
2025-11-18 09:48:30
太嚣张!山西反杀案当晚申家儿子不在场,郭某夫妇竟对警方撂狠话

太嚣张!山西反杀案当晚申家儿子不在场,郭某夫妇竟对警方撂狠话

爱写的樱桃
2025-11-16 21:36:38
活了101岁的英王太后,很有远见,把遗产大部分留给了哈里

活了101岁的英王太后,很有远见,把遗产大部分留给了哈里

喜欢历史的阿繁
2025-11-14 15:35:44
6国外援候命,高市通知全球,对华打响第二枪,中方被逼上硬菜

6国外援候命,高市通知全球,对华打响第二枪,中方被逼上硬菜

来科点谱
2025-11-17 09:09:40
陈数:14年幸福婚姻,被赵胤胤狠狠撕碎,爱情终究还是败给了现实

陈数:14年幸福婚姻,被赵胤胤狠狠撕碎,爱情终究还是败给了现实

乡野小珥
2025-11-16 06:43:55
戏子误国!国家出手后,人民日报点名的这3位明星永无出头之日

戏子误国!国家出手后,人民日报点名的这3位明星永无出头之日

不八卦掌门人
2025-07-25 21:56:46
两年新增 20 万女骑手?到底是谁把中国女人,逼成了外卖员?

两年新增 20 万女骑手?到底是谁把中国女人,逼成了外卖员?

知鉴明史
2025-11-15 21:31:17
薄一波晚年反省,当年不该支持此人上台,他给国家带来大麻烦

薄一波晚年反省,当年不该支持此人上台,他给国家带来大麻烦

扬平说史
2025-11-06 20:22:42
疯狂的清朝乡试

疯狂的清朝乡试

汉周读书
2025-11-17 13:36:29
2025-11-18 13:03:00
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
13895文章数 66259关注度
往期回顾 全部

科技要闻

马斯克破防了!贝索斯62亿美金入局"实体AI"

头条要闻

超市被员工偷到倒闭 收银员给1700元商品结账仅1元

头条要闻

超市被员工偷到倒闭 收银员给1700元商品结账仅1元

体育要闻

直到退役那天,“海湾梅西”也没去欧洲踢球

娱乐要闻

曝喻恩泰离婚2年前转移走300箱茅台?

财经要闻

青云租陷兑付危机 集资与放贷的双面生意

汽车要闻

更加豪华 更加全地形 极石ADAMAS

态度原创

旅游
亲子
本地
艺术
公开课

旅游要闻

4条线路、5大亮点……快来一场说走就走的“红叶之旅”

亲子要闻

带孩子们去游乐场,俩闺女高兴坏了,以后有机会一定多陪陪她们!

本地新闻

这档古早综艺,怎么就成了年轻人的哆啦A梦?

艺术要闻

优雅浪漫的绘画,美到让人想直接住进去!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版