网易首页 > 网易号 > 正文 申请入驻

OpenAI放大招!发布最强水平大模型,解决博士生级别科学问题

0
分享至

传言中有高级推理能力、此前被称为"草莓项目"的OpenAI新项目于北京时间9月13日凌晨推出了。

OpenAI发布o1模型(图/智东西)

OpenAI在官网介绍,一个新的推理(reasoning)模型系列将开始提供,这个系列模型将用于解决困难问题,这些模型将在做出反应前花更多时间思考,可以通过复杂的过程进行推理,解决比以往更难的科学、编码和数据问题。OpenAI此次在ChatGPT和API接口渠道上先推出该系列的预览版本OpenAI o1-preview。

"对复杂的推理任务而言,这是一个重大进步,代表人工智能能力的一个崭新水平。因此我们将‘计数器’重置为1,新系列命名为OpenAI o1。"OpenAI表示。OpenAI CEO Sam Altman(萨姆·奥尔特曼)也在社交平台上表示,该新模型是一个新范式的开始,即AI能够进行通用复杂推理。

OpenAI o1包括三个型号,除o1-preview 之外还将有o1和o1-mini。其中o1-mini是一种更快、更便宜的推理模型且适用于需要推理但不需广泛世界知识的应用,o1-mini还比o1-preview便宜80%。

技术方面,OpenAI介绍,新系列模型经过训练,学会完善自身思维过程并尝试不同策略,能认识到自己的错误。新系列模型更新后的性能类似于博士生在物理、化学、生物学中完成具挑战性的基准任务。新系列模型还在数据和编码方面表现出色,在国际数学奥林匹克竞赛(IMO)的资格考试中得分83%,对比之下GPT-4o仅正确解决了13%的问题。新系列模型还在竞争性编程问题Codeforces比赛中排名前89%。

在技术研究相关文章中,OpenAI介绍,公司用大规模强化学习算法"教会"模型在数据高效训练时用思维链进行高效思考。随着强化学习增加和思考时间增加,o1的性能不断提高。类似于人类在回答困难问题之前思考很长时间,o1也尝试在解决问题时使用思维链,该模型通过强化学习学会磨练思维链并改进策略,学会在当前方法不起作用时尝试不同方法,这提高了模型推理能力。

"作为早期模型,它还难以使ChatGPT变得更加有用,例如通过浏览网页获取信息或上传文件和图像。对于很多常见案例,GPT-4o短期内能力还是更好。"OpenAI表示。不过该系列新模型增强的推理功能可能对解决科学、编码、数学和类似领域的复杂问题更有效,例如,医疗保健研究人员可用它来注释细胞测序数据,物理学家用它生成量子光学所需的复杂数学公式,开发人员可用它构建和执行多步骤工作流程。量子物理学者Mario Krenn就展示了GPT-4o不能回答但o1-preview正确完成计算的复杂量子物理问题。

OpenAI研究人员Noam Brown在社交平台上提到OpenAI o1系列的更多细节,他表示,o1系列经过强化学习训练,在通过自己的思维链做出反应前会思考,思考时间越长,推理任务表现越好。"这为大模型缩放(scaling)开辟了新维度,我们不再受预训练的瓶颈限制,现在也可以扩展推理计算了。" Noam Brown表示,但o1模型并不总是比GPT-4o好,有时人们不值得长时间等待o1响应,在个人写作和编辑文本时人们可能会偏好GPT-4o,在计算机编程、数据分析和数学计算领域则可能会偏好OpenAI o1。

Noam Brown透露,OpenAI o1在回答前会思考几秒,但OpenAI的目标是让未来的版本思考几个小时、几天甚至几周,虽然推理成本会更高,但人们有可能也会获得更多,例如在研发新抗癌药等方面,人工智能可以不仅仅是聊天机器人。

不过,不是所有用户都能立马用上新系列模型。据OpenAI介绍,ChatGPT Plus用户和Team用户最早可以在几个小时内体验到新模型。o1-preview限制为每周30条消息,o1-mini限制为每周50条消息。而从下周开始,ChatGPT的企业用户和教育(Edu)用户也可以访问这两种模型。该系列模型的API访问权限首先给Tier 5级用户。此外,OpenAI还计划将向所有ChatGPT免费用户提供o1-mini访问权限。后续,OpenAI还计划增加浏览、文件和图片上传等功能,且在OpenAI o1系列之外继续开发和发布GPT系列中的其他模型。

在安全方面,OpenAI则透露,新模型的思维链推理为确保对齐和安全提供了新的机会,隐藏的思维链为监控模型提供了独特的机会,使人能"读取模型思想"并理解其思维过程。此外,公司最近与美国和英国的人工智能安全研究所达成协议,开始将相关协议付诸实施,包括允许各机构尽早使用该模型的研究版本,这有助于建立一个在公开发布之前和之后对未来模型进行研究、评估和测试的流程。

责任编辑:戴丽丽_NN4994

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
超级世界波!迪亚斯零度角爆射破门,滑铲过人一条龙,队友看呆了

超级世界波!迪亚斯零度角爆射破门,滑铲过人一条龙,队友看呆了

奥拜尔
2025-11-08 23:29:45
陪睡陪玩根本不够!目无王法、舔手,大花撕破脸,都不装了

陪睡陪玩根本不够!目无王法、舔手,大花撕破脸,都不装了

情感大头说说
2025-11-08 05:53:27
重庆北碚区划调整情况通报会举行,区委书记:实现国家战略下的“再生长”

重庆北碚区划调整情况通报会举行,区委书记:实现国家战略下的“再生长”

澎湃新闻
2025-11-08 13:32:27
同事借走我32万手表去应酬,回来告诉我丢了,我故意说:表是假的

同事借走我32万手表去应酬,回来告诉我丢了,我故意说:表是假的

小秋情感说
2025-11-06 14:13:51
朝鲜、巴基斯坦、柬埔寨为何纷纷转向?背后原因令人深思

朝鲜、巴基斯坦、柬埔寨为何纷纷转向?背后原因令人深思

音乐时光的娱乐
2025-11-07 12:51:32
穆里尼奥又要领违约金了?日落西山的世一帅或该退休了

穆里尼奥又要领违约金了?日落西山的世一帅或该退休了

K唐伯虎
2025-11-08 08:05:46
央视对全红婵的称呼变了,两字之差释放强烈信号,评论区风向变了

央视对全红婵的称呼变了,两字之差释放强烈信号,评论区风向变了

云舟史策
2025-11-07 07:36:58
建国30年后邓颖超透露:国民党一位元老,是潜伏50多年的共产党员

建国30年后邓颖超透露:国民党一位元老,是潜伏50多年的共产党员

鹤羽说个事
2025-11-08 14:32:15
最近百年来,美国最大的战略失误是什么?美国注定因此衰落

最近百年来,美国最大的战略失误是什么?美国注定因此衰落

小哥很OK
2025-02-05 11:10:11
3:0!朝鲜女足双杀欧洲冠军,豪取七连胜,卫冕U17世界杯冠军

3:0!朝鲜女足双杀欧洲冠军,豪取七连胜,卫冕U17世界杯冠军

呀古铜
2025-11-09 04:58:30
美女医生曾琦因作风问题被停职!她选错了对象,追悔莫及痛一生

美女医生曾琦因作风问题被停职!她选错了对象,追悔莫及痛一生

鋭娱之乐
2025-11-08 00:05:13
吴石案里漏网的佣人:她拒绝选择金条,这其中藏着最狠的生存之道

吴石案里漏网的佣人:她拒绝选择金条,这其中藏着最狠的生存之道

爱竞彩的小周
2025-11-08 14:25:04
“最帅展昭”离世,享年58岁!

“最帅展昭”离世,享年58岁!

黎兜兜
2025-11-08 21:22:56
加纳乔助攻双响,切尔西3-0血洗副班长,升至英超积分榜第二

加纳乔助攻双响,切尔西3-0血洗副班长,升至英超积分榜第二

钉钉陌上花开
2025-11-09 05:59:22
若中日再次爆发战争,结局会如何?俄罗斯和美国看法一致​

若中日再次爆发战争,结局会如何?俄罗斯和美国看法一致​

寻途
2025-11-04 21:16:03
福建舰入列第3天,郑丽文代表国民党,作出一个事关两岸重要承诺

福建舰入列第3天,郑丽文代表国民党,作出一个事关两岸重要承诺

墨兰史书
2025-11-09 05:35:02
他又吆喝:想回,希望中方改变政策

他又吆喝:想回,希望中方改变政策

观察者网
2025-11-08 10:59:05
更令美国人破防的来了,福建舰工程师透露,未来新航母有4大特点

更令美国人破防的来了,福建舰工程师透露,未来新航母有4大特点

时时有聊
2025-11-08 21:13:26
浙江女首富“栽”了,崇拜许家印投资房地产,800亿资产一夜归零

浙江女首富“栽”了,崇拜许家印投资房地产,800亿资产一夜归零

历史伟人录
2025-11-08 16:11:05
年薪5400万,场均19分4助攻!知道你尽力了,但确实也在拖累球队

年薪5400万,场均19分4助攻!知道你尽力了,但确实也在拖累球队

老梁体育漫谈
2025-11-09 00:46:45
2025-11-09 06:40:49
第一财经资讯 incentive-icons
第一财经资讯
第一财经官方账号
235120文章数 620525关注度
往期回顾 全部

科技要闻

美股“AI八巨头”单周市值损失8000亿美元

头条要闻

张家界荒野求生选手抓到野猪吃得满嘴流油 赛事方回应

头条要闻

张家界荒野求生选手抓到野猪吃得满嘴流油 赛事方回应

体育要闻

马刺绞赢火箭,不靠文班亚马?

娱乐要闻

古二再度放料!秦雯王家卫吐槽出现新人物

财经要闻

小马、文远回港上市 但自动驾驶还没赢家

汽车要闻

特斯拉Model Y后驱长续航版上线:28.85 万元

态度原创

艺术
家居
本地
健康
公开课

艺术要闻

石破天惊 鬼斧神工!(太神奇了)

家居要闻

现代自由 功能美学居所

本地新闻

这届干饭人,已经把博物馆吃成了食堂

超声探头会加重受伤情况吗?

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版