网易首页 > 网易号 > 正文 申请入驻

OpenAI发布新模型o1,更像理科生,不会多模态但推理能力超强

0
分享至

防走失,电梯直达

来源:网易科技

作者:有态度的

出品|网易科技报道

9月13日消息,去年,OpenAI通过推出GPT-4,实现了人工智能领域的一次重大突破。周四,该公司宣布了一个标志着其研究方向转变的全新模型:OpenAI o1。

OpenAI o1具备独特的逻辑“推理”能力,能够解决许多现有模型(包括OpenAI目前最强大的模型GPT-4o)无法处理的复杂问题。与传统大语言模型通常一步给出答案不同,OpenAI o1像人类一样,通过逐步推理,最终得出正确的结论。

OpenAI首席技术官米拉·穆拉蒂(Mira Murati)在接受采访时表示:“我们将其视为人工智能模型发展的新范式,特别是在处理复杂推理任务时,展现出了前所未有的优势。

OpenAI o1的内部代号为“草莓”,并非旨在取代GPT-4,而是对其的补充。

穆拉蒂还透露,OpenAI目前正在构建下一代主模型GPT-5,其规模将远超前代。尽管公司依然认为扩大模型规模能带来新的突破,GPT-5预计将融合本次展示的推理技术。“我们有两个发展方向,一个是规模扩展,另一个是推理能力提升,我们希望最终将两者结合,”穆拉蒂说道。

大语言模型通常依赖庞大的神经网络和海量数据进行训练,展现出卓越的语言和逻辑能力,但在处理基本推理问题(如简单的数学题)时,表现不佳。

穆拉蒂指出,OpenAI o1采用了强化学习技术,通过对正确答案给出正反馈、错误答案给出负反馈,逐步提升模型的推理策略。她补充说:“这个模型不仅提升了思维的敏锐度,还微调了它用于解决问题的策略。”强化学习已经帮助计算机在游戏和复杂任务(如芯片设计)中取得了超凡表现,同时也是开发高效、友好的聊天机器人的关键技术。

OpenAI研究副总裁陈信翰(Mark Chen)展示了OpenAI o1的能力,解决了GPT-4o无法处理的多个问题,包括复杂的化学题和一个棘手的数学推理题。陈信翰表示:“新模型不再只是模仿人类思维方式,而是学会了独立思考。”

OpenAI称,新模型在多个领域(如编程、数学、物理、生物和化学)的测试中表现出色。在美国数学邀请赛(AIME)中,GPT-4o平均解答率为12%,而OpenAI o1的解答率则高达83%。

不过,OpenAI o1的速度不如GPT-4o,且其优势并非在所有情况下都明显,部分原因在于它无法搜索网络,也不具备多模态功能,无法处理图像或音频数据。

近年来,提升大语言模型的推理能力一直是研究热点,竞争对手也在积极探索。谷歌今年7月宣布了AlphaProof项目,结合了语言模型和强化学习,专注于解决复杂的数学问题。尽管AlphaProof能够通过正确答案学习数学推理,但面临的挑战在于现实问题并非总有明确答案。

OpenAI表示,其新推理系统具备更广泛的适用性。陈信翰认为:“我们在这一领域取得了突破,这也是我们的优势所在。该系统在各个领域的推理任务中表现出色。”

斯坦福大学教授诺亚·古德曼(Noah Goodman)曾发表过关于提高大语言模型推理能力的研究,他认为,通过精心设计的提示性语言模型结合手工优化数据,可能是实现推理能力提升的关键。古德曼还表示,如果能在速度和准确性之间取得平衡,将是“意义重大的进步”。

麻省理工学院助理教授Yoon Kim指出,大型语言模型的推理机制仍显得神秘,尽管它们能够逐步推理,但与人类思维或存在本质差异。这种差异在技术被广泛应用时可能会变得至关重要。他说:“这些系统可能会做出影响众多人的决策。更大的问题是,我们能否信赖它们的决策机制?”

OpenAI新技术或许还有助于确保AI模型的“良性行为”。穆拉蒂表示,新的推理模型可以通过对结果的推理,避免产生不良或有害的输出。她说:“就像教育孩子一样,一旦他们理解为什么要做某件事,他们就能更好地遵守规范、行为准则和价值观。”

华盛顿大学名誉教授、人工智能专家奥伦·埃齐奥尼(Oren Etzioni)指出:“让大语言模型具备多步骤推理、使用工具和解决复杂问题的能力至关重要,单靠规模扩展难以达成这一目标。”他补充说,即使推理能力得到提升,幻觉和事实验证问题依然存在。

陈信翰透露,该公司开发的新推理方法表明,人工智能的发展并不一定需要庞大的算力支撑。“这一变革令人振奋。我们相信它能以更低的成本实现智能输出,而这正是我们公司核心愿景的一部分。”

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
金银惊魂72小时!给我们投资者哪些启发?

金银惊魂72小时!给我们投资者哪些启发?

雪球
2026-02-03 21:32:28
1961年溥仪面见毛主席,得知他今天破例吃肉,问:谁劝你别吃肉的

1961年溥仪面见毛主席,得知他今天破例吃肉,问:谁劝你别吃肉的

简史档案馆
2026-02-04 11:05:03
央视春晚主持人阵容正式公布,39岁刘心悦成新面孔,曾在浙江广电、辽宁广电长期工作

央视春晚主持人阵容正式公布,39岁刘心悦成新面孔,曾在浙江广电、辽宁广电长期工作

极目新闻
2026-02-04 11:56:36
申真谞跨届19连胜,王星昊背水一战,农心杯中韩谁先出局?

申真谞跨届19连胜,王星昊背水一战,农心杯中韩谁先出局?

月满大江流
2026-02-05 09:01:46
大毒枭坤沙:从不向中国贩毒,手握六个师兵力,美国:可怕的敌人

大毒枭坤沙:从不向中国贩毒,手握六个师兵力,美国:可怕的敌人

芊芊子吟
2026-02-02 16:40:07
1903年,30岁梁启超和17岁王桂荃行房,两人大汗淋漓

1903年,30岁梁启超和17岁王桂荃行房,两人大汗淋漓

南权先生
2026-02-03 15:53:04
马斯克成全球首位身家超8000亿美元者,超出第二富豪5780亿美元

马斯克成全球首位身家超8000亿美元者,超出第二富豪5780亿美元

IT之家
2026-02-04 20:24:07
求和被晾半年!立陶宛恼羞成怒扑向金门

求和被晾半年!立陶宛恼羞成怒扑向金门

李荣茂
2026-02-04 18:45:09
江西官方通报:成立联合调查组,将问责责任人

江西官方通报:成立联合调查组,将问责责任人

澎湃新闻
2026-02-05 00:54:05
过分!国外开始明抢港口!李嘉诚:强烈反对

过分!国外开始明抢港口!李嘉诚:强烈反对

说财猫
2026-02-04 18:04:47
留学生的爸妈能有多离谱?网友:我在利物浦,我爸非说我在飞利浦

留学生的爸妈能有多离谱?网友:我在利物浦,我爸非说我在飞利浦

带你感受人间冷暖
2026-02-04 00:30:03
契丹人有多讲究?签订澶渊之盟后,100多年和北宋几乎秋毫无犯

契丹人有多讲究?签订澶渊之盟后,100多年和北宋几乎秋毫无犯

历史摆渡
2026-02-02 20:05:03
30死324伤!屡劝不听,滞留北海道旅客喊话祖国包机接人!

30死324伤!屡劝不听,滞留北海道旅客喊话祖国包机接人!

阿燕姐说育儿
2026-02-04 15:51:25
卓士琳、七老板宣布与三只羊解约

卓士琳、七老板宣布与三只羊解约

极目新闻
2026-02-04 15:46:32
能抵抗朊病毒的PRNP基因,欧美人比中国人高20倍

能抵抗朊病毒的PRNP基因,欧美人比中国人高20倍

远方青木
2026-02-03 00:11:41
节省5000元的秘籍:无需Mac Mini本地完美运行OpenClaw, 在Windows上(基于WSL子系统)

节省5000元的秘籍:无需Mac Mini本地完美运行OpenClaw, 在Windows上(基于WSL子系统)

Web3天空之城
2026-02-04 20:50:26
9换4大交易达成!小牛队太亏了,终于送走浓眉哥

9换4大交易达成!小牛队太亏了,终于送走浓眉哥

德译洋洋
2026-02-05 12:29:48
苏顾问加波年科回忆:1979年中国56万大军猛攻,越军无力抗衡

苏顾问加波年科回忆:1979年中国56万大军猛攻,越军无力抗衡

唠叨说历史
2026-01-17 10:07:31
打起来了!美航母中东开了第一枪,伊朗果然好猛,各大势力选边站

打起来了!美航母中东开了第一枪,伊朗果然好猛,各大势力选边站

浮光惊掠影
2026-02-04 19:31:17
回顾“91女神”琪琪:五官出众,却因天真让自己“受伤”

回顾“91女神”琪琪:五官出众,却因天真让自己“受伤”

就一点
2025-11-22 10:36:39
2026-02-05 12:47:00
报人刘亚东 incentive-icons
报人刘亚东
不唯上,不唯书,只唯实。
5750文章数 43195关注度
往期回顾 全部

科技要闻

微信给马化腾浇了“一盆冷水”

头条要闻

牛弹琴:中国元首和特朗普通话 特朗普就台湾问题表态

头条要闻

牛弹琴:中国元首和特朗普通话 特朗普就台湾问题表态

体育要闻

奇才:我学生……独行侠:成交!

娱乐要闻

谢娜明年开演唱会:带老歌出来见见人

财经要闻

黄金,出现拐点

汽车要闻

一切交给XWD 捷途旅行者C-DM也能轻松刷冰锅

态度原创

房产
手机
数码
本地
公开课

房产要闻

还在涨!成交量连飙四个月 海口二手房开始稳了!

手机要闻

深蓝色谷歌Pixel 10a手机宣传图曝光,2月18日上市

数码要闻

华为确认于2月26日全球发布多款新品 包括手机、穿戴

本地新闻

围观了北京第一届黑色羽绒服大赛,我笑疯了

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版