网易首页 > 网易科技 > IT业界 > 正文

OpenAI发布新模型o1,更像理科生,不会多模态但推理能力超强

0
分享至

9月13日消息,去年,OpenAI通过推出GPT-4,实现了人工智能领域的一次重大突破。周四,该公司宣布了一个标志着其研究方向转变的全新模型:OpenAI o1。

OpenAI o1具备独特的逻辑“推理”能力,能够解决许多现有模型(包括OpenAI目前最强大的模型GPT-4o)无法处理的复杂问题。与传统大语言模型通常一步给出答案不同,OpenAI o1像人类一样,通过逐步推理,最终得出正确的结论。

OpenAI首席技术官米拉·穆拉蒂(Mira Murati)在接受采访时表示:“我们将其视为人工智能模型发展的新范式,特别是在处理复杂推理任务时,展现出了前所未有的优势。”

OpenAI o1的内部代号为“草莓”,并非旨在取代GPT-4,而是对其的补充。

穆拉蒂还透露,OpenAI目前正在构建下一代主模型GPT-5,其规模将远超前代。尽管公司依然认为扩大模型规模能带来新的突破,GPT-5预计将融合本次展示的推理技术。“我们有两个发展方向,一个是规模扩展,另一个是推理能力提升,我们希望最终将两者结合,”穆拉蒂说道。

大语言模型通常依赖庞大的神经网络和海量数据进行训练,展现出卓越的语言和逻辑能力,但在处理基本推理问题(如简单的数学题)时,表现不佳。

穆拉蒂指出,OpenAI o1采用了强化学习技术,通过对正确答案给出正反馈、错误答案给出负反馈,逐步提升模型的推理策略。她补充说:“这个模型不仅提升了思维的敏锐度,还微调了它用于解决问题的策略。”强化学习已经帮助计算机在游戏和复杂任务(如芯片设计)中取得了超凡表现,同时也是开发高效、友好的聊天机器人的关键技术。

OpenAI研究副总裁陈信翰(Mark Chen)展示了OpenAI o1的能力,解决了GPT-4o无法处理的多个问题,包括复杂的化学题和一个棘手的数学推理题。陈信翰表示:“新模型不再只是模仿人类思维方式,而是学会了独立思考。”

OpenAI称,新模型在多个领域(如编程、数学、物理、生物和化学)的测试中表现出色。在美国数学邀请赛(AIME)中,GPT-4o平均解答率为12%,而OpenAI o1的解答率则高达83%。

不过,OpenAI o1的速度不如GPT-4o,且其优势并非在所有情况下都明显,部分原因在于它无法搜索网络,也不具备多模态功能,无法处理图像或音频数据。

近年来,提升大语言模型的推理能力一直是研究热点,竞争对手也在积极探索。谷歌今年7月宣布了AlphaProof项目,结合了语言模型和强化学习,专注于解决复杂的数学问题。尽管AlphaProof能够通过正确答案学习数学推理,但面临的挑战在于现实问题并非总有明确答案。

OpenAI表示,其新推理系统具备更广泛的适用性。陈信翰认为:“我们在这一领域取得了突破,这也是我们的优势所在。该系统在各个领域的推理任务中表现出色。”

斯坦福大学教授诺亚·古德曼(Noah Goodman)曾发表过关于提高大语言模型推理能力的研究,他认为,通过精心设计的提示性语言模型结合手工优化数据,可能是实现推理能力提升的关键。古德曼还表示,如果能在速度和准确性之间取得平衡,将是“意义重大的进步”。

麻省理工学院助理教授Yoon Kim指出,大型语言模型的推理机制仍显得神秘,尽管它们能够逐步推理,但与人类思维或存在本质差异。这种差异在技术被广泛应用时可能会变得至关重要。他说:“这些系统可能会做出影响众多人的决策。更大的问题是,我们能否信赖它们的决策机制?”

OpenAI新技术或许还有助于确保AI模型的“良性行为”。穆拉蒂表示,新的推理模型可以通过对结果的推理,避免产生不良或有害的输出。她说:“就像教育孩子一样,一旦他们理解为什么要做某件事,他们就能更好地遵守规范、行为准则和价值观。”

华盛顿大学名誉教授、人工智能专家奥伦·埃齐奥尼(Oren Etzioni)指出:“让大语言模型具备多步骤推理、使用工具和解决复杂问题的能力至关重要,单靠规模扩展难以达成这一目标。”他补充说,即使推理能力得到提升,幻觉和事实验证问题依然存在。

陈信翰透露,该公司开发的新推理方法表明,人工智能的发展并不一定需要庞大的算力支撑。“这一变革令人振奋。我们相信它能以更低的成本实现智能输出,而这正是我们公司核心愿景的一部分。”(小小)

相关推荐
热点推荐
全国人民代表大会常务委员会公告〔十四届〕第十五号

全国人民代表大会常务委员会公告〔十四届〕第十五号

环球网资讯
2026-02-04 18:24:12
四川一校花太漂亮了,身高170五官精致,美得让人移不开眼

四川一校花太漂亮了,身高170五官精致,美得让人移不开眼

阿废冷眼观察所
2026-01-29 08:24:05
汤杰回忆加盟广东:杜锋和我说是改变命运的机会 没有把握住很后悔

汤杰回忆加盟广东:杜锋和我说是改变命运的机会 没有把握住很后悔

狼叔评论
2026-02-04 19:54:04
越南披露中越战争内幕,坦言中国若迟撤军五日,谅山主力将被全歼

越南披露中越战争内幕,坦言中国若迟撤军五日,谅山主力将被全歼

磊子讲史
2026-02-04 12:02:50
江苏响水大桥,刚说圆满收官就塌了,5人不幸遇难,专家解析原因

江苏响水大桥,刚说圆满收官就塌了,5人不幸遇难,专家解析原因

行走的知识库
2026-02-04 11:00:56
万万没想到,全球局势中“最乱”的竟是中国

万万没想到,全球局势中“最乱”的竟是中国

安安说
2026-01-23 09:12:29
官媒发文!宗馥莉再破天花板,让亲叔宗泽后和整个商界沉默了

官媒发文!宗馥莉再破天花板,让亲叔宗泽后和整个商界沉默了

老沮系戏精北鼻
2026-01-08 11:59:03
40岁无腿廖智现状:赴美产下四胎女儿,被美籍丈夫宠成大公主

40岁无腿廖智现状:赴美产下四胎女儿,被美籍丈夫宠成大公主

暖心萌阿菇凉
2026-02-02 22:59:12
26日战中国男篮!日本男篮15人集训名单:渡边雄太领衔+两归化

26日战中国男篮!日本男篮15人集训名单:渡边雄太领衔+两归化

醉卧浮生
2026-02-04 16:52:10
2米16杨瀚森场均1.7板,1米7河村勇辉场均4.7板!背后原因太真实

2米16杨瀚森场均1.7板,1米7河村勇辉场均4.7板!背后原因太真实

嘴炮体坛
2026-02-04 23:19:45
胡春华发表署名文章

胡春华发表署名文章

社评
2025-10-31 10:11:37
6年换5队,哈登被封“流浪巨星”

6年换5队,哈登被封“流浪巨星”

环球网资讯
2026-02-05 07:00:06
今日!NBA快船VS骑士 哈登能否出战?伦纳德PK米切尔,央视无直播

今日!NBA快船VS骑士 哈登能否出战?伦纳德PK米切尔,央视无直播

晚池
2026-02-05 00:44:05
俄乌谈判重启,不到24小时,泽连斯基彻底服软,只提了一个条件

俄乌谈判重启,不到24小时,泽连斯基彻底服软,只提了一个条件

策前论
2026-02-02 19:15:25
2026春晚阵容封神 近十年最强,爷青回杀疯了,网友:终于能放下手机了

2026春晚阵容封神 近十年最强,爷青回杀疯了,网友:终于能放下手机了

小椰的奶奶
2026-02-02 16:22:13
辞职俩月后,前老板打电话让我陪客户签100万合同,我:提成多少

辞职俩月后,前老板打电话让我陪客户签100万合同,我:提成多少

船长与船1
2025-12-14 19:16:24
天空体育:利雅得胜利正在等待确认C罗是否会结束罢赛

天空体育:利雅得胜利正在等待确认C罗是否会结束罢赛

懂球帝
2026-02-04 22:53:17
告别休斯顿?火箭重建棋局中的首枚棋子

告别休斯顿?火箭重建棋局中的首枚棋子

问书君
2026-02-05 00:30:07
中国财政供养人员达6846万?结构失衡才是财政压力的核心

中国财政供养人员达6846万?结构失衡才是财政压力的核心

流苏晚晴
2025-12-04 19:27:08
如果他活着,世上本无大明朝:一代枭雄为何死于小人之手?

如果他活着,世上本无大明朝:一代枭雄为何死于小人之手?

芊芊子吟
2026-01-26 08:15:08
2026-02-05 08:55:00

科技要闻

微信给马化腾浇了“一盆冷水”

头条要闻

伊朗被指将铀库存转至俄罗斯 克宫首次回应

头条要闻

伊朗被指将铀库存转至俄罗斯 克宫首次回应

体育要闻

哈登回应交易:不想让自己拖累快船的未来

娱乐要闻

春晚主持人阵容曝光,5位都是老面孔

财经要闻

黄金,出现拐点

汽车要闻

综合续航1730km 5座中级电混SUV吉利银河M7官图发布

态度原创

本地
房产
家居
数码
艺术

本地新闻

围观了北京第一届黑色羽绒服大赛,我笑疯了

房产要闻

还在涨!成交量连飙四个月 海口二手房开始稳了!

家居要闻

灰白意境 光影奏鸣曲

数码要闻

西数公布高带宽硬盘技术:多通道并行 读写性能可达传统硬盘数倍

艺术要闻

一百多年前的风俗画,意大利画家安东尼奥·罗塔

无障碍浏览 进入关怀版
×