网易首页 > 网易号 > 正文 申请入驻

OpenAI o1占领后训练扩展律前沿,从快速识别走向深度思考

0
分享至

天风证券近日发布通信行业专题研究:OpenAI o1占领后训练扩展律前沿,从快速识别走向深度思考。

以下为研究报告摘要:

o1模型通过强化学习训练和产生思维链,能在做出响应前花更多时间思考问题

9月12日,OpenAI发布一系列新大语言模型o1,经过强化学习(Reinforcement Learning)训练,可以执行复杂推理,该模型可以产生一个长程思维链(Chain of Thought),在做出响应前花更多时间思考问题。

新模型包括o1-preview和o1-mini两种版本,其中o1-mini更快、更具成本效益,适用于需要推理但不需要广泛知识的应用程序

o1-mini是一个较小的模型,针对预训练期间的STEM推理进行了优化。速度方面,在单词推理问题回答中o1-mini找到答案的速度比o1-preview大约快了3~5倍;成本方面,OpenAI向第五梯队API用户开放的o1-mini成本端比o1-preview便宜80%。

o1通用性不及GPT-4o,高推理能力伴随高成本

作为早期模型,o1并不具备浏览网页、上传文件和图像等功能,通用性尚不及GPT-4o。但相较于GPT-4o多模态、反应快等特点,o1-preview更加注重推理能力,输入、输出tokens成本分别是GPT-4o的3、4倍。

o1在数理化复杂问题推理中的性能明显优于GPT-4o,在物理和生物学专业知识基准上的表现超越人类博士

o1在竞争性编程问题(Codeforces)中拿到89%的百分位,GPT-4o仅为11%;在国际数学奥林匹克竞赛(IMO)的资格考试中,o1解答正确率为83%,而GPT-4o正确率仅为13%;在安全方面,o1在越狱测试中的分数高达84,而GPT-4o的得分仅为22分。

后训练扩展律(Post-Training Scaling Law)显现,或将引发业界对算力重新分配、后训练能力的思考

o1模型的亮点在于其性能会随着强化学习时间(训练时间的计算量)和思考时间(测试时间的计算量)的增加而不断提升,扩展这种方法的限制与传统LLM预训练方法(通过增加参数量和数据量)的限制有着很大不同,后训练方法的重要性或将引发业界对算力分配、后训练能力的思考。

从快速反应走向深度思考,拓宽行业应用场景

o1在训练过程中能够使其思维链进行高效思考,模拟了人类在面对复杂问题时的思考过程,这预示着AI除了在快系统中可被应用(人脸识别等),在慢系统中的可用型或将得到提升。

快慢系统结合或将成为新的AI发展战略,OpenAI、Google占据前沿阵地Google DeepMind在此前论文中提出测试时的计算比扩展模型参数更有效;AlphaGeometry模型在国际数学奥林匹克(IMO)几何问题的基准测试中解决了25个问题(总共30个问题),AlphaGeometry由神经语言模型和符号推导引擎组成,将快慢系统结合,一个系统提供快速、直观的想法,另一个系统则提供更深思熟虑、更理性的决策。

风险提示:AI应用发展不及预期风险;海外大厂投资不及预期风险;中美摩擦升级风险。(天风证券 唐海清,王奕红,余芳沁 )

免责声明:本文内容与数据仅供参考,不构成投资建议,使用前请核实。据此操作,风险自担。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
胆大包天!日本竟模拟攻击辽宁舰

胆大包天!日本竟模拟攻击辽宁舰

中国网
2026-06-27 15:39:31
莫家蝶速率和体能超吴艳妮,不摔或跑12秒85,若专攻短跨上限极高

莫家蝶速率和体能超吴艳妮,不摔或跑12秒85,若专攻短跨上限极高

杨华评论
2026-06-27 21:44:43
崩溃!“根本删不完”!老人微信上有77万条未读消息,家属:群聊退一个,他们又拉一个,拉群还无需本人确认

崩溃!“根本删不完”!老人微信上有77万条未读消息,家属:群聊退一个,他们又拉一个,拉群还无需本人确认

佛山电视台小强热线
2026-06-26 22:37:52
惊天逆转!伊朗最高领袖密信曝光:谈判代表根本没按指令行事!

惊天逆转!伊朗最高领袖密信曝光:谈判代表根本没按指令行事!

近史谈
2026-06-27 13:07:17
半只球鞋决定伊朗命运,世界杯出线规则到底有多狠

半只球鞋决定伊朗命运,世界杯出线规则到底有多狠

眼界看世界
2026-06-27 18:55:07
意难平!庞峥麟无缘12人大名单,球迷惋惜:热身赛高光不该被辜负

意难平!庞峥麟无缘12人大名单,球迷惋惜:热身赛高光不该被辜负

小兰看体育
2026-06-27 11:10:24
世界杯疯狂一夜:姆巴佩助攻戴帽,亚洲之星跌第七

世界杯疯狂一夜:姆巴佩助攻戴帽,亚洲之星跌第七

奇迹行者在刷野
2026-06-27 07:21:04
韩红「走个热面」,《抓特务》更冷:那个装腔作势的「京圈」,终于没人拜了……

韩红「走个热面」,《抓特务》更冷:那个装腔作势的「京圈」,终于没人拜了……

家传编辑部
2026-06-25 10:00:51
暴跌60%,饮料旺季,亏声一片,经销商:干不下去了

暴跌60%,饮料旺季,亏声一片,经销商:干不下去了

时尚的弄潮
2026-06-27 03:12:55
中美俄人均智商差距太大:美国99.74,俄罗斯103.16,中国多少?

中美俄人均智商差距太大:美国99.74,俄罗斯103.16,中国多少?

蜉蝣说
2026-06-27 17:14:15
别太悲观!韩国最新出线形势:还剩3组未踢,需2组配合,依旧有戏

别太悲观!韩国最新出线形势:还剩3组未踢,需2组配合,依旧有戏

萌兰聊个球
2026-06-27 13:44:25
女卫生员怀孕咬定是我的,我被开除,5年后我开迈巴赫停在她摊前

女卫生员怀孕咬定是我的,我被开除,5年后我开迈巴赫停在她摊前

千秋文化
2026-06-24 19:59:19
第二个韦东奕出现了!全国高考数学状元,徐可满分真相大白

第二个韦东奕出现了!全国高考数学状元,徐可满分真相大白

解说阿洎
2026-06-27 09:12:45
他是蒋介石的恩人,儿子曾任上海市委书记,孙子被授予中将军衔

他是蒋介石的恩人,儿子曾任上海市委书记,孙子被授予中将军衔

棠棣分享
2026-06-28 01:51:46
中央开始严查,多地机关事业单位大整顿启动,这几类人受影响最大

中央开始严查,多地机关事业单位大整顿启动,这几类人受影响最大

细说职场
2026-06-26 16:37:37
王忠林,新职明确

王忠林,新职明确

新京报
2026-06-26 19:46:14
第38届大众电影百花奖投票正火热进行

第38届大众电影百花奖投票正火热进行

中国电影报
2026-06-26 12:41:53
痛快!国务院台湾事务办公室这回应做得漂亮!

痛快!国务院台湾事务办公室这回应做得漂亮!

果妈聊娱乐
2026-06-26 20:52:49
俄媒爆出猛料,普京无视中国航发,苏57被迫难产,歼20产能已破百

俄媒爆出猛料,普京无视中国航发,苏57被迫难产,歼20产能已破百

小涛叨叨
2026-06-27 15:04:25
美光怒骂苹果,历史性的转折

美光怒骂苹果,历史性的转折

贩财局
2026-06-27 20:36:36
2026-06-28 04:44:49
中国能源网 incentive-icons
中国能源网
《中国能源报》社有限公司官网官方账号,专注能源行业报道的垂直媒体,是能源专业产经传媒平台。
91642文章数 1431关注度
往期回顾 全部

科技要闻

GPT-5.6发布,你暂时用不了!Mythos也放行

头条要闻

金价大跌 有商家资产缩水百万:跌掉一辆迈巴赫

头条要闻

金价大跌 有商家资产缩水百万:跌掉一辆迈巴赫

体育要闻

世界杯最火门将,站到了阿根廷和梅西面前

娱乐要闻

四提白玉兰终封后,杨紫:仍觉不真实

财经要闻

OpenAI推迟IPO重创软银!

汽车要闻

搭载华为乾崑ADS 5 全新猛士M817上市售29.99万起

态度原创

时尚
本地
家居
手机
亲子

伊姐周六热推:电视剧《昨夜将至》;电影《蝴蝶楼·惊魂》......

本地新闻

世界杯球迷节:比球赛更好玩的派对

家居要闻

绿意盎然 自然之境

手机要闻

vivo产品副总裁黄韬:对vivo X Fold6销量非常有信心

亲子要闻

今天教你用宝可梦来看世界杯

无障碍浏览 进入关怀版