网易首页 > 网易号 > 正文 申请入驻

热点速递- OpenAI o1模型:强化学习提升推理能力,关注应用前景与成本优化

0
分享至

一、前言

北京时间2024年9月13日凌晨,全球AI产业领头羊OpenAI正式发布一系列旨在专门解决复杂任务的全新AI推理大模型o1,即之前酝酿已久的草莓模型。根据OpenAI官方推特,o1系列模型将包括o1、o1-preview和o1-mini,其中o1-preview已开放使用,ChatGPTPlus和Team的用户以及API使用等级达到5级(API付费超1000美元)的开发者已获得该模型访问权限,企业版和教育版的用户预计将从9月16日起获得该模型访问权限。与此前Theinformation、Themedium等媒体报道基本一致,o1模型在功能、推理和性能表现上基本符合预期。

市场普遍认为,OpenAI新一代AI推理模型o1系列的发布标志着AI在处理复杂任务领域进入新的发展阶段。此次发布的模型在推理能力和性能上取得了显著提升,有望加速AI技术在各个领域的应用,包括自然语言处理、医疗诊断、自动驾驶等。AI技术在实际应用中的落地将显著提速,特别是在企业级应用和教育领域。此举将进一步激发AI技术在行业中的创新潜力,推动商业和学术领域对AI的更深入探索和开发,进而带动AI产业链上下游企业的共同发展。相关产品人工智能AIETF(515070)及其联接基金(008585/008586)

二、OpenAIo1模型发布:强化学习提升推理能力,应用前景与成本优化引关注

(1)模型机理及评测效果:强化学习加持下编码/数学/推理能力提升显著

根据OpenAI技术博客,o1模型在训练过程中引入了大规模强化学习算法,从而加强了其执行复杂推理任务的能力。而根据“Reinforcementlearning:Anintroduction”(Sutton),强化学习起源于上世纪60年代,旨在通过奖惩机制让智能体在复杂环境中最大限度获得长期全局最优收益。强化学习主要包括定义问题、选择策略、学习价值函数(如Q学习)、模型控制和策略优化等步骤。此前谷歌围棋机器人AlphaGo的核心技术即为强化学习。在应用该项技术后,o1系列模型的输出过程与GPT系列模型存在显著不同:o1系列模型会先用至多20~30秒产生较长的思维链再进行输出,即先将复杂任务拆解为子任务进行分析,在汇总子任务结果后输出最终结果,而非GPT系列模型立即开始生成的模式。根据OpenAI官网,o1模型在理科测试、数学、编程等绝大多数推理任务中表现明显优于GPT-4o,甚至在部分推理密集型基准测试中o1模型的表现与人类专家相媲美。例如,在国际奥林匹克资格考试中,o1正确解答了83%的题目,而GPT-4o仅正确解答13%;在PhD水平科学问答测试中,o1和o1-preview表现均优于人类专家与GPT-4o。

(2)市场定位:安全性与推理能力显著提升有望解锁应用,模型成本有待优化

根据OpenAI官方技术博客,思维链可有效提升模型的安全和对齐水平:1)思维链可清晰的展示模型思维;2)将模型行为策略整合到推理模型的思维链中,可以高效、稳健地教导人类价值观。我们认为,目前AI产业的主要矛盾是推理能力不足和成本过高导致的爆款应用匮乏。而在安全性有保障的前提下,推理能力的显著提升使得o1有望逐步解锁应用。但由于庞大的推理算力需求导致的高成本和纯文字反馈的输出形态,我们预计短期内o1的应用场景仍将集中于编程和科研等特定高价值生产力场景,OpenAI官方亦推出了更加擅长编程的且更便宜的推理模型o1-mini。根据OpenAI官网,o1-preview定价为输入端15美元/百万token,输出端60美元/百万token;o1-mini的定价为输入端3美元/百万token,输出端12美元/百万token;GPT-4o的定价为输入端1.25美元/百万token,输出端为5美元/百万token。

(3)趋势展望:推理阶段有望遵循ScalingLaw,多模型配合值得关注

在研发o1模型时,OpenAI发现给予模型更多的推理时间可有效提高模型的性能,即推理阶段的ScalingLaw。这一发现在一定程度上意味着推理端的算力需求有望迎来蓬勃增长。同时目前o1系列模型的访问限制也从侧面证明了模型算力需求之旺盛。根据OpenAI官网,目前o1-preview使用限制为每周30条,o1-mini为每周50条。此外,我们认为,应用层面的多模型配合亦值得关注。根据“Merge,Ensemble,andCooperate!ASurveyonCollaborativeStrategiesintheEraofLargeLanguageModels”(JinliangLu,ZiliangPang,MinXiao等),多模型协作具有整体性能提升、多任务处理能力增强、计算效率提升、错误与幻觉减少、知识共享与能力迁移等优势。多模型协作既可发生在大模型之间,也可发生在大模型与小模型之间。多模型协作策略可分为融合、集成和合作三种,其中合作方法下不同模型兼容度最高最为灵活,可创造出更加全面高效的AI系统,因此具备相当潜力。

三、OpenAI引领大模型迭代,国产大模型加速商业化进程

OpenAI引领下,大模型领域迎来新一轮迭代,国产大模型商业化进程备受关注。近期,国产大模型在更新迭代上取得显著进展,国内厂商纷纷发布新版模型或推出新应用产品,不断完善模型性能,拓展应用场景。目前,大模型技术已逐渐融入效率办公、创意创作、智能搜索、实时互动等日常生产生活中,为用户提供更丰富的功能与服务。从模型性能的角度看,国内大模型与国际领先模型的差距正在逐步缩小。根据SuperCLUE的最新数据,国内外TOP1模型的差距比例已从2023年5月的30.12%缩小至8月的1.29%。这一变化表明,国内大模型在中文领域的通用能力正在不断赶超国际水平。在OpenAIo1模型的引领下,国产模型有望加速技术迭代,进一步提升性能和应用广度,为商业化开辟更广阔的空间。国产大模型的快速发展不仅有助于推动AI技术在国内各行业的广泛应用,也将为全球AI产业的发展注入新的动力。在OpenAI1模型的引领下,国产模型有望加速迭代进程,持续打开商业化空间

相关产品:

1、人工智能AIETF(515070)及其联接基金(008585/008586/021580)

人工智能AIETF跟踪中证人工智能主题指数(指数代码:930713.CSI,指数简称:CS人工智)数选取为人工智能提供基础资源、技术以及应用支持的公司中选取代表性公司作为样本股,反映人工智能主题公司的整体表现。

数据来源:Wind,中信证券,广发证券,截至2024.9.18,以上个股不作投资推荐。

以上内容与数据,与界面有连云频道立场无关,不构成投资建议。据此操作,风险自担。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
在北京!武契奇谈北约轰炸中国驻南联盟使馆

在北京!武契奇谈北约轰炸中国驻南联盟使馆

看看新闻Knews
2026-05-27 01:41:50
社死现场!女子白拿外卖遭全网围观,播放破2000万,单位火速处置

社死现场!女子白拿外卖遭全网围观,播放破2000万,单位火速处置

潋滟晴方DAY
2026-05-27 10:00:42
30万顶大盖帽一夜清零!307亿退回,地方财路断了

30万顶大盖帽一夜清零!307亿退回,地方财路断了

奇葩游戏酱
2026-05-27 11:16:09
广州轻纺城大火18小时,48万仓库变火海,感人文字催人泪下

广州轻纺城大火18小时,48万仓库变火海,感人文字催人泪下

一曲一场談
2026-05-27 11:59:01
网购时要注意了,“旗舰店”和“官方店”一字之差,天壤地别!

网购时要注意了,“旗舰店”和“官方店”一字之差,天壤地别!

另子维爱读史
2026-05-25 07:55:09
唏嘘!29岁前中国男网1哥连续4个大满贯1轮游:不想打 感觉解脱了

唏嘘!29岁前中国男网1哥连续4个大满贯1轮游:不想打 感觉解脱了

我爱英超
2026-05-27 06:52:51
女生白嫖外卖海外播放超2000万!薪资被扒全网社死,更严重在后头

女生白嫖外卖海外播放超2000万!薪资被扒全网社死,更严重在后头

爱写的樱桃
2026-05-26 20:45:31
闹大了,多名媒体人爆料上海队外援涉嫌兴奋剂,总冠军要麻烦了

闹大了,多名媒体人爆料上海队外援涉嫌兴奋剂,总冠军要麻烦了

宗介说体育
2026-05-27 17:36:50
阿里美团京东集体沉默,朴朴报价太高了

阿里美团京东集体沉默,朴朴报价太高了

东哥解读电商
2026-05-27 10:28:14
邱兴华案20年:当聚焦犯罪人精神鉴定时,我们忽略了什么?

邱兴华案20年:当聚焦犯罪人精神鉴定时,我们忽略了什么?

新京报
2026-05-26 16:26:17
刚刚!无锡市人民政府重磅发布

刚刚!无锡市人民政府重磅发布

无锡eTV全媒体
2026-05-27 14:57:38
情侣住网红酒店遭偷拍,隐私画面被发网上!警方在中央空调内找到针孔摄像头,官方人士:外部人员装的摄像头,4人被刑拘

情侣住网红酒店遭偷拍,隐私画面被发网上!警方在中央空调内找到针孔摄像头,官方人士:外部人员装的摄像头,4人被刑拘

扬子晚报
2026-05-27 07:47:41
泡药杨梅后遗症:你一样一样地烂了,我一样一样地戒了!

泡药杨梅后遗症:你一样一样地烂了,我一样一样地戒了!

行者殷涛
2026-05-26 12:35:34
离谱,录像确认球被雷霆破坏出界,裁判仍将球权给雷霆&吹马刺技犯

离谱,录像确认球被雷霆破坏出界,裁判仍将球权给雷霆&吹马刺技犯

懂球帝
2026-05-27 10:55:42
张雪太给馆长面子!拿出珍贵的冠军香槟喝一半,馆长双手合十感谢

张雪太给馆长面子!拿出珍贵的冠军香槟喝一半,馆长双手合十感谢

火山詩话
2026-05-27 06:23:41
“室内39℃”!欧洲遭“最热五月天”,法国7人死亡,伦敦高温创纪录,中国留学生被热到自制“空调”!专家:欧洲多数家庭未普及空调

“室内39℃”!欧洲遭“最热五月天”,法国7人死亡,伦敦高温创纪录,中国留学生被热到自制“空调”!专家:欧洲多数家庭未普及空调

每日经济新闻
2026-05-27 14:35:05
上海真实收入到底是怎样的?评论区热议,真相超乎想象…

上海真实收入到底是怎样的?评论区热议,真相超乎想象…

慧翔百科
2026-05-27 08:37:04
北京今天狂发15.4万个绿牌!有人激动到哭,真的太不容易了!

北京今天狂发15.4万个绿牌!有人激动到哭,真的太不容易了!

起喜电影
2026-05-27 01:39:00
被追捧的“中产快乐水”,又是智商税?

被追捧的“中产快乐水”,又是智商税?

中国新闻周刊
2026-05-27 13:15:49
网友将问界新车路测画面发给国家反诈中心,被认定为AI生成

网友将问界新车路测画面发给国家反诈中心,被认定为AI生成

西虹市闲话
2026-05-26 16:43:17
2026-05-27 18:24:49
有连云 incentive-icons
有连云
中国领先的AI原生金融智能平台,为金融机构等提供智能体全链路解决方案。
267467文章数 62992关注度
往期回顾 全部

科技要闻

韬定律:全球在卷纳米数 华为换了一把尺子

头条要闻

男子婚内打赏女主播超1700万 两人首次见面就确定关系

头条要闻

男子婚内打赏女主播超1700万 两人首次见面就确定关系

体育要闻

这群老阿姨,是最硬核的马刺球迷

娱乐要闻

王鹤棣风波连累父亲炸串店遭差评?

财经要闻

ST岩石退市背后:A股“炒壳”时代终结

汽车要闻

极狐问道V9正式上市 限时19.48万元起

态度原创

游戏
教育
房产
时尚
军事航空

带派不!《地平线6》美女玉足痛车:伸手就能摸到脚趾头

教育要闻

536分捡漏上北大考生现状堪忧:硕士毕业后很迷茫,不知何去何从

房产要闻

地产投资又跌30%!连跌15月!海南房子将越来越少?

夏天没必要买太多衣服,准备一两条黑色短裙,轻盈舒适又减龄

军事要闻

以军称已打死哈马斯新任军事领导人

无障碍浏览 进入关怀版