网易首页 > 网易号 > 正文 申请入驻

OpenAI发布o1模型:错误率减少34%,速度提升50%,月付200美元Pro会员无限制调用 | 最前线

0
分享至

文 | 田哲

编辑 | 苏建勋

12月6日凌晨2点,OpenAI开启了12天工作日的首场直播。此次直播,OpenAI推出了o1模型,以及新的订阅服务ChatGPT Pro。自今天起,o1模型将取代o1-preview模型,ChatGPT Plus和Pro订阅用户均可使用。

今年9月,OpenAI正式推出o1大模型,可针对科学、代码和数学等领域的复杂问题解答,不过,彼时仅推出o1-preview、o1 mini两个版本,未解锁o1模型的全部能力。而此次发布会推出的o1模型,在智能化、多模态输入、思考速度等方面均有所提高。

OpenAI联合创始人、首席执行官Sam Altman表示,相对o1-preview,o1模型的重大错误率相比o1-preview减少了约 34%,而思考速度提升了约 50%。

他介绍,o1之所以与众不同,是其每次在回答之前都会思考,这使得它能够提供比其他模型更详细、更正确的答案。

o1的智能化体现在数学等复杂问题具备更高的准确率。据悉,o1模型在解答AIME 2024数学竞赛、博士级科学问题的准确率分别达到78.3%、75.6%,比o1-Preview的准确率分别高出28.3%,1.5%。

回答速度方面,o1也有所提升。在离线测试情况下,o1的平均响应速度比 O1 预览版快了约 60%。OpenAI员工在直播中提出一个问题,分别要求o1、o1-Preview列举公元2世纪的罗马皇帝,并简述他们的生平。结果显示,o1只花了约14秒解答,而o1-Preview耗费33秒。

OpenAI还注意到模型之前对所有问题都有较长的相应时间,他们已经修复这一问题。现在,如果你提出一个简单的问题,o1会快速作答;如果提出了一个复杂的问题,它会花更长的时间思考。

此外,o1新增多模态输入能力,能同时处理图片和文本内容,并进行推理。

OpenAI展示了一张手绘草图的A4纸,画有太阳、冷却系统等物体,以及不同数值,拍照上传给o1。o1在没有任何提示的情况下,生成用户可能想问的问题,并自动解答。接着在不到10秒的时间,o1不仅成功理解了草图的问题要求,还意识到没有提供的参数,自我推理给出了正确答案。

考虑到用户希望不受调用限制使用模型的需求,OpenAI此次推出了新的订阅机制ChatGPT Pro,用户每月付费200美元即可无限制使用更强的o1模型——o1 Pro。

OpenAI展示了o1-Preview、o1、o1 Pro在数学竞赛、代码竞赛、博士级科学问题的回答差异,在每个问题询问四次后,o1 Pro的可靠准确率最高,分别为80.0%、74.9%、74.2%。

来源:OpenAI

在直播中,OpenAI提出了一个o1-Preview回答错误的化学问题,要求o1 Pro找到符合特定标准的蛋白质。结果显示,o1 Pro仅耗费53秒完成答题,并允许用户查看思考过程。

OpenAI表示,他们计划让o1 Pro支持更多高计算密集型任务,允许处理更长和更复杂的任务。此外,o1 Pro还将新增网络浏览、文件上传和增强的API支持(例如结构化输出、函数调用和图像理解)功能。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
言承旭演唱会提词器带情绪指令引争议,阿信回应:因言承旭害怕上台、担心情绪失控才帮其备注以控制情绪,并非剧本化表演

言承旭演唱会提词器带情绪指令引争议,阿信回应:因言承旭害怕上台、担心情绪失控才帮其备注以控制情绪,并非剧本化表演

极目新闻
2026-03-21 11:10:09
三个省级党委领导班子调整

三个省级党委领导班子调整

吉刻新闻
2026-03-22 13:08:34
报应来得太快!俄宣传西蒙尼扬一家,终究没能躲过命运那记耳光

报应来得太快!俄宣传西蒙尼扬一家,终究没能躲过命运那记耳光

老马拉车莫少装
2026-03-22 19:46:19
难以置信!浙江55岁母亲称,庆幸儿子选择不婚不育,告别催婚内耗

难以置信!浙江55岁母亲称,庆幸儿子选择不婚不育,告别催婚内耗

火山詩话
2026-03-21 14:59:59
人类日夜不停地从地下抽走石油,这样下去,会不会“抽空地壳”?

人类日夜不停地从地下抽走石油,这样下去,会不会“抽空地壳”?

丁丁鲤史纪
2026-03-18 18:03:21
身段最好的就是她,可惜整垮了一点

身段最好的就是她,可惜整垮了一点

贵圈真乱
2026-03-23 10:30:00
外媒:“美国霸权在我们面前崩塌”

外媒:“美国霸权在我们面前崩塌”

参考消息
2026-03-23 09:53:10
普华永道CEO下死命令:合伙人必须AI化,否则立刻卷铺盖走人

普华永道CEO下死命令:合伙人必须AI化,否则立刻卷铺盖走人

超喜欢我
2026-03-21 10:28:11
加内特:如今的NBA与其说是运动,不如说更像是一场“秀”

加内特:如今的NBA与其说是运动,不如说更像是一场“秀”

懂球帝
2026-03-23 10:14:16
中超升班马被曝调整管理层:前中甲主帅或出任副总!

中超升班马被曝调整管理层:前中甲主帅或出任副总!

中超伪球迷
2026-03-23 10:36:43
51岁男子突发心梗猝死!不想得心梗,牢记晚饭4不吃,睡前4不要!

51岁男子突发心梗猝死!不想得心梗,牢记晚饭4不吃,睡前4不要!

健康之光
2026-03-20 17:05:06
胖东来货架上那瓶11.3元的芝麻酱,厂址印得比保质期还清楚

胖东来货架上那瓶11.3元的芝麻酱,厂址印得比保质期还清楚

阿天爱旅行
2026-03-22 17:10:43
硬气出手!5000磅钻地弹砸穿霍尔木兹,全球航道终于喘口气

硬气出手!5000磅钻地弹砸穿霍尔木兹,全球航道终于喘口气

老马拉车莫少装
2026-03-18 20:30:16
有没有人敢爆自己的瓜?网友:确定玩这么大吗?

有没有人敢爆自己的瓜?网友:确定玩这么大吗?

夜深爱杂谈
2026-02-18 20:55:58
内塔当不了总理了!以色列爆发混乱,万人走上街头,多地被围

内塔当不了总理了!以色列爆发混乱,万人走上街头,多地被围

共工之锚
2026-03-22 12:36:18
山姆官方紧急回应,网友却不买账

山姆官方紧急回应,网友却不买账

中国零售信息
2026-03-22 00:07:32
20万、30万、50万……跟“天王”同台跳鲨鱼舞,到底得花多少钱?

20万、30万、50万……跟“天王”同台跳鲨鱼舞,到底得花多少钱?

阿陆
2026-03-22 19:53:01
离那些张口闭口不离宏大叙事的人远点

离那些张口闭口不离宏大叙事的人远点

廖保平
2026-03-20 10:14:56
日韩股市暴跌

日韩股市暴跌

数据宝
2026-03-23 10:52:22
1991年苏联解体,叛逃少将马尔果夫申请回国,我国做出了什么决定

1991年苏联解体,叛逃少将马尔果夫申请回国,我国做出了什么决定

唠叨说历史
2026-03-18 15:22:11
2026-03-23 11:47:00
36氪 incentive-icons
36氪
让一部分人先看到未来
150925文章数 2848517关注度
往期回顾 全部

科技要闻

雷军、蔡崇信最新发声,提到同一件事

头条要闻

山西省原省长金湘军被公诉:任上被查 搞权色钱色交易

头条要闻

山西省原省长金湘军被公诉:任上被查 搞权色钱色交易

体育要闻

46岁生日快乐!巴萨全队穿10号致敬小罗

娱乐要闻

刘烨47岁生日,安娜晒全家福为其庆生

财经要闻

连续暴跌 乱世黄金失灵?

汽车要闻

岚图汽车香江鸣锣 一场关于"国家队"的突围实验

态度原创

房产
数码
亲子
家居
公开课

房产要闻

全城狂送1000杯咖啡!网易房产【早C计划】,即刻启动!

数码要闻

时隔四年磨一剑,小米全新笔记本媒体评价盘点

亲子要闻

躺平的孩子,终能迎来自己的春暖花开!

家居要闻

智慧生活 奢享家居

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版