网易首页 > 网易号 > 正文 申请入驻

OpenAI推出一对AI推理模型:o3和o4-mini

0
分享至

OpenAI 周四宣布推出 o3 和 o4-mini,这是新的 AI 推理模型,旨在在回答问题之前暂停并思考问题。该公司称 o3 是其迄今为止最先进的推理模型,在数学、编码、推理、科学和视觉理解能力的测试中均超越了该公司之前的模型。

与此同时,o4-mini 提供了 OpenAI 所说的价格、速度和性能之间的平衡——这三个因素是开发人员在选择用于支持其应用程序的 AI 模型时经常考虑的。

与之前的推理模型不同,o3 和 o4-mini 可以使用 ChatGPT 中的工具(例如网页浏览、Python 代码执行、图像处理和图像生成)生成响应。从今天开始,这些模型以及 o4-mini 的一个变体 o4-mini-high(花费更多时间精心设计答案以提高其可靠性)可供 OpenAI 的 Pro、Plus 和 Team 计划的订阅者使用。

这些新模型是 OpenAI 在激烈的全球 AI 竞赛中击败Google、Meta、xAI、Anthropic 和 DeepSeek 的努力之一。虽然 OpenAI 率先发布了 AI 推理模型 o1,但竞争对手也迅速跟进,推出了性能匹敌甚至超越 OpenAI 的版本。事实上,随着 AI 实验室不断提升系统性能,推理模型已开始成为该领域的主导。

O3 差点没能在 ChatGPT 中发布。OpenAI 首席执行官 Sam Altman 今年 2 月曾表示,公司打算投入更多资源,开发一个融合 O3 技术的更复杂的替代方案。但竞争压力似乎最终促使 OpenAI 改变了方向。

OpenAI 表示,o3 在 SWE-bench 验证中达到了最佳性能,该测试衡量了编程能力,得分为 69.1%。o4-mini 模型也达到了类似的性能,得分为 68.1%。OpenAI 的次优模型 o3-mini 在测试中得分为 49.3%,而 Claude 3.7 Sonnet 得分为 62.3%。

OpenAI 声称,o3 和 o4-mini 是其首批能够“用图像思考”的模型。实际上,用户可以将图像上传到 ChatGPT,例如白板草图或 PDF 中的图表,模型会在“思维链”阶段分析图像,然后再做出回答。凭借这项新发现的能力,o3 和 o4-mini 能够理解模糊和低质量的图像,并在推理过程中执行缩放或旋转图像等任务。

除了图像处理功能之外,o3 和 o4-mini 还可以通过 ChatGPT 的 Canvas 功能直接在浏览器中运行和执行 Python 代码,并在被问及时搜索网络。

除了 ChatGPT 之外,所有三种模型(o3、o4-mini 和 o4-mini-high)都将通过 OpenAI 面向开发人员的端点 Chat Completions API 和 Responses API 提供,从而允许工程师按照基于使用率的费率使用该公司的模型构建应用程序。

鉴于 o3 性能的提升,OpenAI 向开发者收取的费用相对较低,每百万输入词元(约 75 万字,比《指环王》系列更长)收费 10 美元,每百万输出词元收费 40 美元。对于 o4-mini,OpenAI 的收费与 o3-mini 相同,每百万输入词元收费 1.10 美元,每百万输出词元收费 4.40 美元。

OpenAI 表示,未来几周内,它计划发布 o3-pro,这是 o3 的一个版本,它使用更多的计算资源来生成答案,专门供 ChatGPT Pro 订阅者使用。

OpenAI 首席执行官 Sam Altman 表示,o3 和 o4-mini 可能是 GPT-5 之前 ChatGPT 中的最后几个独立 AI 推理模型,该公司表示,GPT-5 将把 GPT-4.1 等传统模型与其推理模型统一起来。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
泽连斯基勇敢出手!匈牙利威胁无效,俄油管被彻底封堵!

泽连斯基勇敢出手!匈牙利威胁无效,俄油管被彻底封堵!

高博新视野
2026-02-25 17:11:31
外资撤不走,中国拦不住,如今的中国广东,制造早已不是代工

外资撤不走,中国拦不住,如今的中国广东,制造早已不是代工

甜柠聊史
2026-01-23 14:01:57
俄总统特别代表在日内瓦与美方会晤

俄总统特别代表在日内瓦与美方会晤

新华社
2026-02-27 03:26:04
正月十五元宵节,1不丢,2不留,3要吃,4不洗,马年迎财纳福

正月十五元宵节,1不丢,2不留,3要吃,4不洗,马年迎财纳福

匹夫来搞笑
2026-02-26 18:10:37
当年举报毕福剑的那位告密者竟然变成这样了!谁能想到啊?

当年举报毕福剑的那位告密者竟然变成这样了!谁能想到啊?

霹雳炮
2026-02-06 13:48:54
欧冠16强出炉!3场超级大战在酝酿:皇马vs曼城 巴萨踢巴黎

欧冠16强出炉!3场超级大战在酝酿:皇马vs曼城 巴萨踢巴黎

叶青足球世界
2026-02-26 09:18:09
暴跌60%,引来全国牙科关店潮,暴利的牙科生意真的走到了尽头?

暴跌60%,引来全国牙科关店潮,暴利的牙科生意真的走到了尽头?

小熊侃史
2026-01-17 07:50:11
西部矿业:在有色金属价格维持高位运行的背景下,公司能更好地分享价格上涨带来的红利

西部矿业:在有色金属价格维持高位运行的背景下,公司能更好地分享价格上涨带来的红利

每日经济新闻
2026-02-26 20:46:10
曝艾顿输球后曾抱怨:他们想把我变成卡佩拉 我才不是什么卡佩拉

曝艾顿输球后曾抱怨:他们想把我变成卡佩拉 我才不是什么卡佩拉

罗说NBA
2026-02-26 21:41:06
中国50后还有多少人?多少人能活到80岁?权威数据告诉你

中国50后还有多少人?多少人能活到80岁?权威数据告诉你

芭比衣橱
2026-02-19 21:00:42
日版《水浒传》开播,看得我脸都红了

日版《水浒传》开播,看得我脸都红了

i书与房
2026-02-26 14:51:41
在县城,“月薪三千”属于高工资

在县城,“月薪三千”属于高工资

星海情报局
2026-02-26 11:17:25
人有没有肠息肉,看吃饭就知道?肠内长息肉,吃饭或有这5个表现

人有没有肠息肉,看吃饭就知道?肠内长息肉,吃饭或有这5个表现

小童历史
2025-10-11 14:26:11
外交部:中方支持伊朗政府和人民维护国家稳定和正当权益

外交部:中方支持伊朗政府和人民维护国家稳定和正当权益

每日经济新闻
2026-02-26 16:15:19
舍得酒:郭广昌的提款机?

舍得酒:郭广昌的提款机?

新浪财经
2026-02-26 10:09:14
佛山顺德一4A景区灰塑被人拿下,官方通报

佛山顺德一4A景区灰塑被人拿下,官方通报

南方都市报
2026-02-26 12:58:14
山东四胞胎“冰清玉洁”:勇闯娱乐圈出道失败,如今成酒吧擦边女

山东四胞胎“冰清玉洁”:勇闯娱乐圈出道失败,如今成酒吧擦边女

法老不说教
2026-02-25 19:11:57
堵车的源头找到了!怀化一高速长达12公里拥堵,居然是司机睡着了

堵车的源头找到了!怀化一高速长达12公里拥堵,居然是司机睡着了

火山詩话
2026-02-26 10:07:44
王宝强也没料到,释永信毁灭牵出前妻马蓉旧事,自己差点“垫背”

王宝强也没料到,释永信毁灭牵出前妻马蓉旧事,自己差点“垫背”

阿讯说天下
2026-02-19 17:27:11
人社部传来好消息!2026年养老金或继续调整,企退人员能涨4%吗?

人社部传来好消息!2026年养老金或继续调整,企退人员能涨4%吗?

另子维爱读史
2026-02-26 20:19:13
2026-02-27 04:59:00
cnBeta.COM incentive-icons
cnBeta.COM
提供IT行业即时资讯
66725文章数 70106关注度
往期回顾 全部

科技要闻

单季营收681亿净利429亿!英伟达再次炸裂

头条要闻

美国政府对外交官下令:开始行动

头条要闻

美国政府对外交官下令:开始行动

体育要闻

从排球少女到冰壶女神,她在米兰冬奥练出6块腹肌

娱乐要闻

向华强公开表态 财产留给儿媳妇郭碧婷

财经要闻

中国AI调用量超美国 4款大模型霸榜前5

汽车要闻

40岁的吉利,不惑于内外

态度原创

教育
房产
数码
艺术
公开课

教育要闻

小升初学霸题,能答对很厉害了,求面积

房产要闻

2.2万/m²起!三亚主城性价比标杆 海垦·桃花源实景现房春节被疯抢

数码要闻

三星Galaxy S26全球新品发布

艺术要闻

莫妮卡、麦当娜……这个法国女人拍遍了全世界的性感女神!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版