网易首页 > 网易号 > 正文 申请入驻

GPT-5.2来了!OpenAI称其为“最强专业知识工作大模型”

0
分享至

财联社12月12日讯(编辑 史正丞)被谷歌逼到拉响“红色警报”后,OpenAI周四终于端出了最新前沿模型GPT-5.2系列。


图为OpenAI官网截图

OpenAI介绍称,GPT‑5.2是迄今为止在“专业知识工作方面”表现最好的模型系列,在制作电子表格、制作演示文稿、图像感知、编写代码以及理解长上下文等方面都优于前代产品。

GPT‑5.2有三种不同的版本:Instant是针对常规查询(如互联网检索、翻译和写作)进行速度优化的模型;Thinking擅长编程、数学、长文档分析等复杂结构化工作;顶级型号Pro,旨在为棘手问题提供最大程度的准确性和可靠性。

OpenAI特别强调,GPT‑5.2 Thinking是迄今为止最适合现实世界专业用途的模型。在评估涵盖44个职业的知识型工作任务的GDPval测试中,有70.9%的对比结果优于或持平于顶尖行业专业人士,这些任务包括制作销售演示文稿、会计电子表格、制造流程图或短视频等。


在评估涵盖44个职业的知识型工作任务的GDPval测试中,有70.9%的对比结果优于或持平于顶尖行业专业人士

另外在金融AI领域,GPT‑5.2Thinking的产出成果也明显好于GPT-5.1。

OpenAI给出的示例显示,GPT‑5.2 Thinking在制作人力资源规划模型、股权结构表和项目管理表格的任务中,产出成果较GPT‑5.1 Thinking有肉眼可见的进步。




OpenAI给出的示例

除了做PPT和Excel表格外,OpenAI也表示,GPT-5.2在编码、数学、科学、视觉、长文本推理以及工具使用等方面均刷新了基准成绩。公司称,这些能力的提升将有望带来“更可靠的代理式工作流程、可用于生产环境的代码,以及能够在大规模上下文和真实世界数据中运行的复杂系统”。

横向比较方面,GPT-5.2 Thinking在几乎所有列出的推理测试中都略胜于Gemini 3和Anthropic的Claude Opus 4.5,涵盖现实世界的软件工程任务(SWE-Bench Pro)和博士级别的科学知识(GPQA Diamond),到抽象推理和模式发现(ARC-AGI套件)。


GPT-5.2 Thinking在几乎所有列出的推理测试中都略胜于Gemini 3和Anthropic的Claude Opus 4.5

OpenAI产品负责人Max Schwarzer也在周四通报称,GPT-5.2 Thinking的回复较前代减少了38%的错误,使该模型在日常决策、研究和写作中更为可靠。

从周四开始,GPT‑5.2将向所有ChatGPT付费用户和API用户推送。所以这个新模型到底有多么适合“打工”,很快就能见分晓。

作为OpenAI对谷歌的反击,GPT‑5.2仅仅是打出的“第一拳”。

公司CEO奥尔特曼在周四宣布,下周会给用户们带来一些“小小的圣诞礼物”。他也在周四表示,Gemini 3对公司各项指标的影响比原本担心得要小。他还说,预计OpenAI将在明年1月“以非常强劲的姿态”退出目前的红色警报状态


图为奥尔特曼社媒发文截图

OpenAI首席产品官Fidji Simo也在周四透露,现在已经开始在部分地区推出年龄估算系统,此举旨在控制ChatGPT对18岁以下用户回复的内容。Simo也表示,公司希望在明年一季度推出“成人模式”前先引入这一功能。

略有遗憾的是,周四的新品发布似乎聚焦于新模型的推理能力,没有推出新的图像生成器。而今年以来,为数不多的几次现象级新品发布都与图像、视频生成产品有关。奥尔特曼的“红色警报”备忘录中,也提及要改善图像生成能力。

此前有报道称,OpenAI计划在明年1月再发布一款新模型,具有更好的图像能力和更完善的个性化特点,但公司周四未对这一传言予以确认。

责任编辑:戴丽丽_NN4994

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
与名模离婚净身出户5年后,40岁的前男篮国手孙悦,今已判若两人

与名模离婚净身出户5年后,40岁的前男篮国手孙悦,今已判若两人

小熊侃史
2026-02-16 07:10:12
哪个细节让你突然发现自己消费降级了?电动车,真的谁骑谁香

哪个细节让你突然发现自己消费降级了?电动车,真的谁骑谁香

另子维爱读史
2026-02-13 21:18:44
深度揭秘 | 封疆大吏罗保铭:贪婪腐化,大办丧事敛财,大搞迷信活动

深度揭秘 | 封疆大吏罗保铭:贪婪腐化,大办丧事敛财,大搞迷信活动

一分为三看人生
2026-02-11 16:18:47
主场定了!中国男篮将在这里迎战日本!

主场定了!中国男篮将在这里迎战日本!

梦忆之浅
2026-03-03 01:18:44
印度这十年:莫迪对中国最大的贡献,是断了所有人的念想

印度这十年:莫迪对中国最大的贡献,是断了所有人的念想

历史有些冷
2026-03-03 16:15:03
观察|美国未经国会授权空袭伊朗:当颠覆法治的危险先例开始泛滥,世界将会怎样?

观察|美国未经国会授权空袭伊朗:当颠覆法治的危险先例开始泛滥,世界将会怎样?

澎湃新闻
2026-03-03 07:20:26
莫迪杀红了眼!吞了中企几百亿,又派人来偷火,中国不能坐以待毙

莫迪杀红了眼!吞了中企几百亿,又派人来偷火,中国不能坐以待毙

梁讯
2026-02-28 15:40:12
造谣婚礼博眼球,南充公安依法查处一起扰乱公共秩序案

造谣婚礼博眼球,南充公安依法查处一起扰乱公共秩序案

极目新闻
2026-03-03 17:02:50
以军空袭贝鲁特南郊 杰哈德在黎指挥官遇袭身亡

以军空袭贝鲁特南郊 杰哈德在黎指挥官遇袭身亡

财联社
2026-03-03 04:09:20
肝癌后才懂放手!孙志浩全部遗产归梧桐妹,这结局谁也没料到

肝癌后才懂放手!孙志浩全部遗产归梧桐妹,这结局谁也没料到

小椰的奶奶
2026-03-01 10:32:16
14年儿子坐马航失联,多年后父亲收到回信,坚信儿子去了平行世界

14年儿子坐马航失联,多年后父亲收到回信,坚信儿子去了平行世界

史行途
2026-01-29 12:13:30
多家交易所,紧急提示风险!

多家交易所,紧急提示风险!

环球网资讯
2026-03-03 07:59:09
2026铁饭碗排名出炉!教师竟然跌到第9,第1名让所有人都沉默了!

2026铁饭碗排名出炉!教师竟然跌到第9,第1名让所有人都沉默了!

金哥说新能源车
2026-02-27 05:18:50
92岁台湾老兵回重庆寻亲,下飞机后却怒斥子女:这不还是台北

92岁台湾老兵回重庆寻亲,下飞机后却怒斥子女:这不还是台北

海佑讲史
2026-02-28 21:19:37
韩媒:伊朗若退出世界杯,伊拉克将递补,中国队遭遇重创太绝望了

韩媒:伊朗若退出世界杯,伊拉克将递补,中国队遭遇重创太绝望了

罗纳尔说个球
2026-03-02 10:43:21
深度 | 最高领袖身亡,美以叫嚣继续打,伊朗能否挺过47年来最致命危机?

深度 | 最高领袖身亡,美以叫嚣继续打,伊朗能否挺过47年来最致命危机?

上观新闻
2026-03-01 16:17:08
这跟不穿有啥区别?内裤外露、开叉开到腰,有钱人的时尚真看不懂

这跟不穿有啥区别?内裤外露、开叉开到腰,有钱人的时尚真看不懂

洲洲影视娱评
2026-03-02 21:06:50
为什么美国、日本第一时间就知道中国的决策、军事及重大的工程等

为什么美国、日本第一时间就知道中国的决策、军事及重大的工程等

有牙的兔纸
2026-03-03 01:26:17
她是体坛冠军中的“败类”,为捞钱共侍二夫,坑了44亿逃到美国

她是体坛冠军中的“败类”,为捞钱共侍二夫,坑了44亿逃到美国

削桐作琴
2026-03-02 15:10:50
美国没想到,俄罗斯也没想到!中国石油,如今会成为“遥遥领先”

美国没想到,俄罗斯也没想到!中国石油,如今会成为“遥遥领先”

来科点谱
2026-02-20 07:16:30
2026-03-03 18:31:00
财联社 incentive-icons
财联社
以“准确、快速、权威、专业”为新闻准则,为投资者提供专业的投资资讯。
690357文章数 1018204关注度
往期回顾 全部

科技要闻

拥抱AI的"牛马":边提效边自嘲"自费"上班

头条要闻

袭击伊朗后 特朗普首次发表白宫讲话:将不惜一切代价

头条要闻

袭击伊朗后 特朗普首次发表白宫讲话:将不惜一切代价

体育要闻

35轮后积分-7,他们遭遇史上最早的降级

娱乐要闻

谢娜霸气护夫:喊话薛之谦给张杰道歉

财经要闻

特朗普“不惜一切”!全球股债齐崩

汽车要闻

第一梯队辅助驾驶加持 iCAR V27定档3月13日上市

态度原创

艺术
家居
旅游
数码
公开课

艺术要闻

Nihad Aghazada:当代阿塞拜疆画家

家居要闻

万物互联 享科技福祉

旅游要闻

登达“川东之巅”,打开一本立体地理教科书|寻找21“峰”面

数码要闻

荣耀MagicBook Pro 14实测:锐炫B370性能追上大哥B390!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版