网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

GPT-5.6来了：旗舰版碾压GPT-5.5，价格却没涨

2026-06-27 08:35:39　来源: 字母榜

北京举报

0

分享至

GPT-5.6来了，但……这是个什么型号？

这次OpenAI没有沿用过去大家熟悉的Pro、Mini、Instant这类命名，而是一次性端出了三个名字：GPT-5.6 Sol、GPT-5.6 Terra、GPT-5.6 Luna。

Sol是太阳，Terra是地球，Luna是月亮。

听起来很花哨，像一个新的模型宇宙。但它其实还是我们熟悉的那套产品分层：一个最强的旗舰模型，一个日常使用的均衡模型，一个便宜、快速、适合大规模调用的轻量模型。

OpenAI官方说法是：GPT-5.6系列会在未来几周全面开放，但目前先应美国政府要求，在Codex和API中向一小群“值得信赖的合作伙伴”进行有限预览。

让我们先来了解一下已公开的情报。

01

最高档和GPT 5.5同价

OpenAI这次给GPT-5.6分了三档：Sol、Terra、Luna。

按照官方说法，Sol是旗舰模型，Terra是面向日常工作的均衡模型，Luna则是快速、便宜的轻量模型。

三档模型一口气全放了出来，基本对应大模型产品里最常见的三层结构：最强模型负责能力上限，中间模型负责大多数日常任务，轻量模型负责速度、成本和高并发调用。

从价格就能看出三者的层级。

按照OpenAI公布的API价格，GPT-5.6按每100万token计费：Sol是输入5美元、输出30美元；Terra是输入2.5美元、输出15美元；Luna是输入1美元、输出6美元。

相信大家可能注意到了：GPT-5.6 Sol虽然是新一代旗舰模型，但价格对齐的是GPT-5.5标准版，而不是GPT-5.5 Pro。

Terra则直接降到GPT-5.5的一半，Luna只有GPT-5.5的五分之一。

GPT-5.5 Pro依然是当前OpenAI最贵的模型，价格是输入30美元/百万token，输出180美元/百万token，价格是GPT-5.5标准版和GPT-5.6 Sol的6倍。也不知道之后会不会再出一个“更适合专业任务”的GPT-5.6 Universe（只是开玩笑）。

Sol是这次GPT-5.6系列里的最高档，也是官方公告里花最多篇幅介绍的模型。

OpenAI把GPT-5.6 Sol称为目前最强模型，重点展示了它在写代码、生物研究和网络安全上的能力。

简单说，Sol的定位是“最会干活的模型”，它对应的不是普通聊天场景，是更复杂、更接近真实工作的任务。

比如在代码场景里，它可以围绕一个目标持续推进：先理解问题，再拆步骤，然后调用工具、运行命令、检查结果，出错了再改，直到任务完成。

为了支撑Sol处理更难的任务，OpenAI给GPT-5.6引入了两个新机制。

第一个叫max reasoning effort，可以翻译成“最大推理强度”。

通俗理解，就是让Sol有更多时间想清楚问题、花更长时间进行深度推理，适合那些不能靠第一反应解决的复杂任务。

第二个叫ultra mode，可以理解为“超强模式”。

这个模式的重点是让多个子智能体一起参与复杂任务，可以理解为：过去是一个AI助手自己干活，现在是一个“AI经理”带着几个小助手分头处理问题，从而加快复杂工作的推进。

Terminal-Bench 2.1就是一个更接近真实开发流程的测试，考的是模型能不能在命令行环境里一步步解决问题。GPT-5.6 Sol在该测试中拿到了88.8%的高分，Ultra模式下得分更高。

OpenAI特别提到，等模型更广泛开放时，还会公布一套更完整的评测结果。

Terra是中间档。

OpenAI对Terra的介绍没有那么长，但定位很清楚：它是面向日常工作的均衡模型。

也就是说，它不一定追求最强，但要在效果、速度和成本之间取得平衡。官方强调，Terra的能力接近GPT-5.5，但价格便宜一半。

在OpenAI的设想中，Terra很可能才是GPT-5.6系列里最常用的那一档。普通办公任务很多时候不需要Sol那样的最高能力，但需要稳定、便宜、好用。

在Terminal-Bench 2.1测试中，GPT-5.6 Terra拿到了84.3%，和Claude Fable 5持平。

Luna则是最低成本档。

OpenAI对Luna的定位也很简单：快，便宜，它适合大量、高频、对成本敏感的任务。

比如批量摘要、文本分类、信息抽取、简单问答等等，这些任务本身不一定复杂，但调用量可能非常大。Luna的作用，就是把这些轻量任务用更低成本跑起来。

这三档模型，Sol负责最高能力，Terra负责日常工作，Luna负责速度和成本，听起来花哨，但OpenAI只是把大模型行业已经很成熟的分层重新包装了一遍。

不过我觉得名字什么的并不重要，便宜好用就行。

02

性价比这一块儿

只看官方公告，GPT-5.6 Sol这次放出的benchmark并不算多。OpenAI自己也说，现在只是为了让外界提前了解模型性能，所以先分享一组评估结果。

但放出来的这组benchmark方向很明确，集中展示了三个领域：代码、生物学和网络安全。

前面提到的Terminal-Bench 2.1就属于代码方向，它考的是模型能不能在命令行环境里完成真实开发流程，包括规划、反复修改、调用工具和验证结果。

除了代码，OpenAI还重点提到了一个生物学benchmark：GeneBench v1。

GeneBench v1评估的是长周期的基因组学和定量生物学分析任务，重点看模型能不能处理更接近真实科研流程的分析问题。

按照OpenAI的说法，GPT-5.6 Sol在GeneBench v1上比GPT-5.5表现更强，而且使用的token更少。

第三个重点方向是网络安全。OpenAI称，GPT-5.6 Sol是它目前最强的网络安全模型，尤其是在长周期安全任务上（包括漏洞研究和漏洞利用相关任务）。

这里有一个benchmark叫 ExploitBench——它不是一般的安全问答，是更接近漏洞利用场景的评估。

OpenAI称，在ExploitBench上，GPT-5.6 Sol的表现可以和Mythos Preview媲美，但只用了大约三分之一的输出token。

虽然，官方给出的这张图上还有一定差距。

可以看出，OpenAI这次反复强调：他们在能力强的同时，效率也特高。

更少的输出token，意味着模型完成同类任务时可能更简洁、更少绕路，也可能意味着实际调用成本更可控。

OpenAI还提到了另一个网络安全benchmark：ExploitGym。

这个benchmark是UC Berkeley研究人员与OpenAI以及其他前沿实验室合作创建的。OpenAI说，在ExploitGym上，GPT-5.6 Sol、Terra、Luna三档模型都显示出明显的网络安全能力提升，而且随着推理强度提高，表现也会变强。

意思是，GPT-5.6的提升不只是模型本体变强，也和推理方式有关。给模型更多时间思考、让它做更长链条的推理，结果就会更好。

03

关于有限预览

如果说Sol、Terra、Luna是GPT-5.6表面上的变化，那么更值得关注的事情是，OpenAI这次没有直接全面开放。

按照官方公告，目前GPT-5.6只会先在Codex和API中，向一小群“值得信赖的合作伙伴”进行有限预览。

并且，这次有限预览是“应美国政府要求”进行的，参与预览的合作伙伴名单已经和美国政府共享。

最近一段时间，美国政府正在明显加强对前沿AI模型的介入，尤其是那些具备更强代码、网络安全和agent能力的模型。

今年6月，美国政府发布了新的AI网络安全相关行政令，提出要建立一个自愿框架，让前沿模型开发者在模型更广泛发布前，与政府进行接触和评估。

法律界对这份行政令的解读是：它名义上不是强制许可、也不是正式审批制度，但已经搭起了一个政府参与模型发布前评估的制度框架。

GPT-5.6 Sol“先小范围预览、名单与政府共享”的发布模式，可以看做前沿模型的发布流程里，第一次出现了清晰的政府介入痕迹。

OpenAI自己也在公告里解释，之所以采取这种方式，是为了和政府一起探索一个可重复的流程，用来支持未来的模型发布。

政府介入背后，核心原因是网络安全。

官方公告里，网络安全占了非常大的篇幅：OpenAI一边强调GPT-5.6 Sol是它目前最强的网络安全模型，能在漏洞研究、漏洞分析、安全防御等长周期任务上提供更强帮助；另一边又花了大量篇幅解释，它没有跨过自己的Cyber Critical门槛。

OpenAI的准备框架里，把高风险能力分成不同等级。达到High，意味着模型可能放大已有的严重风险；达到Critical，则意味着模型可能带来前所未有的新型严重风险。

OpenAI反复强调GPT-5.6 Sol没有达到Cyber Critical，其实是在告诉政府、客户和公众：这个模型很强，尤其在网络安全任务上很强，但还没有强到可以自主完成最危险的网络攻击链。

网络安全能力就像一把双刃剑，它越强，越能帮防御者找漏洞、写补丁、做安全测试；但也正因为它很强，政府也会担心它被滥用。

虽然OpenAI承认这次发布需要和政府一起摸索流程，但它也在官方公告里明确说明，他们不认为这种政府访问流程应该成为长期默认机制。

理由是：如果最强工具总是被拖延开放，用户、开发者、企业、网络防御者和全球合作伙伴都会更晚拿到最好的工具。

某种意义上，前沿模型正在进入一个新的发布阶段。

当大模型的能力集中到代码、生物、网络安全和智能体执行这些领域，它就会开始被当成一种可能影响现实世界安全的技术。

而一旦技术被这样看待，发布权就很难再完全留在公司自己手里。（作者/袁心玥）

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

中国第一美国第二美国人承认中国领导力超美国

看看新闻Knews 2026-06-26 16:31:52
55690 跟贴 55690
陈宇剑被免去上海市副市长职务！曾任上海市松江区区长，闵行区区长、区委书记

中安在线 2026-06-26 19:39:31
257 跟贴 257

探究科技股极致“吸金”行情

中国经济网 2026-06-27 10:59:21
9 跟贴 9

鲁比奥称"美俄在阿拉斯加未达成任何共识" 俄方反驳

环球网资讯 2026-06-26 20:09:24
10813 跟贴 10813
小组第三排名跌至第8位韩国队已命悬一线

封面新闻 2026-06-27 13:54:11
131 跟贴 131

山姆确认，尚未调价！全国多地门店iPad及Mac遭疯抢，网友：比618还是贵了

都市快报橙柿互动 2026-06-26 22:35:20
112 跟贴 112

强化体能、打磨技术，中国女篮将迎实战检验

环球网资讯 2026-06-27 10:37:15
36 跟贴 36
务工男子严重烧伤住进ICU，上大二的儿子割皮救父：晚上痛得睡不着，但爸爸有一丝希望就不会放弃

极目新闻 2026-06-26 17:47:38
206 跟贴 206

工信部就《开源鸿蒙设备统一互联接入与控制接口》等3项行业标准、9项推荐性国家标准计划项目意见公开征求意见

每日经济新闻 2026-06-26 17:14:09
876 跟贴 876
Siegel：湖人不会在自由球员市场上不惜一切代价留住詹姆斯

北青网-北京青年报 2026-06-27 12:56:07
36 跟贴 36
“一天一个价”！有网友晒单：去年不到7千，今年1.2万了

中国经济网 2026-06-26 15:53:04
81 跟贴 81
昔日汽车经销巨头全面转型“包租公”：现有500多家自有店面仅30家在营，以售后为主

红星新闻 2026-06-27 11:50:13
60 跟贴 60
我国核聚变堆超导磁体研发取得重要突破

新京报 2026-06-27 10:12:23
872 跟贴 872
欧洲热浪已致上百人死亡，为什么不开空调？

中国能源网 2026-06-25 10:05:41
928 跟贴 928
最新：河南省内外高校在豫招生预估分数线汇总

大象新闻 2026-06-27 11:02:16
31 跟贴 31
WTI原油日内跌幅达4%，布伦特原油跌近4%

每日经济新闻 2026-06-26 16:42:07
500 跟贴 500
在英华人：没有空调晚上热得无法入睡风扇价格翻3倍

极目新闻 2026-06-27 11:59:02
281 跟贴 281
中国"避暑神器"在欧洲卖爆生产企业：正加班加点补货

第一财经资讯 2026-06-27 07:44:23
0 跟贴 0
重塑合资插混价值标杆，一汽-大众PHEV双车上市16.99万元起

中国经济网 2026-06-26 16:17:15
78 跟贴 78
段永平坐不住了，晒图直夸 “蛮可爱的”！新品发售遇冷，罕见“破发”，泡泡玛特股价巨震

都市快报橙柿互动 2026-06-27 08:02:12
83 跟贴 83
中国代表：绝不允许“新型军国主义”成势为患

新京报 2026-06-27 07:22:06
568 跟贴 568
名记：伦纳德已表明他不愿意与活塞签下续约合同

北青网-北京青年报 2026-06-27 12:56:20
1 跟贴 1
“涉绵阳、马鞍山两地文旅项目经营惨淡致停运”不实（2026·06·26）

今日辟谣 2026-06-26 18:33:09
73 跟贴 73
中国海军83舰编队结束对俄罗斯友好访问

环球网资讯 2026-06-27 10:48:13
22 跟贴 22
第38届大众电影百花奖投票正火热进行

中国电影报 2026-06-26 12:41:53
0 跟贴 0
只因在车流中多看了一眼，这位所长突然掉头

环球网资讯 2026-06-27 15:34:19
0 跟贴 0

儿子估分709，母亲提前办宴宣称稳上北大，正式查分后全家当场傻

儿子估分709，母亲提前办宴宣称稳上北大，正式查分后全家当场傻

起喜电影

2026-06-26 07:40:59

难怪西方曾集体对华黑脸：全球蛋糕分完，发现桌上只有7亿人的碗

难怪西方曾集体对华黑脸：全球蛋糕分完，发现桌上只有7亿人的碗

长星寄明月

2026-06-27 15:05:33

刚访问完中国，韩国总理突然辞职，李在明急找文在寅，担心出内讧

刚访问完中国，韩国总理突然辞职，李在明急找文在寅，担心出内讧

触摸史迹

2026-06-27 12:23:04

男子突发脑出血，结婚15年没下过厨房的妻子为救丈夫欲卖宝马车：以后等他能坐轮椅，我可以上班赚钱养他

男子突发脑出血，结婚15年没下过厨房的妻子为救丈夫欲卖宝马车：以后等他能坐轮椅，我可以上班赚钱养他

台州交通广播

2026-06-26 20:46:53

6月30日前滚出南非！南非仇外团体下最后通牒，南非是越来越乱

6月30日前滚出南非！南非仇外团体下最后通牒，南非是越来越乱

小小科普员

2026-06-26 14:06:31

捡大漏了！选择211中外合办高额学费，合作方解约，调回普通专业

捡大漏了！选择211中外合办高额学费，合作方解约，调回普通专业

火山詩话

2026-06-27 09:38:09

摘下桑顿，追逐斯玛特！火箭重组1号位，为范弗里特离队做准备？

摘下桑顿，追逐斯玛特！火箭重组1号位，为范弗里特离队做准备？

熊哥爱篮球

2026-06-27 13:40:22

背8个鸡蛋接考的父亲，等来了526分，可这分数，够得着湘潭大学吗

背8个鸡蛋接考的父亲，等来了526分，可这分数，够得着湘潭大学吗

手工制作阿爱

2026-06-27 06:15:42

范子铭拒绝山东？想去广东、广厦争冠队，球迷怒喷：眼高手低！

范子铭拒绝山东？想去广东、广厦争冠队，球迷怒喷：眼高手低！

体坛侃排球

2026-06-27 14:30:16

意难平！庞峥麟无缘12人大名单，球迷惋惜：热身赛高光不该被辜负

意难平！庞峥麟无缘12人大名单，球迷惋惜：热身赛高光不该被辜负

小兰看体育

2026-06-27 11:10:24

女子称酒后家中遭男子性侵，DNA鉴定显示两人发生过性关系，警方认为无犯罪事实不予立案；律师说法

女子称酒后家中遭男子性侵，DNA鉴定显示两人发生过性关系，警方认为无犯罪事实不予立案；律师说法

大风新闻

2026-06-26 15:32:22

世界杯小组赛仅剩6场！第3名积分榜出炉，韩国出线需满足2个条件

世界杯小组赛仅剩6场！第3名积分榜出炉，韩国出线需满足2个条件

球场没跑道

2026-06-27 13:13:58

高考数学唯一满分男生被清华录取，网友担心他去美国，答案很现实

高考数学唯一满分男生被清华录取，网友担心他去美国，答案很现实

娱乐E君

2026-06-26 18:07:56

手握3大优势！日本主帅放话赢巴西，罗纳尔多表态，说的有点扎心

手握3大优势！日本主帅放话赢巴西，罗纳尔多表态，说的有点扎心

萌兰聊个球

2026-06-26 17:56:05

比独行侠送出东契奇更离谱，球迷：见过蠢的，没见过如此蠢的！

比独行侠送出东契奇更离谱，球迷：见过蠢的，没见过如此蠢的！

奇迹行者在刷野

2026-06-27 10:49:24

中国银行行长张辉回应了！直击股东会：16亿投资长江存储和长鑫科技，收益如何？

中国银行行长张辉回应了！直击股东会：16亿投资长江存储和长鑫科技，收益如何？

时代周报

2026-06-27 08:02:25

17只滞涨股下周将实施大额分红

17只滞涨股下周将实施大额分红

证券时报

2026-06-27 08:38:07

内马尔也没想到，被全足坛都往死里针对的他，如今对手却不敢铲？

内马尔也没想到，被全足坛都往死里针对的他，如今对手却不敢铲？

小莜读史

2026-06-26 18:46:05

离队第二人？尼克斯难留沙梅特，下份合同多大合适？

离队第二人？尼克斯难留沙梅特，下份合同多大合适？

篮球实录

2026-06-27 14:24:34

韩国队天要塌了！伊朗队1-1小组第三排名反超，亚洲2强或全出局

韩国队天要塌了！伊朗队1-1小组第三排名反超，亚洲2强或全出局

体育知多少

2026-06-27 13:29:16

让未来不止于大。

2573文章数 8066关注度

往期回顾全部

科技要闻

GPT-5.6发布，你暂时用不了！Mythos也放行

头条要闻

美国专家：亚洲秩序正在转变中国统一可能"不战而胜"

头条要闻

美国专家：亚洲秩序正在转变中国统一可能"不战而胜"

体育要闻

世界杯最火门将，站到了阿根廷和梅西面前

娱乐要闻

四提白玉兰终封后，杨紫：仍觉不真实

财经要闻

OpenAI推迟IPO重创软银！

汽车要闻

首搭华为乾崑智驾ADS5 启境GT7上市售价20.99万-32.99万元

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

健康

数码

时尚

游戏

军事航空

“无糖汤圆”是否隐藏着健康陷阱？

数码要闻

美光预测：内存危机至少得持续到2028年

乙女游戏新人设，竟然是195年下体育生？！

《幻兽帕鲁》主创：与竞品生存游戏之间并无嫌隙

军事要闻

黎以美达成三方框架协议

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版