网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

贵63%只快45秒，GPT-5.5的定价谁算过账

2026-05-06 21:25:31　来源: 全栈遛狗员

北京举报

0

分享至

OpenAI最新旗舰模型GPT-5.5上线当天，评测团队Tessl就塞给它1742场考试。结果出炉后，一个尴尬的事实浮出水面：花更多钱，未必能买到更多智能。

一图看懂：三兄弟的成绩单

这张图浓缩了所有关键信息。横轴是单次运行成本，纵轴是任务得分，气泡大小代表延迟时间。三个模型挤在右上角，但位置关系很有意思。

GPT-5.5以89.4分登顶，单次成本0.49美元。GPT-5.4以89.3分紧随其后，成本0.30美元。GPT-5.3最憋屈，83.9分却要价0.44美元。

0.1分的差距，63%的价差。这不是性能竞赛，这是定价心理学现场教学。

技能加持下的真相

评测设计了一个关键变量：SKILL.md文件。这是结构化的领域知识文档，包含规则、模式和示例。没有它，模型裸奔解题；加载后，相当于开卷考试。

裸奔状态下，模型差距会被放大。但给足领域技能后，GPT-5.5和GPT-5.4的得分差缩到0.1分。Tessl团队的原话是：「这两个模型在技能增强型任务上功能相同。」

功能相同，成本不同。GPT-5.5的每token定价更高，而它的输出并不更精简。钱烧在同样的结果上。

GPT-5.3的处境更惨。它成本高于GPT-5.4，得分却低5.4分。Tessl团队毫不客气：「付更多，拿更少——这就是糟糕交易的完整定义。」

问题出在token膨胀。同样的任务，GPT-5.3生成更多无效内容，推高账单，拉低分数。

唯一值得买单的场景

GPT-5.5并非全无优势。延迟89.5秒，比GPT-5.4的135.4秒快了近三分之一。45秒的差距，在某些场景下是生死线。

但条件苛刻：你的agent必须受延迟严格约束，且成本预算足够宽松。Tessl的判断很克制：「这是可辩护的选择。」不是推荐，只是不反对。

对大多数人来说，这笔账算不过来。0.19美元的溢价，换0.1分的提升和45秒的时间。按这个逻辑，买高铁商务座是为了早到两分钟。

评测方法论：为什么这份数据可信

Tessl的测试设计值得拆解。11项真实工程技能，45个任务场景，每个场景跑6次取平均。不是抽几道题糊弄，是1742次独立运行。

评分用rubric清单，不是模糊打分。比如「是否删除.eslintrc.json并创建eslint.config.js」「是否使用PKCE方法的S256」「是否调用pipeline()而非链式.pipe()」。对错分明，没有「感觉不错」的空间。

一个典型任务「现代化Node.js库的Lint配置」，11条标准，101分制。模型迁移配置正确但遗留标准输入——扣分。没有灰色地带。

这种设计刻意消除评测噪音。当GPT-5.5和GPT-5.4的差距只有0.1分时，你可以确信这不是误差，是真实的能力天花板重叠。

产品视角：OpenAI在赌什么

从商业逻辑看，GPT-5.5的定价策略很清晰：用「最新最强」的品牌溢价，收割对延迟敏感的高端客户。同时把GPT-5.4留在甜点区，守住主流市场。

但风险在于，评测数据正在拆台。当第三方证明「最强」和「次强」在实际任务中无差别，品牌叙事就会磨损。更麻烦的是GPT-5.3——它证明了OpenAI自己的产品矩阵里，确实存在「越贵越差」的陷阱。

这对开发者的选型决策有直接影响。不是追新就好，不是贵就对。要算三笔账：任务得分、运行成本、延迟要求。GPT-5.4在两项上占优，只有延迟落后。

除非你的agent正在高频交易里抢毫秒，或者客服机器人每多等一秒就流失一个用户，否则那45秒不值得0.19美元。

行业信号：能力通胀与成本意识

这件事的深层信号是：大模型的「能力通胀」正在放缓。GPT-5.5的raw capability（原始能力）确实是OpenAI最强，但落到具体工程任务，边际收益急剧递减。

同时，「成本意识」正在成为选型核心。开发者不再只看基准测试榜上的分数，开始算每分钱的ROI。Tessl这类评测平台的兴起，本身就是市场成熟的标志。

SKILL.md机制也值得关注。它暗示了一个趋势：模型本身的差距，正在被「领域知识注入」抹平。给GPT-5.4一本好手册，它能追上GPT-5.5。这比换模型便宜多了。

未来可能属于「中等模型+优质技能库」的组合，而非无脑堆算力。这对OpenAI的商业模式是挑战——它卖的是模型调用，不是技能文档。

当然，延迟敏感场景永远存在。实时语音、高频交易、应急系统，45秒值千金。但这些是垂直 niche，不是大众市场。GPT-5.5的定位，更像是为特定客户定制的奢侈品，而非下一代基础设施。

评测数据不会说谎：89.4对89.3，0.49美元对0.30美元。数字摆在那里，选择取决于你更心疼钱，还是更心疼时间。或者，像大多数开发者一样，心疼钱——然后发现GPT-5.4已经够用了。

最后说句公道话：OpenAI至少没把GPT-5.5包装成「颠覆性突破」。它诚实地上线，诚实地更贵，诚实地快一点。至于值不值，Tessl把计算器递到你手里了。按一下，0.19除以0.1，每0.1分1.9美元。这大概就是当前AI能力的市价——精确到小数点后一位，贵得明明白白。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

英伟达巧用8B模型秒掉GPT-5 开源了

量子位 2025-12-06 14:07:18
97 跟贴 97
国产双开源：让Mac成为你的私人AI工作站

机器之心Pro 2026-05-06 14:14:46
0 跟贴 0

Doc-V*：读100页文档不如只翻对5页，80页场景「暴打」RAG 10个点

机器之心Pro 2026-04-29 18:16:19
0 跟贴 0

ClaudeCode之父：“全员编程”时代，企业真正领先在于“组织流程的代差”

华尔街见闻官方 2026-05-05 14:09:40
168 跟贴 168
OpenAI甩出GPT-5.5 Instant！幻觉暴降52%，话少三成，全员免费

智东西 2026-05-06 10:56:22
0 跟贴 0

媒体：中国史无前例下"阻断禁令" 美媒迅速捕捉到信号

国是直通车 2026-05-05 23:12:13
18505 跟贴 18505

DeepSeek V4 发布后遇冷，开发者只聊Codex：便宜不是万能药

雷科技 2026-05-06 21:25:43
110 跟贴 110
领先于Transformer！首个1200万上下文模型SubQ，成本仅Opus的5%

机器之心Pro 2026-05-06 17:06:11
0 跟贴 0

刷榜AI全挂了！Meta斯坦福地狱级测试，GPT/Claude/Gemini交出0分

新智元 2026-05-06 19:24:45
3 跟贴 3
刚刚，GPT-5.5 Instant 发布，奥特曼还邀请马斯克参加 AI 办的派对

爱范儿 2026-05-06 09:33:20
0 跟贴 0
年纪大上综艺都是老人感，听不懂规则有时还听不见规则

热点一触即发 2026-05-06 05:15:14
2 跟贴 2
G1狂输18分，湖人却有3个亮点，一策略接着用，一人能给战术

体坛大辣椒 2026-05-06 11:59:36
1 跟贴 1
美国的规则遇到校车要等待，偏偏有头铁的，下秒就被直接追击！

逗趣乐园 2026-05-05 09:47:21
1 跟贴 1
围棋实战解析：柒柒黑先困境，实用策略揭秘

巫马仙仪 2026-05-03 10:03:57
1 跟贴 1
局座教你：克制是制胜的关键策略！

折花几暮c 2026-05-06 11:15:32
0 跟贴 0
特斯拉官宣：6 座 Model Y L 获得五星安全评级认证！

新浪财经 2026-05-06 12:31:01
2 跟贴 2
已达成共识沪苏浙皖将共同出资、共同管理

上观新闻 2026-05-06 21:14:04
26 跟贴 26
影石又整活了！Insta360 GO 3S复古版评测：运动相机也脑洞大开？

雷科技 2026-05-06 22:00:08
4 跟贴 4
这是真正懂篮球的人，教出来的孩子，尤其懂现代篮球规则

逗趣乐园 2026-05-03 09:23:13
1 跟贴 1
景区装电梯无痛爬山被质疑过度开发

极目新闻 2026-05-02 17:18:12
3832 跟贴 3832
豆包为什么选择了 “最low”的变现方式？

蓝鲸新闻 2026-05-06 11:20:09
495 跟贴 495
《地平线6》评测时间首曝！你认为能拿几分？

游民星空 2026-05-06 10:06:28
1 跟贴 1
WIRED实测3款母亲节促销：778美元室内农场、150美元全能锅、150美元胶囊咖啡机

算力游侠 2026-05-05 10:57:05
0 跟贴 0
母亲节促销清单：WIRED评测团队筛选的三款折扣好物

算力游侠 2026-05-05 10:15:43
1 跟贴 1
OpenAI的疯狂五一：与马斯克法庭翻旧账、算力烧钱500亿美元、GPT-5.5免费用

钛媒体APP 2026-05-06 15:21:08
4 跟贴 4
丢了7年的手机突然发回定位还自动拍下了使用者的照片失主：已经成功要回了手机

闪电新闻 2026-05-06 12:58:59
872 跟贴 872
号称1200万token上下文的模型来了，数据亮眼但疑点重重

DeepTech深科技 2026-05-06 21:04:23
0 跟贴 0
驱逐舰破局：改写全球海军规则之谜

雾以泪聚i 2026-05-06 05:51:58
1 跟贴 1
影子调查｜不“标准”的高标准农田，正在整治

澎湃新闻 2026-05-06 12:34:33
292 跟贴 292
第一场输10分，骑士4件事没有做对，一策略要换了

体坛大辣椒 2026-05-06 10:17:45
21 跟贴 21
凌晨2点半开门，广东一排骨饭大排长龙！局长带人现场刮姜洗碗

南方都市报 2026-05-06 08:58:57
731 跟贴 731
媒体：伊朗袭击阿联酋并非军事冲动总统再次公开道歉

中国新闻周刊 2026-05-06 18:10:56
19 跟贴 19
20年等一回！这支不华丽的阿森纳，却最接近欧冠大耳杯

澎湃新闻 2026-05-06 10:56:28
361 跟贴 361
世界杯FIFA开出天价版权，电视转播谈判陷僵局

齐鲁壹点 2026-05-06 12:45:16
3474 跟贴 3474
解放台湾很可能会采用解放天津时的策略

夜叔 2026-05-07 03:39:28
0 跟贴 0
希勒：手球规则太离谱了，官方把整套规则搞得一塌糊涂

懂球帝 2026-05-07 05:18:09
1 跟贴 1
享界S9座椅险夹幼童，语音无法停止，鸿蒙智行说：就这样设计的

歪歌社团 2026-05-07 06:19:24
0 跟贴 0
人能捅多大篓子？上海迪士尼十周年手帐印错字，变身“迪土尼”！网友傻眼！

上观新闻 2026-05-06 17:14:06
232 跟贴 232
前CTO法庭证词：奥特曼在安全问题上对她撒谎

薛定谔的BUG 2026-05-07 02:12:11
1 跟贴 1
汉坦病毒涉疫邮轮病例数已升至8例

新华社 2026-05-06 22:31:33
971 跟贴 971

民进党，极有可能在下一届台湾地区选举后，成为长期一家独大政党

民进党，极有可能在下一届台湾地区选举后，成为长期一家独大政党

李橑在北漂

2026-04-02 10:22:26

男人搞定50岁女人最好方法，喂饱了她两个需求，她就会主动依你

男人搞定50岁女人最好方法，喂饱了她两个需求，她就会主动依你

心理观察局

2026-05-04 08:20:08

问题果然出现了，比亚迪销量暴跌26%，撕开新能源车最后的遮羞布

问题果然出现了，比亚迪销量暴跌26%，撕开新能源车最后的遮羞布

混沌录

2026-05-06 23:01:06

泪奔！陕西汉子拉8000斤苹果到湖北突发脑梗，咸丰全城19小时卖光

泪奔！陕西汉子拉8000斤苹果到湖北突发脑梗，咸丰全城19小时卖光

林子说事

2026-05-07 01:00:23

进军决赛！巴黎1-1总分6-5拜仁将战阿森纳登贝莱闪击凯恩破门

进军决赛！巴黎1-1总分6-5拜仁将战阿森纳登贝莱闪击凯恩破门

砚底沉香

2026-05-07 05:15:41

3-0！3-2！世乒赛男团8强全部出炉：中国队对手确定日本凶多吉少

3-0！3-2！世乒赛男团8强全部出炉：中国队对手确定日本凶多吉少

侃球熊弟

2026-05-07 06:18:00

上海男篮开门红有多难？被逼到最后一秒，24连胜差点终结

上海男篮开门红有多难？被逼到最后一秒，24连胜差点终结

小哆说体育

2026-05-07 04:50:13

过气明星太可怜？五一假期景区落魄打工，有人无戏可拍，令人心酸

过气明星太可怜？五一假期景区落魄打工，有人无戏可拍，令人心酸

揽星河的笔记

2026-05-04 15:45:23

日本布下反华包围圈后，越南明确表态立场，东南亚风向彻底变了

日本布下反华包围圈后，越南明确表态立场，东南亚风向彻底变了

董董历史烩

2026-05-07 03:36:52

罗马首轮惊魂逆转，郑钦文问题出在哪？师徒争吵又透露了什么？

罗马首轮惊魂逆转，郑钦文问题出在哪？师徒争吵又透露了什么？

网球之家

2026-05-06 13:33:17

妻子拿我卡给男闺蜜买豪车，我把限额改成3块，三天后4S给我来电

妻子拿我卡给男闺蜜买豪车，我把限额改成3块，三天后4S给我来电

云端小院

2026-05-07 06:53:34

三件大事！美军机抵达北京，王毅挂掉美外长电话，特朗普访华有变

三件大事！美军机抵达北京，王毅挂掉美外长电话，特朗普访华有变

媒体人解飞

2026-05-06 11:24:42

牌面！吴宜泽登上新闻联播感慨命运:艾伦打黑球时我都准备回国了

牌面！吴宜泽登上新闻联播感慨命运:艾伦打黑球时我都准备回国了

风过乡

2026-05-06 10:26:52

等不及了？特朗普官宣访华，对华核心诉求曝光，中方会接受吗？

等不及了？特朗普官宣访华，对华核心诉求曝光，中方会接受吗？

梦史

2026-05-07 00:56:09

乌克兰无人艇成为海上杀手；特朗普将在今夏试图迫使乌克兰投降

乌克兰无人艇成为海上杀手；特朗普将在今夏试图迫使乌克兰投降

近距离

2026-05-05 14:31:06

没演员别硬演！《低智商犯罪》被“相声班”霸占，演技没一个能打

没演员别硬演！《低智商犯罪》被“相声班”霸占，演技没一个能打

秋姐居

2026-05-06 19:33:14

难怪不哭不闹！原来新欢产子，是杨子送黄圣依最好的礼物

难怪不哭不闹！原来新欢产子，是杨子送黄圣依最好的礼物

阿策聊实事

2026-05-04 14:31:42

北京又一家西贝闭店关店潮未止、新品牌加速跑，贾国龙的“断腕”与“转身”能否自救成功？

北京又一家西贝闭店关店潮未止、新品牌加速跑，贾国龙的“断腕”与“转身”能否自救成功？

每日经济新闻

2026-05-07 04:13:06

钟薛高名下508件无形资产被拍卖，起拍价207万，11人已报名；一只雪糕卖88元，创始人林盛曾直播卖红薯还债，去年资不抵债申请破产

钟薛高名下508件无形资产被拍卖，起拍价207万，11人已报名；一只雪糕卖88元，创始人林盛曾直播卖红薯还债，去年资不抵债申请破产

大风新闻

2026-05-06 20:38:04

韩女星朴娜莱和男性朋友在车上发生了性关系，两名经纪人被迫围观

韩女星朴娜莱和男性朋友在车上发生了性关系，两名经纪人被迫围观

西楼知趣杂谈

2026-04-09 09:35:17

全栈遛狗员

白天跟需求对线，晚上在小区遛狗。

2287文章数 61关注度

往期回顾全部

科技要闻

“马斯克不懂AI”：OpenAI当庭戳老底

头条要闻

特朗普：美伊"很可能"达成协议

头条要闻

特朗普：美伊"很可能"达成协议

体育要闻

活塞1比0骑士：坎宁安不再是一个人了

娱乐要闻

谢娜演唱会暗藏惊喜何炅瞒天过海现身

财经要闻

估值450亿美元大基金被曝将投资DeepSeek

汽车要闻

领克10/领克10+ 无论能源形式领克都要快乐

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

健康

本地

亲子

教育

家居

干细胞治烧烫伤面临这些“瓶颈”

本地新闻

用青花瓷的方式，打开西溪湿地

亲子要闻

才一岁多，但有人生下来就有领导气质

教育要闻

中产标配崩盘！钢琴为什么没人学了？

家居要闻

大胆前卫时尚大宅

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版