网易首页 > 网易号 > 正文 申请入驻

GPT-5.4的最大卖点,中国AI半年前就上线了

0
分享至


(文/陈济深 编辑/张广凯)

3月5日,OpenAI发布了能力"N合1"的统一模型GPT-5.4。

OpenAI本次发布的重点非常明确:把AI从聊天助手,进一步推向真正能交付专业工作的系统。除了GPT-5.4,OpenAI还推出了GPT-5.4 Pro,以及面向金融和表格工作流的ChatGPT for Excel和多家金融数据集成。

这意味着,相比传统发布强调的更大参数,更强智能,GPT-5.4主推是一项更具体的能力变化:AI可以自己操作电脑。

OpenAI在官方博客里称,GPT-5.4是他们发布的首个具备原生computer use能力的通用模型,定位是"面向专业工作的最强前沿模型"。

但"让AI替你干活"这个方向,美国AI不仅没有遥遥领先,OpenAI甚至是抓紧补课的那个存在。

2025年9月,月之暗面的Kimi就上线了OK Computer功能。它的思路和GPT-5.4不完全一样——GPT-5.4走的是"像人一样操作你的电脑桌面",通过截图和模拟鼠标键盘来控制现有软件;Kimi走的是"给AI配一台自己的虚拟电脑",让它在沙盒环境里调度20多种原生工具,自主拆解任务、写代码、搭网站、做数据分析,最后把成品交给用户。

路径不同,但指向同一个行业共识:AI的竞争维度正在从"谁更聪明"转向"谁能真正替你干活"。而在这个方向上,Kimi比GPT-5.4早了近半年。

而且即便在GPT-5.4最引以为傲的桌面操控赛道上,在GPT-5.4发布前,OS-World排行榜的冠军正是Kimi K2.5,得分63.3%,领先Claude Sonnet 4.5的62.9%。

把GPT-5.4的整张能力清单摊开,无论从编程、Office文档生产力到超长文本处理,中国AI企业不但早已完成了相应的产品布局,而且在多个方向上已经站到了行业前沿。

中国AI不再当追随者

GPT-5.4本次发布着力强调它的编程和软件工程能力。OpenAI称它不只是写代码片段,而是能完成完整的软件项目——从系统设计到调试到测试。

从行业发展来看,AI编程确实正在从"辅助写代码"升级为"独立完成工程"。而中国AI企业们对这个趋势的判断并不晚于OpenAI,在功能实现上也毫不逊色。

智谱今年2月发布GLM-5时,核心定位就是"智能体工程"——不再只是帮程序员补全代码,而是让AI像一个系统架构师一样,自主拆解需求、规划结构、编写和调试完整项目。

值得注意的是,GLM-5发布前还曾以"Pony Alpha"的匿名身份在海外开发者平台OpenRouter上线,直接登顶热度榜首,很多海外开发者对其赞不绝口,认为这可能是美国某家头部公司的模型,直到官宣后才知道这是一个中国开源模型,这也意味着中国AI的实际能力在盲测中也取得了行业领先的口碑。

而GPT-5.4的另一个重点是Office文档生产力。OpenAI同步发布了ChatGPT for Excel插件,还接入了FactSet、标普全球等金融数据源,让用户可以在ChatGPT里直接做财务建模和情景分析。在OpenAI内部的一组模拟投行初级分析师工作的基准测试中,GPT-5.4的平均分达到87.3%。

在这个赛道上,中国AI早已各显神通。

智谱的GLM-5已经内置了直接输出Word、PDF、Excel文件的能力,配合同步推出的ZCode开发环境,用户用自然语言描述需求,模型就能自动拆解任务并调度多个智能体协同完成——从研究报告到财务表格到演示文稿。

MiniMax的M2.5把Office能力做成了标准化的技能模块,能根据文件类型自动加载,还能和金融建模等行业SOP结合。

Kimi则在K2.5模型发布时同步推出了"精通Office"功能升级,让Kimi Agent掌握了Word智能排版、Excel数据分析与金融建模、PPT自动生成、PDF视觉设计等中高阶技能,直接交付准专业水平的办公文档。三条技术路径不同,但方向完全一致:AI不只是帮你想,还要帮你把文件做出来。

至于100万token的超长上下文窗口,DeepSeek、GLM-5、Qwen3.5都已经支持。

这也意味着,中国AI企业们早在OpenAI之前就已经实现了不止帮你想,AI还要帮你做的技术规划并实现了产品落地。

从"更便宜"到"更早"

把GPT-5.4的能力清单和中国公司的产品线摆在一起,会发现一件事:中国AI在全球竞争中的位置,正在发生第二次跃迁。

第一次跃迁发生在2025年。以DeepSeek为代表的中国开源模型的崛起,Kimi、千问、智谱等中国模型凭借性价比+头部模型性能大规模渗透进硅谷的开发者生态。

Airbnb的CEO公开表示公司"在很大程度上依赖阿里巴巴的Qwen",硅谷顶级投资人查马斯则透露已将大量工作负载从OpenAI和Anthropic迁移到了Kimi K2。

今年2月,这个趋势已经有了一个标志性的数据节点:在全球最大的大模型API聚合平台OpenRouter上,中国模型的单月Token调用量历史上首次超过美国模型——其中智谱GLM-5、MiniMax M2.5、月之暗面Kimi K2.5、DeepSeek V3.2分居调用榜前列。

如果说当时的叙事核心在于中国AI"更好更便宜",那GPT-5.4的发布暴露出的信号,已经超出了"性价比"的范畴。

这一次,不是中国模型能用更低的价格做到美国模型能做的事,而是中国公司在技术思路和产品方向上,走到了和OpenAI同一个甚至更前的位置。

Kimi在"AI自主完成任务"方向上比GPT-5.4早近半年布局,智谱对"智能体工程"的判断比GPT-5.4早近一个月落地发布,MiniMax在Office生产力和编程工程化方向上的布局也完全独立于OpenAI的节奏。

科技行业长期存在一种刻板印象叫"Copy to China"——美国做什么,中国跟着做什么。但在AI这个领域,这个叙事已经失效了。

GPT-5.4这次发布的直接背景是OpenAI需要追赶Anthropic的Claude——过去大半年里,Claude在computer use、代码工程、文档处理上持续加码,一系列更新直接冲击了传统SaaS软件的地盘,把"AI能不能替你干活"变成了行业最核心的竞争维度。

GPT-5.4主打的每一项能力,几乎都是在补Claude已经建立起来的产品优势。而中国公司在这同一个方向上的布局,不是在等美国公司打完之后再入场,而是独立走到了同一个路口。

无论这背后是更早意识到了行业方向,还是更早完成了研发落地,至少有一点可以确认:在AI行业,方向不再是硅谷单方面定义的了。

当闭源做到的事开源也能做到

如果说能力层面是"并跑",那接下来的问题就变得尖锐:GPT-5.4是闭源的,而上述中国模型几乎全部开放了模型权重。

闭源模型的溢价逻辑,本质上建立在"我能做到你做不到的事"之上——只要能力是独占的,定价权就是成立的。

但当开源模型在编程、文档生产力、长文本处理等核心维度上逐项追平甚至局部超越,这个逻辑就开始松动了。

这有点像智能手机行业的苹果和安卓:苹果依然可以卖出溢价,但它的溢价来源已经从"独占能力"转向了"生态和品牌",而它面对的不再是一个追赶者,而是一整个阵营。

GPT-5.4的处境正在变得类似。它仍然是一个优秀的产品,但它的定价已经很难再用"独占能力"来支撑了。

GPT-5.4的API定价是每百万输入token 2.5美元、输出15美元。GPT-5.4 Pro更贵,输入30美元、输出180美元。

MiniMax M2.5呢?输入0.3美元,输出2.4美元。连续运行一小时的成本大约是1美元。Qwen3.5的API价格大约是同等性能的谷歌Gemini 3 Pro的十八分之一。

而且MiniMax M2.5、智谱GLM-5、月之暗面Kimi K2.5、阿里Qwen3.5,全部开放了模型权重。由于开发者需求过于旺盛,智谱甚至在发布当天就宣布了编程方案涨价,涨幅超过30%——一个开源模型因为太多人抢着用而涨价,这个场景本身就说明了一些问题。

同一水平线上的能力,中国模型的价格是OpenAI的几分之一到十几分之一,而且还是开放权重的。这个事实可能比任何一项性能指标都更值得被关注。

美国AI的护城河在哪?

当然,GPT-5.4也有中国模型短期内做不到的东西,而且恰恰不在技术本身。

它同步接入了FactSet、道琼斯Factiva、LSEG、标普全球等西方主流金融数据源,让华尔街的分析师可以在一个工作流里完成数据获取、建模和输出。法律AI公司Harvey称GPT-5.4在其BigLaw Bench上拿到91%的成绩,在处理复杂交易分析和长合同时表现最优。再加上ChatGPT在全球消费市场积累的品牌认知和用户基础,这些生态层面的优势不是模型性能追上就能解决的。

值得注意的是,GPT-5.4在性能上也有突破,它在OS-World上75.0%的得分超越了人类基准的72.4%,在SWE-Bench Pro上拿到57.7%,在OpenAI内部投行基准上从GPT-5的43.7%飙升到87.3%。在桌面操控这条特定赛道上,GPT-5.4确实把天花板往上推了一大截。

但反过来,中国AI公司也拥有OpenAI难以复制的东西:一个春节期间五六家公司同时发布旗舰模型的产业密度,一个以极低成本向全球开发者开放的开源生态,以及在OpenRouter等开发者平台中快速积累的海外用户基本盘。

曾经是行业标杆的OpenAI,这次发布的产品方向与中国公司高度重合。这件事本身就是一个信号:中美AI的位置关系,已经不是"领跑者和追赶者"那么简单了。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
2-0领先遭拖入抢五拒逆转!17岁张本美和破魔咒:王曼昱仰天长啸

2-0领先遭拖入抢五拒逆转!17岁张本美和破魔咒:王曼昱仰天长啸

颜小白的篮球梦
2026-05-10 19:01:48
大丫头无缘破不胜魔咒!蒯曼1-3日本最强削球手,国乒陷入绝境

大丫头无缘破不胜魔咒!蒯曼1-3日本最强削球手,国乒陷入绝境

钉钉陌上花开
2026-05-10 20:32:26
震惊!小马云18岁成年首播,在线人数破7万,与女生接吻刷爆网络

震惊!小马云18岁成年首播,在线人数破7万,与女生接吻刷爆网络

火山詩话
2026-05-09 16:02:57
谁都不敢相信,打了四年的俄乌战争,居然会以这种方式停战了!

谁都不敢相信,打了四年的俄乌战争,居然会以这种方式停战了!

别人都叫我阿腈
2026-05-08 10:57:36
新帅徐正源搞砸了:升班马主场沦陷,耻辱6连败,姆本扎补时进球

新帅徐正源搞砸了:升班马主场沦陷,耻辱6连败,姆本扎补时进球

足球狗说
2026-05-10 20:54:29
黄博文:平局大家都不愿意接受,相信胜利下一场就会到来

黄博文:平局大家都不愿意接受,相信胜利下一场就会到来

懂球帝
2026-05-10 20:47:09
乌克兰的“机器狗”们已实战,单次俘虏多名俄士兵,摧毁俄军坦克

乌克兰的“机器狗”们已实战,单次俘虏多名俄士兵,摧毁俄军坦克

网易新闻出品
2026-05-09 11:37:34
中美,重磅!国常会,最新部署!证监会出手!超级赛道,大利好!影响一周市场的十大消息

中美,重磅!国常会,最新部署!证监会出手!超级赛道,大利好!影响一周市场的十大消息

证券时报
2026-05-10 19:23:06
李嘉诚儿子拿下世界杯转播权,全网炸锅

李嘉诚儿子拿下世界杯转播权,全网炸锅

新浪财经
2026-05-09 18:37:21
怀化市召开领导干部会议 宣布省委有关人事安排决定

怀化市召开领导干部会议 宣布省委有关人事安排决定

环球网资讯
2026-05-10 16:20:10
孙颖莎独得2分!中国女团逆转日本,世乒赛团体赛七连冠

孙颖莎独得2分!中国女团逆转日本,世乒赛团体赛七连冠

澎湃新闻
2026-05-10 21:38:28
炸裂!熊孩子刮花6张PS5光盘 家长仅200元打发了事

炸裂!熊孩子刮花6张PS5光盘 家长仅200元打发了事

游民星空
2026-05-10 17:44:13
新规落地!手机不用再交月租,联通率先实行,移动电信全都跟上

新规落地!手机不用再交月租,联通率先实行,移动电信全都跟上

笑熬浆糊111
2026-05-09 04:47:09
孙颖莎拒绝沾光!让日本输得心服口服,张本美和对王曼昱成功祛魅

孙颖莎拒绝沾光!让日本输得心服口服,张本美和对王曼昱成功祛魅

三十年莱斯特城球迷
2026-05-10 19:59:48
红场阅兵结束!普京感谢中国,特朗普最不愿意看到的一幕发生

红场阅兵结束!普京感谢中国,特朗普最不愿意看到的一幕发生

书纪文谭
2026-05-10 21:14:35
做梦?张本智和狂言:开创日本时代!国乒男团决赛王楚钦扛着一单,梁靖崑或打二单

做梦?张本智和狂言:开创日本时代!国乒男团决赛王楚钦扛着一单,梁靖崑或打二单

好乒乓
2026-05-10 21:11:23
全球最大的公司诞生!市值35万亿,相当于15个阿里,利润超8000亿

全球最大的公司诞生!市值35万亿,相当于15个阿里,利润超8000亿

简易科技
2026-05-10 15:18:40
县交警队长被举报工作日KTV饮酒;镇雄公安:事先已请假,未违规违纪

县交警队长被举报工作日KTV饮酒;镇雄公安:事先已请假,未违规违纪

大风新闻
2026-05-10 15:07:12
休学门诊挤满了初三学生,北大教培人揭开真相:三条路全被堵死,他们无处可逃

休学门诊挤满了初三学生,北大教培人揭开真相:三条路全被堵死,他们无处可逃

三言四拍
2026-05-10 10:34:00
不访华了?鲁比奥称美方愿让步,中俄高抬贵手,已为自己找好台阶

不访华了?鲁比奥称美方愿让步,中俄高抬贵手,已为自己找好台阶

书纪文谭
2026-05-10 21:13:02
2026-05-10 22:36:49
观察者网 incentive-icons
观察者网
全球视野,中国关怀
140762文章数 1850549关注度
往期回顾 全部

科技要闻

DeepSeek融资,改写所有人的估值

头条要闻

谈判陷僵局 世界杯转播费报价大幅降低央视仍不接招

头条要闻

谈判陷僵局 世界杯转播费报价大幅降低央视仍不接招

体育要闻

那个曾让詹姆斯抱头的兄弟,40岁从大学毕业了

娱乐要闻

赵露思老实人豁出去了 没舞蹈天赋硬跳

财经要闻

白酒大逃杀

汽车要闻

轴距加长/智驾拉满 阿维塔07L定位大五座SUV

态度原创

教育
时尚
数码
亲子
公开课

教育要闻

请教会你的孩子有能力分辨和说不!

真爱大牌|| 用了4年都不舍得换,终于把小贵的价格也磨下来了

数码要闻

Q1中国客厅智能设备线上市场:显示设备销量全线下滑

亲子要闻

“顺”还是“剖”?从成为母亲的选择说起

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版