网易首页 > 网易号 > 正文 申请入驻

GPT-4.5首波实测来袭,算力狂飙10倍!高情商逼近AGI,制霸编程物理

0
分享至

新智元报道

编辑:编辑部

【新智元导读】撇开API价格暴涨30倍不说,GPT-4.5的实力还是可圈可点的。用掉10倍GPT-4算力,4.5注定在智能上大幅提升,不仅情商高更通人性,而且在编程、物理模拟测试中,也不输专业对手。然而,又贵又慢……

今天,OpenAI发布了史上最贵的AI服务:GPT-4.5。

一边是「史上最贵」,一边是「感觉到了AGI」,GPT-4.5从诞生之初就充满了争议。

高达上百倍的价格差距,究竟带来了哪些惊艳的提升?

虽然一般人用不起,但依然有一大波实测迎面而来。

OpenAI研究员Aidan在X上表示,他花了很长时间玩这个新模型,「它让我感觉到了AGI」。

他使用不同版本的GPT模型来生成一张SVG格式的「美丽」自画像,结果看来,GPT-4.5终于可以生成一个像人的了。

至于「美丽」嘛,那就看个人喜好了。

Aidan接着说,IQ狂热者有一个称为「g因子」的概念,意思是有些人就是特别聪明,好像什么都擅长(不仅仅是某个狭窄领域)。

「GPT-4.5在几乎所有任务上都有很高的g因子(尽管有时候这种优势很微妙),感觉它比我用过的任何其他模型都更能理解这个世界。」他说。

要知道,GPT-4.5是OpenAI史上参数规模最大的模型,其计算量是上一代的10倍。

不难理解,算力狂飙下的智能,情商更高,还能提供更多的情绪价值。

编程测试

智能开发工具Cursor, 发文表示:在其他模型失败的时候, GPT-4.5有效得邪门。

这种说法有些绕,Cursor为什么不直接夸GPT-4.5「目前最佳」?

因为它真不是。

同样致力于AI+软件领域的Scott Wu,表示GPT-4.5在编程任务上进步明显,但和Claude3.7 Sonnet比起来,只能说各有输赢。

在初级开发得分上,GPT-4.5比OpenAI自家的o1高10%,比GPT-4o高16%,但比Anthropic旗下的Claude 3.7 Sonnet低2%。

部分AI模型在智能编码评估中的比较:GPT-4o最差,Sonnet 3.7最好

GPT-4.5并没有针对编码编程任务优化,这么大的进步似乎还可以?

网友Flavio对GPT-4.5做了编程测试,他给了下面的提示词:

编写一个 Python 程序,展示一个球在旋转的六边形内弹跳。球应受到重力和摩擦力的影响,并且必须以逼真的方式从旋转的墙壁上弹回。

GPT-4.5的输出令人印象深刻!

Flavio表示,「这是迄今为止最真实的结果。」

接着,OpenAI Developers的X账号也注意到了Flavio的测试,他们在Flavio的提示词基础上,要求GPT-4.5做的更有创意。

改进之后的视觉效果果然更有创意,小球不仅五颜六色的,碰撞还有飞溅效果!

不过也不是每次测试都会成功。

网友Theo-t3.gg就展示了一次失败的尝试。

「从未见过一个模型以如此独特、新颖的方式艰难失败。」他说道。

在他的这次测试中,小球来回穿过六边形,显得毫无逻辑可言。

还有网友称,使用新发布的Sonnet 3.7,只需要3个提示就完成了。而且后两个提示只是为了使它更有趣。

网友Theo-t3.gg自己也承认,GPT-4.5并不是一个编码模型。

他表示「我发现它在写作方面相当不错。」

随后他贴出了GPT-4.5与Gemini 2.0 Flash的写作对比。

他使用了一段相同的提示词:

艾伦·图灵一生的情感概述。

总体而言,GPT-4.5的写作水平明显高于Gemini 2.0 Flash的文章。

GPT-4.5的文章在结构、语言、文风、内容深度和情感表达上都更加成熟和精炼,展现了更高的写作技巧和叙事能力。

Gemini 2.0 Flash的文章虽然活泼有趣,但过于口语化,缺乏深度和严谨性,更适合轻松阅读,而非深入了解图灵生平的严肃探讨。

有网友甚至称,「我从未见过这么好的AI写作」。

「这是写作的斯普特尼克时刻。」

该网友给了GPT-4.5一个提示词:

写一个原创的短篇恐怖故事,背景设定在夜晚的一辆汽车中,带有反转结局。

下面是它的回答,你觉得它写的咋样?

一对情侣在月光下开车兜风。他们的车停在了路边。 男孩转向女孩说道: 「宝贝,我真的很爱你。」 「怎么了,亲爱的?」 「我们的车抛锚了,应该是发动机出故障了。我得走路去买些汽油。」 「好吧,那我在这儿守着音响。最近新闻报道说有人专门偷音响。」 「这主意不错。记住,无论发生什么事都不要给任何人开门。亲爱的,我爱你。」 说完,男孩就出发去买汽油了。两个小时过去了,女孩喃喃自语道:「怎么回事?他应该早就回来了啊。」就在这时,她听到有什么东西在刮擦车门,还传来一个声音: 「让我进去!」 女孩始终没有开门,后来疲惫地睡着了。第二天早晨醒来,她发现男友依然没有回来。当她下车查看时,却发现「男人的手被钩在车门上。」

有网友看后感到害怕,看来它写的的确是恐怖故事。

游戏

除了旋转球和写作,网友AK也测试了GPT-4.5的游戏能力。

他给出一段提示词:一个基于网络的自主Wordle游戏克隆版,采用7个字母的单词和7次猜测机会,包含一些随机的7个字母单词。

GPT-4.5生成的游戏看起来还算不错,看起来甚至有几分高级感!

情感大师

OpenAI认为GPT-4.5的一大特点就是「高情商」,交互更自然。

OpenAI的员工Aidan McLaughlin表示,GPT-4.5更懂如何与人聊天,知道在什么时候避免给用户发送无聊的网络内容。

比如说,GPT-4.5-preview和GPT-4o同样的提示:

I’m going through a tough time after a test

GPT-4.5-preview给出了富有人性的安慰:

听到你倍感难受,我非常抱歉。但要记得一次测试并不能定义你或你的能力。感到失望或沮丧,这很正常。但在处理这些情绪的时候,请善待自己。要不聊聊到底发生了什么?或者聊聊下次遇到这类事,该如何处理?我一直在这儿,助你度过难关。

而GPT-4o的回答显得冷静:

很抱歉你经历了这些。记住,不能如愿做好某件事时,感到失望或沮丧是正常的。 下列的一些事可能会帮助你: 1. 给自己一些时间:…… 2. 反思发生了什么:…… 3. 找其他人谈谈:…… 4. 为下一步做好计划:…… 5. 牢记自己的强项:…… 6. 保持积极的心态:……

网友Anon设想如果AI和机器人技术结合,可能比真人更受大家欢迎。

或许,将来AI真的能成为人类亲密的朋友?

最大体感,又慢又贵

而GPT-4.5的价格嘛,已经完全跳脱了。所有OpenAI竞家相争的区间密集拥挤,而GPT-4.5独占一个区间。

在很多模型已经是拼夕夕价格的时候,OpenAI居然敢这么定价,你敢信?

就输入价格来看,GPT-4.5是:

  • o1的5倍

  • GPT-4o的30倍

  • o3-mini的68倍

  • DeepSeek-R1的137倍

  • DeepSeek-V3的278倍

  • GPT-4o mini的500倍

  • Gemini 2.0 Flash的750倍

当然了,虽然定价十分离谱,但性能的提升还是有的。

比如这位网友就要求它凭记忆背出深奥的梵文经文,它居然正确背出来了。

看得出来,如此大参数模型,配上超大规模的预训练,的确展现出了广泛的事实知识。

对此,OpenAI研究员则略带幽默地调侃道:也许,预训练终究还是有效的?

不过,大部分网友可遭不住了,纷纷直呼:「用不起!」

还有网友表示,感谢OpenAI,码农们终于不用担心自己被替代了。

毕竟,相比起新模型,还是初级开发者更有性价比。

左右滑动查看

关于GPT-4.5的离谱价格,已经引发某些网友大胆的猜测了。

比如API定价这么高,莫非是为了防止蒸馏?

还是因为GPU告急,所以根本不想让用户用了?

左右滑动查看

此外,许多试用过的网友,最真实的体感就是:这也太慢了……

1M tokens输出价格是150刀,然后速度是每秒1-3个token,这笔账好像怎么算怎么不对。

有人分析认为,GPT-4.5这么慢,是因为它太大了。或许刚立项那会儿,还是当初模型「越大越好」的年代。

如此看来,OpenAI的领先优势,似乎已经所剩无几了?

网上,各种梗图也是层出不穷。

甚至,已经有前OpenAI研究员跳出来「背刺」了:GPT-4.5表现不佳,50%的责任应该归功于辣鸡的模型架构。

参考资料:JHNYZ

https://x.com/aidan_mclau/status/1895204299040530794

https://x.com/OpenAIDevs/status/1895226704408481893

https://x.com/theo/status/1895220930173116747

https://x.com/aidan_mclau/status/1895207802018341294

https://x.com/_akhaliq/status/1895247370792902733

https://x.com/cursor_ai/status/1895210110714290302

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
女单决赛堪比神仙打架,邓亚萍给出6字点评,最大赢家并非王曼昱

女单决赛堪比神仙打架,邓亚萍给出6字点评,最大赢家并非王曼昱

萌兰聊个球
2025-11-17 09:07:58
德国媒体哀叹:中美两强博弈,难道我们欧盟真就只配当棋子了吗?

德国媒体哀叹:中美两强博弈,难道我们欧盟真就只配当棋子了吗?

历史求知所
2025-11-16 13:55:08
放心,打不起来

放心,打不起来

基本常识
2025-11-16 23:57:22
震惊!杨兰兰案第四次庭审,惊爆全网

震惊!杨兰兰案第四次庭审,惊爆全网

热点菌本君
2025-11-16 17:48:30
乐视创始人欠122亿巨债跑美七年,400多名老员工让乐视起死回生。

乐视创始人欠122亿巨债跑美七年,400多名老员工让乐视起死回生。

百态人间
2025-11-05 05:35:03
湖南一婴儿一出生就15岁?4岁男孩和19岁双胞胎姐姐“同龄”,医生:冻胚理论上可无限期保存

湖南一婴儿一出生就15岁?4岁男孩和19岁双胞胎姐姐“同龄”,医生:冻胚理论上可无限期保存

极目新闻
2025-11-17 13:33:51
选择南渡的傅斯年,在去世16年后却祸及了在大陆的家人,令人唏嘘

选择南渡的傅斯年,在去世16年后却祸及了在大陆的家人,令人唏嘘

谈古论今历史有道
2025-11-13 17:40:03
不顾央视警告顶风作案,与刘涛传出绯闻的杨烁,究竟是谁给的底气

不顾央视警告顶风作案,与刘涛传出绯闻的杨烁,究竟是谁给的底气

芳芳历史烩
2025-09-24 20:13:19
“东宁忠诚伯冯锡范”这个称呼,问题有多严重?

“东宁忠诚伯冯锡范”这个称呼,问题有多严重?

名人苟或
2025-11-17 06:02:33
钱再多有什么用?57岁李克勤家丑曝光!一个败家子毁了全家

钱再多有什么用?57岁李克勤家丑曝光!一个败家子毁了全家

奥字侃剧
2025-11-14 18:17:50
释永信被正式批捕!挖出哪些不为人知的秘密?私下里他和谁在一起

释永信被正式批捕!挖出哪些不为人知的秘密?私下里他和谁在一起

刚哥说法365
2025-11-16 14:35:38
父亲分720万遗产没我的份,我要走父亲却说:我以后还得靠你照顾

父亲分720万遗产没我的份,我要走父亲却说:我以后还得靠你照顾

兰姐说故事
2025-09-30 17:10:15
泰国国王给中国送上大礼,想要的中国也给了,美国彻底失去东盟?

泰国国王给中国送上大礼,想要的中国也给了,美国彻底失去东盟?

近史博览
2025-11-16 23:15:27
剑桥学霸诞生!谢氏家族迎来高光时刻,三代逆袭:从戏子到科学家

剑桥学霸诞生!谢氏家族迎来高光时刻,三代逆袭:从戏子到科学家

荆楚寰宇文枢
2025-11-16 21:12:28
唏嘘!匈牙利遭读秒绝杀 连续10届无缘世界杯 8500万巨星瘫坐痛哭

唏嘘!匈牙利遭读秒绝杀 连续10届无缘世界杯 8500万巨星瘫坐痛哭

我爱英超
2025-11-17 01:11:30
刚刚,江苏下雪了!0℃,常州接下来……

刚刚,江苏下雪了!0℃,常州接下来……

中吴网
2025-11-17 13:17:02
夺舍换心都不靠谱,真相还看李嘉诚!

夺舍换心都不靠谱,真相还看李嘉诚!

BenSir本色说
2025-11-14 22:40:16
9-1,葡萄牙直通世界杯,C罗停赛,B费戴帽,内维斯3球+飙世界波

9-1,葡萄牙直通世界杯,C罗停赛,B费戴帽,内维斯3球+飙世界波

侧身凌空斩
2025-11-16 23:54:36
宇树机器人表演冲拳、踢腿等功夫时意外“翻车”摔倒,租赁店负责人:踩到了衣服,租一天七八千元

宇树机器人表演冲拳、踢腿等功夫时意外“翻车”摔倒,租赁店负责人:踩到了衣服,租一天七八千元

极目新闻
2025-11-17 09:37:57
0.8秒三分准绝杀!马卡47分爵士双加时险胜公牛 吉迪26+12+13

0.8秒三分准绝杀!马卡47分爵士双加时险胜公牛 吉迪26+12+13

醉卧浮生
2025-11-17 12:22:17
2025-11-17 16:03:00
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
13888文章数 66257关注度
往期回顾 全部

科技要闻

有了通义和夸克,阿里为何再推千问App?

头条要闻

台34个团体严正抗议:拒绝成为日本军国主义的牺牲品

头条要闻

台34个团体严正抗议:拒绝成为日本军国主义的牺牲品

体育要闻

当家球星受伤后,球迷乐翻了天?

娱乐要闻

二次封后的宋佳凭什么狂妄?

财经要闻

疯狂的"吸金村":村民大肆盗采地下水

汽车要闻

荣威M7+豆包大模型 用车机AI策划说车视频怎么样?

态度原创

艺术
时尚
亲子
本地
教育

艺术要闻

这雪景,太美了!

秋天怎么穿出时尚感?适当露肤、不死板老气,高级又有回头率

亲子要闻

娃娃手指跟爸爸一模一样,从甘肃过来就想让小手漂亮一点

本地新闻

这档古早综艺,怎么就成了年轻人的哆啦A梦?

教育要闻

12岁小学生自杀

无障碍浏览 进入关怀版