网易首页 > 网易号 > 正文 申请入驻

实测GPT-5 Pro:别被普通版骗了!Pro才是OpenAI真正的顶级模型

0
分享至

新智元报道

编辑:定慧 桃子

【新智元导读】GPT-5的实测众说纷纭,那GPT-5最强的Pro版本表现如何?实测后,我们认为GPT-5 Pro有可能确实就是当下的最强模型。

GPT-5终于来了,全世界的眼睛都盯着它。

但是目前的评价嘛,却是毁誉参半。我们也赶紧上手深度实测了一波。

发现GPT-5这家伙,表现还真有点「飘忽不定」,猜测可能和那个叫「路由」功能有关。

但是,一旦切换到GPT-5 Pro模式,强制使用最强能力时。天呐!感觉是真的有点强。

废话不多说。我们直接上案例,看看它到底有多牛。以下所有实测Demo均由GPT-5 Pro出品。

GPT-5 Pro实测展示

1. 首先就是喜闻乐见的「前端能力」展示

我们让GPT-5 Pro制作了一个黑客帝国的风格的可调参数城市,附带一个控制面板。

不得不说,编程能力确实提升巨大。

在完整视频中,你能看到GPT-5的参数面板非常丰富,可以调节很多细节,这个直观上就比我们以前测试的所有例子都要好。

2. 看图求解数独

只需要1分钟10s中,完美解决数独问题。

3. 比大小变体

比较9.9和9.11已经有了变体形式,通过求解方程来进一步测试模型的推理和计算能力。

4. 时钟难题

GPT-5 Pro一开始也是认错的,但是只要提示词强调「短的是时针,长的是分针」,然后Bingo!

6个钟表5个完全正确,只有黄色时钟识别错误。

不过,红色钟表由于时针和分针里的太近,被认为是12点(实际11点55,非常接近)

作为对比,Gemini 2.5 Pro的识别错误率就非常的高,几乎全错,多次询问正确率依然不高。

5. IMO数学问题

IMO的问题虽然都是OpenAI和谷歌都解出来了1-5题,但是他们是用的都是特调参赛用模型。

使用GPT-5 Pro求解第一道题目,在近16分钟的思考后,也得出了正确答案。

并且给出了非常详细的答案。

6. GeoGuessr看图猜地址挑战

将GeoGuessr上的挑战,交给GPT-5 Pro。

GPT-5 Pro根据砖墙颜色、房屋风格、交通标志、植被等全方位的分析,2min判断这是南非。

可以进一步要求深入分析,具体经纬度在哪里。

这是最终的结果,确实就是南非。

网友已玩儿嗨

网友们也都玩出了花!

有人在实测后认为GPT-5 Pro确实是一个顶级模型,是最优秀的。

OpenAI在Pro版本上取得了巨大的进步!

Peter进行了12次测试。

结论是:没有任何其他模型能够匹敌,无论是OpenAI、Google、xAI还是Anthropic的模型。

所有这些测试都只用了 1-3 次尝试,输出结果确实非常出色。

沃顿商学院CS教授EthanMollick惊叹道,自己全程没有输出一行代码,就让GPT-5做出一个建筑生成器。

只需要重复一句话——改进它,就实现了如下的效果。

一个提示,可以单次生成「我的世界」克隆版。

类似奥特曼制作的鼓点音乐,网友也尝试了GPT-5创建旋律和可视化效果。

GPT-5氛围编程,直出一个社交模拟器。

在SVG图生成方面,GPT-5可以说达到了全新高度。

OpenAI科学家SebastienBubeck表示,「在OpenAI,团队已前后攻克了预训练和推理两大技术难题。

现在正在全力探索一套,能最大限度发挥两者协同效应的新技术体系。GPT-5仅仅是这个方向的第一步」。

GPT-5还能看图精准定位,网友将童年一张照片扔给ChatGPT,没想到它直接定位到一英里范围内。

硅谷爆红经济学家TylerCowen认为,GPT-5在专业领域表现远超o3,并称这是自己用过最出色的学习工具。

同样,在编程方面,OpenAI研究员SuvanshSanjeev表示,「GPT-5重新定义并拓展了不同规模模型的成本和智能边界」。

可以说。正如METR最新报告所指出的,AI的指数级增长仍未放缓。

GPT-5完成任务时长延伸了52%

GPT-5提示指南

各路大神都进行了实测,但是要想自己玩得好,还要看官方指南。

OpenAI自己出了官方指导手册「GPT-5 prompting guide」。

指南基于官方团队与早期测试者(如Cursor)的实践经验,总结了在不同场景下提升GPT-5输出质量的提示策略,涵盖智能体主动性调控、上下文收集优化、Responses API 的高效利用,以及在前端/全栈开发中的最佳实践。

OpenAI表示他们从规划到执行,尽可能的最大化编码性能。

比如前端开发,GPT-5 在训练中具备了出色的基准审美品味,同时拥有严谨的实现能力。

对于新应用,OpenAI建议使用以下框架和包,以最大程度地发挥该模型在前端方面的能力:

  • 框架:Next.js(TypeScript)、React、HTML

  • 样式/UI:Tailwind CSS,shadcn/ui,Radix 主题

  • 图标:Material Symbols、Heroicons、Lucide

  • 动画: Motion

  • 字体:San Serif、Inter、Geist、Mona Sans、IBM Plex Sans、Manrope

并且网友们也整了一套GPT-5的提示词范例。比如

1.深度推理与问题解决(Deep Reasoning & Problem-Solving)

先把问题拆解成清晰步骤,再输出答案,减少推理错误。

2.先批评再定稿模式(Critique Before Final Mode)

先完成初稿,再让GPT-5批评并修改,提升质量。

3.角色+目标+约束(Role + Objective + Constraints)

设定身份、目标和严格约束,让输出更贴合需求。

4.逐步加深(Progressive Deepening)

先给高层概述,再逐步深入细节,避免一次性信息过载。

彩蛋

被网友催的狠了,现在OpenAI已经把GPT-5之前的所有模型都放了出来。

快去看看你的ChatGPT里是否已经有了。

方法是进入设置并打开「显示传统模型」,就能在下拉菜单中看到之前的模型了。

同时,你也可以选择将颜色设置尊贵的「黑色」

参考资料:

https://cookbook.openai.com/examples/gpt-5/gpt-5_prompting_guide#collaborative-coding-in-production-cursors-gpt-5-prompt-tuning

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
西方战略专家感叹:中国是全世界,唯一强得悄无声息的超级大国!

西方战略专家感叹:中国是全世界,唯一强得悄无声息的超级大国!

勇士军武闲谈
2026-03-05 11:20:31
继飞机铁路公交后,小众迷们爱上了电梯和减速带

继飞机铁路公交后,小众迷们爱上了电梯和减速带

酷玩实验室
2026-03-06 13:24:01
常务副皇帝怡亲王胤祥后人今何在:九世孙退休前是北京副处级干部

常务副皇帝怡亲王胤祥后人今何在:九世孙退休前是北京副处级干部

铭记历史呀
2025-12-17 17:42:20
全球独苗陨落!美军精准摧毁伊朗KC-747加油机

全球独苗陨落!美军精准摧毁伊朗KC-747加油机

老马拉车莫少装
2026-03-07 09:47:17
炸裂! 46岁中国教授穿校服装高中生, 飞澳洲混入名校偷拍男生, 当场被捕! 澳媒头条刷屏报道

炸裂! 46岁中国教授穿校服装高中生, 飞澳洲混入名校偷拍男生, 当场被捕! 澳媒头条刷屏报道

澳洲红领巾
2026-03-06 12:58:48
谷维素加维生素B12,可改善老年人4大常见问题,建议收藏!

谷维素加维生素B12,可改善老年人4大常见问题,建议收藏!

李药师谈健康
2026-03-06 13:25:58
同样搞核武,美国为啥不敢动朝鲜,却把伊朗往死里打?

同样搞核武,美国为啥不敢动朝鲜,却把伊朗往死里打?

三目观史
2026-03-06 07:31:12
难道伊朗背后真有高人指导?纽约时报:他专挑美国弱点下死手!

难道伊朗背后真有高人指导?纽约时报:他专挑美国弱点下死手!

青青子衿
2026-03-06 00:13:50
央视主持沙桐:离婚后妻子嘲讽二人多年没性生活,前妻直言别扯淡

央视主持沙桐:离婚后妻子嘲讽二人多年没性生活,前妻直言别扯淡

冷紫葉
2026-02-25 15:28:41
“戏混子”没走,比资本家丑孩子更可怕的是“星二代”开始世袭了

“戏混子”没走,比资本家丑孩子更可怕的是“星二代”开始世袭了

流史岁月
2026-01-26 10:58:30
小龙虾最受欢迎的 10 个插件,装上之后才明白它有多强大!

小龙虾最受欢迎的 10 个插件,装上之后才明白它有多强大!

AI范儿
2026-03-06 07:32:29
足坛疯狂一夜!皇马惊险绝杀,巴黎玩脱轮换大法,利物浦当场复仇

足坛疯狂一夜!皇马惊险绝杀,巴黎玩脱轮换大法,利物浦当场复仇

篮球圈里的那些事
2026-03-07 11:40:13
直接承认抄袭!长城汽车董事长道歉,魏建军低头认错没甩锅

直接承认抄袭!长城汽车董事长道歉,魏建军低头认错没甩锅

商悟社
2026-03-06 22:02:03
此人是中共叛徒,失去价值后被判枪决,临终前喊:中国共产党万岁

此人是中共叛徒,失去价值后被判枪决,临终前喊:中国共产党万岁

简史档案馆
2026-03-06 11:05:03
AI将胜任80%岗位!亿万富翁:如今5岁儿童成年后将无需再为生存而工作

AI将胜任80%岗位!亿万富翁:如今5岁儿童成年后将无需再为生存而工作

快科技
2026-03-06 14:54:07
不敢喝了!4大头部椰子水全造假,100%纯椰水全是水+糖 +科技狠活

不敢喝了!4大头部椰子水全造假,100%纯椰水全是水+糖 +科技狠活

川渝视觉
2026-03-04 20:09:52
亚洲杯乱套!赢4-0只排第2名,中国女足形势骤变,遭3大强队包围

亚洲杯乱套!赢4-0只排第2名,中国女足形势骤变,遭3大强队包围

何老师呀
2026-03-06 14:49:35
巴基斯坦也没有想到,跟着中国混来混去,结果自己也混了一个霸主

巴基斯坦也没有想到,跟着中国混来混去,结果自己也混了一个霸主

老范谈史
2025-12-09 20:00:56
特朗普,派“蒋介石”上前线?

特朗普,派“蒋介石”上前线?

中国新闻周刊
2026-03-06 15:27:37
笑死!李雨桐直接爆薛之谦手机号!男方隐私社交账号随之曝光

笑死!李雨桐直接爆薛之谦手机号!男方隐私社交账号随之曝光

魔都囡
2026-03-05 10:20:00
2026-03-07 12:19:00
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
14656文章数 66665关注度
往期回顾 全部

科技要闻

OpenClaw爆火,六位"养虾人"自述与AI共生

头条要闻

中东局势动荡 欧盟"女外长"污蔑:中国趁机拿捏欧洲

头条要闻

中东局势动荡 欧盟"女外长"污蔑:中国趁机拿捏欧洲

体育要闻

塔图姆归来:凯尔特人的春之绿

娱乐要闻

周杰伦田馥甄20年地下情 被扒得底朝天

财经要闻

针对"不敢休、不让休"怪圈 国家出手了

汽车要闻

逃离ICU,上汽通用“止血”企稳

态度原创

健康
游戏
时尚
房产
旅游

转头就晕的耳石症,能开车上班吗?

0护甲蝎子是干净的?TES假赛内幕曝光:AD跟打野爆了

这些才是适合普通人的穿搭!搭配腰带、多穿牛仔裤,简单舒适

房产要闻

传统学区房熄火?2月海口二手房爆火的板块竟然是…

旅游要闻

别急着登机!在青岛机场,享受麦香与花香的春日微醺之旅

无障碍浏览 进入关怀版