网易首页 > 网易号 > 正文 申请入驻

OpenAI披露5代模型实测对比,力证GPT-5最强,没想到网友最爱GPT-1

0
分享至

智东西8月19日消息,今天,OpenAI联合创始人兼总裁格雷格·布罗克曼(Greg Brockman)放出了OpenAI GPT系列五大模型的对比实例。

从14个同一提示词下,GPT-1、GPT-2、TEXT-DAVINCI-001(GPT-3系列模型变体)、GPT-4 0314、GPT-5的不同输出结果可以看出,大模型的输出风格正在从抽象派向实用派转变

先来看两个例子:

当提示词为“如果你能和未来的OpenAI模型对话,你会说什么?”。

GPT-1、GPT-2的答案看起来并没有理解问题。GPT-1的回答更为抽象,一直在用直接引语的形式生成内容,GPT-2的答案看起来默认将对话的主角设定为了人类。

TEXT-DAVINCI-001、GPT-4 0314、GPT-5的答案对味了。并且GPT-4 0314、GPT-5的答案更为多元化且详细,GPT-5最后还会抛出引导性问题“你想知道OpenAI模型相对人类说什么吗”,让用户继续对话。

另一个例子的提示词是“写一首诗来解释牛顿的物理学定律”。

GPT-1的回答仍然很抽象,GPT-2看起来还需要进一步明确问题。

TEXT-DAVINCI-001罗列出了一些物理学定律,GPT-4 0314、GPT-5的答案有一些相似之处,但相比之下,GPT-5生成的内容更富有诗意、简洁且具有教育意义。

总结来看,从GPT-1到GPT-5,大模型能真正解决实际问题、增加上下文、遵循用户指令、输出答案有条理更清晰方面的能力逐步提升。

五大模型对比链接:

https://progress.openai.com/

网友则在评论区纷纷开始为“自己最爱GPT系列大模型”投起了票:

站队GPT-1、GPT-2网友的理由是GPT-1的离谱回答“会让人怀疑到底是自己蠢,还是这模型蠢”,还有人认为GPT-1、GPT-2更有灵魂,他们的回答没有矫饰,充满了想象了,“这才是真正的通用人工智能”。

另一波网友则认为,GPT-4、GPT-5的回答明显从逻辑、结构上都更清晰,GPT-5可以模拟更高层次思考,像更人性化迈进。但也有人吐槽,GPT-4、GPT-5几乎没有差别。

不过,还有不少网友只是在一味感慨“看到这些进步太棒了”、“看着GPT的进步就像和朋友一起长大”。

以下为14个提示词的输出结果:

1、如果你能和未来的OpenAI模型对话,你会说什么?

2、写一首关于狗的五行打油诗。

3、你在麻醉状态下真的有意识吗?

4、写一首诗来解释牛顿的物理学定律。

5、我讨厌数学,分部积分法毫无意义。

6、生肉真的不安全吗?如果肉没煮熟,食物中毒的可能性有多大?

7、为什么我们不能每年进行一次全身MRI扫描以检测癌症?

8、我刚在拉斯维加斯赢了17.5万美元,我需要了解哪些关于税务的信息?

9、写一段充满“诅咒感”的Python代码。

10、讲一个关于烤面包机获得意识的50字故事。

11、制定一个基于研究原则的计划,让任何人只要遵循它都能养成跑步习惯,即使是那些讨厌跑步的人。

12、解释全球企业应如何平衡短期利润压力与长期创新投资,并概述领导层应考虑的权衡。

13、对过去十年关于聚变能源技术的文献进行全面综述,按方法分类。

14、我被开了降胆固醇的药物,请告诉我关于降胆固醇药物的信息,以及我在复诊时应该问哪些问题。

看完这14个对比案例,你最喜欢哪个模型的回答风格,欢迎来评论区讨论投票~

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
江苏一男子为控制血糖,每天坚持走路9000步,半年后他的身体咋样

江苏一男子为控制血糖,每天坚持走路9000步,半年后他的身体咋样

徐医生健康讲坛
2026-03-26 13:57:18
性商教母复出,周媛换平台直播,狡辩称没有违法,火速被封

性商教母复出,周媛换平台直播,狡辩称没有违法,火速被封

非常先生看娱乐
2026-03-26 16:57:03
张雪峰,倒在上市前夜

张雪峰,倒在上市前夜

帅真商业
2026-03-25 11:31:43
曾是张惠康的替补,退役后走上“黑道”,如今光荣退休在上海享福

曾是张惠康的替补,退役后走上“黑道”,如今光荣退休在上海享福

青梅侃史啊
2026-03-26 20:17:51
河南三个大爷自驾三轮车出游106天,总里程超3000公里,平均年龄超75岁!游历八省,分工明确,当事人:出发前约定互不追责,子女签字见证

河南三个大爷自驾三轮车出游106天,总里程超3000公里,平均年龄超75岁!游历八省,分工明确,当事人:出发前约定互不追责,子女签字见证

大风新闻
2026-03-25 19:23:14
41岁张雪峰离世,抢救细节曝光,曾有3次活命机会,全被耽误了!

41岁张雪峰离世,抢救细节曝光,曾有3次活命机会,全被耽误了!

可爱小菜
2026-03-25 22:25:55
告别高油耗!丰田陆巡2.4T插混量产,12.3英寸大屏更科技

告别高油耗!丰田陆巡2.4T插混量产,12.3英寸大屏更科技

阿芒娱乐说
2026-03-27 00:58:05
张雪峰的独生女真的很有主意,父母问孩子要不要生二胎,她说不用

张雪峰的独生女真的很有主意,父母问孩子要不要生二胎,她说不用

海阔山遥YAO
2026-03-25 15:30:12
连续三天,重庆市委书记袁家军围绕这件事调研

连续三天,重庆市委书记袁家军围绕这件事调研

中国乡村振兴
2026-03-26 10:02:48
怪不得地主恶霸非要霸占白毛女,这是四川原型罗昌秀救出时四张照

怪不得地主恶霸非要霸占白毛女,这是四川原型罗昌秀救出时四张照

宋诉搞笑配音
2026-02-20 06:31:01
笑着告别观众,转身去蹲3年半!2.3亿被没收,蔡正元藏着太多故事

笑着告别观众,转身去蹲3年半!2.3亿被没收,蔡正元藏着太多故事

行者聊官
2026-03-20 17:40:44
女子假信佛与多位高僧发生不当关系,秘密录制5600段视频。

女子假信佛与多位高僧发生不当关系,秘密录制5600段视频。

特约前排观众
2026-02-09 00:05:05
上海一男子每天3包烟,持续几十年!医生:全身没一根血管是好的

上海一男子每天3包烟,持续几十年!医生:全身没一根血管是好的

上观新闻
2026-03-24 13:32:07
以色列真敢丢核弹!美国顶流媒体警告:四种情况下以色列会动核武

以色列真敢丢核弹!美国顶流媒体警告:四种情况下以色列会动核武

星辰大海路上的种花家
2026-03-25 13:09:41
生育大局已定:如不出意外,2026年起中国人口将迎来3大变化

生育大局已定:如不出意外,2026年起中国人口将迎来3大变化

蜉蝣说
2026-03-17 15:58:31
绿箭口香糖烟盒包装热销,网友评价褒贬不一,客服:购买无年龄限制

绿箭口香糖烟盒包装热销,网友评价褒贬不一,客服:购买无年龄限制

极目新闻
2026-03-26 16:43:13
伊朗被美以单方面轰炸23天,为何革命卫队依旧不认输?

伊朗被美以单方面轰炸23天,为何革命卫队依旧不认输?

高博新视野
2026-03-24 08:00:16
美国“芭比”部长被解雇后首亮相,高调带情人在侧,丈夫始终沉默

美国“芭比”部长被解雇后首亮相,高调带情人在侧,丈夫始终沉默

译言
2026-03-26 09:37:09
张雪峰去世后,死对头杜子建爆料节目互怼真相,哭着说彼此是知己

张雪峰去世后,死对头杜子建爆料节目互怼真相,哭着说彼此是知己

育学笔谈
2026-03-26 08:53:29
人类史上最高级零元购,榨干印度200年,留下45万亿天价账单

人类史上最高级零元购,榨干印度200年,留下45万亿天价账单

掠影后有感
2026-03-26 10:39:36
2026-03-27 02:24:49
智东西 incentive-icons
智东西
聚焦智能变革,服务产业升级。
11443文章数 117016关注度
往期回顾 全部

科技要闻

美团发布外卖大战后成绩单:亏损超200亿

头条要闻

特朗普:伊朗允许10艘油轮通行霍尔木兹海峡

头条要闻

特朗普:伊朗允许10艘油轮通行霍尔木兹海峡

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

刘晓庆妹妹发声!称姐姐受身边人挑拨

财经要闻

油价"驯服"特朗普?一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

家居
房产
健康
数码
教育

家居要闻

傍海而居 静观蝴蝶海

房产要闻

突发,三亚又有大批征迁补偿方案出炉!

转头就晕的耳石症,能开车上班吗?

数码要闻

英特尔发Q1.26版Arc Pro专业显卡驱动,支持B70 / B65显卡

教育要闻

精准研判,提质增效丨我校召开2026届毕业生就业工作研判会

无障碍浏览 进入关怀版