网易首页 > 网易号 > 正文 申请入驻

OpenAI披露5代模型实测对比,力证GPT-5最强,没想到网友最爱GPT-1

0
分享至


智东西
编译 程茜
编辑 心缘

智东西8月19日消息,今天,OpenAI联合创始人兼总裁格雷格·布罗克曼(Greg Brockman)放出了OpenAI GPT系列五大模型的对比实例。

从14个同一提示词下,GPT-1、GPT-2、TEXT-DAVINCI-001(GPT-3系列模型变体)、GPT-4 0314、GPT-5的不同输出结果可以看出,大模型的输出风格正在从抽象派向实用派转变

先来看两个例子:

当提示词为“如果你能和未来的OpenAI模型对话,你会说什么?”。

GPT-1、GPT-2的答案看起来并没有理解问题。GPT-1的回答更为抽象,一直在用直接引语的形式生成内容,GPT-2的答案看起来默认将对话的主角设定为了人类。


TEXT-DAVINCI-001、GPT-4 0314、GPT-5的答案对味了。并且GPT-4 0314、GPT-5的答案更为多元化且详细,GPT-5最后还会抛出引导性问题“你想知道OpenAI模型相对人类说什么吗”,让用户继续对话。


另一个例子的提示词是“写一首诗来解释牛顿的物理学定律”。

GPT-1的回答仍然很抽象,GPT-2看起来还需要进一步明确问题。


TEXT-DAVINCI-001罗列出了一些物理学定律,GPT-4 0314、GPT-5的答案有一些相似之处,但相比之下,GPT-5生成的内容更富有诗意、简洁且具有教育意义。


总结来看,从GPT-1到GPT-5,大模型能真正解决实际问题、增加上下文、遵循用户指令、输出答案有条理更清晰方面的能力逐步提升。

五大模型对比链接:

https://progress.openai.com/

网友则在评论区纷纷开始为“自己最爱GPT系列大模型”投起了票:

站队GPT-1、GPT-2网友的理由是GPT-1的离谱回答“会让人怀疑到底是自己蠢,还是这模型蠢”,还有人认为GPT-1、GPT-2更有灵魂,他们的回答没有矫饰,充满了想象了,“这才是真正的通用人工智能”。


另一波网友则认为,GPT-4、GPT-5的回答明显从逻辑、结构上都更清晰,GPT-5可以模拟更高层次思考,像更人性化迈进。但也有人吐槽,GPT-4、GPT-5几乎没有差别。



不过,还有不少网友只是在一味感慨“看到这些进步太棒了”、“看着GPT的进步就像和朋友一起长大”。


以下为14个提示词的输出结果:

1、如果你能和未来的OpenAI模型对话,你会说什么?


2、写一首关于狗的五行打油诗。


3、你在麻醉状态下真的有意识吗?


4、写一首诗来解释牛顿的物理学定律。


5、我讨厌数学,分部积分法毫无意义。


6、生肉真的不安全吗?如果肉没煮熟,食物中毒的可能性有多大?


7、为什么我们不能每年进行一次全身MRI扫描以检测癌症?


8、我刚在拉斯维加斯赢了17.5万美元,我需要了解哪些关于税务的信息?


9、写一段充满“诅咒感”的Python代码。


10、讲一个关于烤面包机获得意识的50字故事。


11、制定一个基于研究原则的计划,让任何人只要遵循它都能养成跑步习惯,即使是那些讨厌跑步的人。


12、解释全球企业应如何平衡短期利润压力与长期创新投资,并概述领导层应考虑的权衡。


13、对过去十年关于聚变能源技术的文献进行全面综述,按方法分类。


14、我被开了降胆固醇的药物,请告诉我关于降胆固醇药物的信息,以及我在复诊时应该问哪些问题。


看完这14个对比案例,你最喜欢哪个模型的回答风格,欢迎来评论区讨论投票~

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
曾是央视知名主持,如今桂林街头买菜!她的选择为何让人深思?

曾是央视知名主持,如今桂林街头买菜!她的选择为何让人深思?

民间平哥
2026-01-14 18:25:25
宋美龄价值2亿的麻花手镯,戴到离世:第一任主人仅花费4万大洋

宋美龄价值2亿的麻花手镯,戴到离世:第一任主人仅花费4万大洋

史之铭
2026-01-13 22:55:09
曼联选帅定死条件!四大名帅被排除,阿隆索成唯一候选?

曼联选帅定死条件!四大名帅被排除,阿隆索成唯一候选?

夜白侃球
2026-01-14 22:14:25
呆呆榜一“伙夫哥”续接杀猪饭,18日大摆5000桌,不用报名直接来

呆呆榜一“伙夫哥”续接杀猪饭,18日大摆5000桌,不用报名直接来

奇思妙想草叶君
2026-01-13 18:02:04
2026年慢病报销巨变!6种病免办卡直接省一半钱,大多数还不知情

2026年慢病报销巨变!6种病免办卡直接省一半钱,大多数还不知情

复转这些年
2026-01-11 23:32:18
数千万波斯人,不伺候阿塞拜疆权贵了?伊朗今夜,就是百年前清末

数千万波斯人,不伺候阿塞拜疆权贵了?伊朗今夜,就是百年前清末

南宗历史
2026-01-10 16:15:24
狂赚 7 亿也不给面子!合川文旅正面 “刚” 流量,太解气!

狂赚 7 亿也不给面子!合川文旅正面 “刚” 流量,太解气!

有范又有料
2026-01-14 13:53:11
为什么全国人民都在拒接电话?连10086打来也是瞄一眼就挂掉了!

为什么全国人民都在拒接电话?连10086打来也是瞄一眼就挂掉了!

今朝牛马
2026-01-08 16:05:10
贵妃半裸出浴雕像被指“不雅观”

贵妃半裸出浴雕像被指“不雅观”

深圳晚报
2026-01-13 23:26:00
殷桃两套大片美出圈!深V性感与浅蓝清新切换,46岁身材状态绝了

殷桃两套大片美出圈!深V性感与浅蓝清新切换,46岁身材状态绝了

章眽八卦
2025-12-20 12:29:42
两艘中国油轮掉头,委内瑞拉已停止对华供油,特朗普的计策已生效

两艘中国油轮掉头,委内瑞拉已停止对华供油,特朗普的计策已生效

杰丝聊古今
2026-01-15 01:26:25
胰腺癌去世的人越来越多!专家:牢记饭后4不做,饭前3不吃

胰腺癌去世的人越来越多!专家:牢记饭后4不做,饭前3不吃

岐黄传人孙大夫
2025-12-20 11:45:03
越来越多孩子得白血病?医生坦言:家里4样东西是祸根,趁早扔了

越来越多孩子得白血病?医生坦言:家里4样东西是祸根,趁早扔了

DrX说
2025-11-19 14:42:09
2-1!0-0!U23亚洲杯8强全出炉,具体对阵如下:中国队碰乌兹别克

2-1!0-0!U23亚洲杯8强全出炉,具体对阵如下:中国队碰乌兹别克

侃球熊弟
2026-01-14 21:31:50
CBA打完14轮,最值得入选国家队的5位球员!徐杰领衔,徐昕在列

CBA打完14轮,最值得入选国家队的5位球员!徐杰领衔,徐昕在列

多特体育说
2026-01-14 22:10:32
中俄贸易突然降温:五年来第一次下滑,发生了什么

中俄贸易突然降温:五年来第一次下滑,发生了什么

桂系007
2026-01-14 19:59:42
才 7 个月!克洛普炮轰皇马:阿隆索下课,根本不是他的问题

才 7 个月!克洛普炮轰皇马:阿隆索下课,根本不是他的问题

澜归序
2026-01-14 02:28:33
海关总署:海南自贸港全岛封关之后截至本月上旬 离岛免税购物人次、金额同比分别增长32.4%和49.6%

海关总署:海南自贸港全岛封关之后截至本月上旬 离岛免税购物人次、金额同比分别增长32.4%和49.6%

财联社
2026-01-14 11:20:34
台立法机构将举行弹劾赖清德,郑丽文为何敢重用张亚中,两点考量

台立法机构将举行弹劾赖清德,郑丽文为何敢重用张亚中,两点考量

老蝣说体育
2026-01-13 21:23:39
柬埔寨铁笼拉人当地辟谣翻车,骗不了寻子妈妈的眼泪和公众的眼睛

柬埔寨铁笼拉人当地辟谣翻车,骗不了寻子妈妈的眼泪和公众的眼睛

你食不食油饼
2026-01-12 15:32:08
2026-01-15 02:48:49
智东西 incentive-icons
智东西
聚焦智能变革,服务产业升级。
11069文章数 116942关注度
往期回顾 全部

科技要闻

携程因涉嫌垄断被市场监管总局调查

头条要闻

外媒揭美对伊朗动手方案:派特种部队对高层实施"斩首"

头条要闻

外媒揭美对伊朗动手方案:派特种部队对高层实施"斩首"

体育要闻

你是个好球员,我们就拿你交易吧

娱乐要闻

网红彭十六偷税被封杀 曾成功转型明星

财经要闻

携程被立案调查,最高或被罚超50亿

汽车要闻

曝Model Y或降到20万以内!

态度原创

教育
旅游
时尚
本地
艺术

教育要闻

年轻妈妈带男孩坐地铁,坐姿引发热议!网友:这才是真正的“炫富”!

旅游要闻

从荒地到花海:凯里用 10 年造绿,让冬日公园藏满幸福滋味!

最时髦的单品,难道不是背肌吗?

本地新闻

邵阳公益诉讼检察主题曲:《守望星》

艺术要闻

与光同行的温柔诗意:沉浸于威廉·A·施耐德的人像油画世界

无障碍浏览 进入关怀版