网易首页 > 网易号 > 正文 申请入驻

OpenAI披露5代模型实测对比,力证GPT-5最强,没想到网友最爱GPT-1

0
分享至


智东西
编译 程茜
编辑 心缘

智东西8月19日消息,今天,OpenAI联合创始人兼总裁格雷格·布罗克曼(Greg Brockman)放出了OpenAI GPT系列五大模型的对比实例。

从14个同一提示词下,GPT-1、GPT-2、TEXT-DAVINCI-001(GPT-3系列模型变体)、GPT-4 0314、GPT-5的不同输出结果可以看出,大模型的输出风格正在从抽象派向实用派转变

先来看两个例子:

当提示词为“如果你能和未来的OpenAI模型对话,你会说什么?”。

GPT-1、GPT-2的答案看起来并没有理解问题。GPT-1的回答更为抽象,一直在用直接引语的形式生成内容,GPT-2的答案看起来默认将对话的主角设定为了人类。


TEXT-DAVINCI-001、GPT-4 0314、GPT-5的答案对味了。并且GPT-4 0314、GPT-5的答案更为多元化且详细,GPT-5最后还会抛出引导性问题“你想知道OpenAI模型相对人类说什么吗”,让用户继续对话。


另一个例子的提示词是“写一首诗来解释牛顿的物理学定律”。

GPT-1的回答仍然很抽象,GPT-2看起来还需要进一步明确问题。


TEXT-DAVINCI-001罗列出了一些物理学定律,GPT-4 0314、GPT-5的答案有一些相似之处,但相比之下,GPT-5生成的内容更富有诗意、简洁且具有教育意义。


总结来看,从GPT-1到GPT-5,大模型能真正解决实际问题、增加上下文、遵循用户指令、输出答案有条理更清晰方面的能力逐步提升。

五大模型对比链接:

https://progress.openai.com/

网友则在评论区纷纷开始为“自己最爱GPT系列大模型”投起了票:

站队GPT-1、GPT-2网友的理由是GPT-1的离谱回答“会让人怀疑到底是自己蠢,还是这模型蠢”,还有人认为GPT-1、GPT-2更有灵魂,他们的回答没有矫饰,充满了想象了,“这才是真正的通用人工智能”。


另一波网友则认为,GPT-4、GPT-5的回答明显从逻辑、结构上都更清晰,GPT-5可以模拟更高层次思考,像更人性化迈进。但也有人吐槽,GPT-4、GPT-5几乎没有差别。



不过,还有不少网友只是在一味感慨“看到这些进步太棒了”、“看着GPT的进步就像和朋友一起长大”。


以下为14个提示词的输出结果:

1、如果你能和未来的OpenAI模型对话,你会说什么?


2、写一首关于狗的五行打油诗。


3、你在麻醉状态下真的有意识吗?


4、写一首诗来解释牛顿的物理学定律。


5、我讨厌数学,分部积分法毫无意义。


6、生肉真的不安全吗?如果肉没煮熟,食物中毒的可能性有多大?


7、为什么我们不能每年进行一次全身MRI扫描以检测癌症?


8、我刚在拉斯维加斯赢了17.5万美元,我需要了解哪些关于税务的信息?


9、写一段充满“诅咒感”的Python代码。


10、讲一个关于烤面包机获得意识的50字故事。


11、制定一个基于研究原则的计划,让任何人只要遵循它都能养成跑步习惯,即使是那些讨厌跑步的人。


12、解释全球企业应如何平衡短期利润压力与长期创新投资,并概述领导层应考虑的权衡。


13、对过去十年关于聚变能源技术的文献进行全面综述,按方法分类。


14、我被开了降胆固醇的药物,请告诉我关于降胆固醇药物的信息,以及我在复诊时应该问哪些问题。


看完这14个对比案例,你最喜欢哪个模型的回答风格,欢迎来评论区讨论投票~

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
您有洗屁股的习惯吗?提醒:天天洗肛门的人,能收获4个惊人好处

您有洗屁股的习惯吗?提醒:天天洗肛门的人,能收获4个惊人好处

39健康网
2025-12-13 20:50:34
商业航天+AI应用,深度布局的五家公司!

商业航天+AI应用,深度布局的五家公司!

Thurman在昆明
2026-01-13 01:37:08
86年我放走一个越南女兵,33年后我刚出越南机场就被一排军车接走

86年我放走一个越南女兵,33年后我刚出越南机场就被一排军车接走

萧竹轻语
2025-12-05 17:38:25
2025年,内娱最赚钱的10位明星,刘德华第四,第一名让人意外

2025年,内娱最赚钱的10位明星,刘德华第四,第一名让人意外

林雁飞
2026-01-06 13:15:06
曝35岁徐冬冬已怀孕!50岁尹子维紧张护肚,两人将在2月举办婚礼

曝35岁徐冬冬已怀孕!50岁尹子维紧张护肚,两人将在2月举办婚礼

叶公子
2026-01-13 17:31:57
七旬老人做微创手术时心脏破裂转开胸,术后第三天死亡 “医疗器械临床试验”引发官司

七旬老人做微创手术时心脏破裂转开胸,术后第三天死亡 “医疗器械临床试验”引发官司

红星新闻
2026-01-14 15:26:48
16岁角色穿“情趣内衣”?网易武侠游戏陷擦边争议

16岁角色穿“情趣内衣”?网易武侠游戏陷擦边争议

南方都市报
2026-01-13 14:46:12
为什么女朋友觉得年入百万很简单?网友:她一定有个做足浴的闺蜜

为什么女朋友觉得年入百万很简单?网友:她一定有个做足浴的闺蜜

带你感受人间冷暖
2025-11-04 16:38:29
太离谱,闲鱼惊现 iPhone 18 Pro 工程机

太离谱,闲鱼惊现 iPhone 18 Pro 工程机

花果科技
2026-01-12 12:46:04
看懂史上真实的慈安,才明白慈禧为何绞尽脑汁,一辈子都斗不过她

看懂史上真实的慈安,才明白慈禧为何绞尽脑汁,一辈子都斗不过她

近史谈
2026-01-06 16:28:59
央企“最牛女副处长”落马:两年与上司开房410次,细节曝光

央企“最牛女副处长”落马:两年与上司开房410次,细节曝光

西门老爹
2025-12-16 15:35:31
NBA裁判服了!主动给杨瀚森大拇指,244斤小杨撞头抢球感动太多人

NBA裁判服了!主动给杨瀚森大拇指,244斤小杨撞头抢球感动太多人

嘴炮体坛
2026-01-14 23:00:06
日本自卫队支持率飙至93.7% 创60年代以来历史峰值

日本自卫队支持率飙至93.7% 创60年代以来历史峰值

老马拉车莫少装
2026-01-12 19:17:59
瓦良格号送到中国后有多震撼?专家刮掉表面的锈迹:钢材品质极佳

瓦良格号送到中国后有多震撼?专家刮掉表面的锈迹:钢材品质极佳

古书记史
2026-01-06 16:31:56
王思聪向懒懒高调示爱,超大花束豪宅背景超吸睛,要结婚啦?

王思聪向懒懒高调示爱,超大花束豪宅背景超吸睛,要结婚啦?

草莓解说体育
2026-01-13 11:34:38
破案了!终于搞明白,李亚鹏的嫣然天使儿童医院为什么开不下去了

破案了!终于搞明白,李亚鹏的嫣然天使儿童医院为什么开不下去了

乐悠悠娱乐
2026-01-14 10:42:33
美股异动丨百度盘前拉升涨超2%,据报考虑将香港上市地位提升为主要上市

美股异动丨百度盘前拉升涨超2%,据报考虑将香港上市地位提升为主要上市

格隆汇APP
2026-01-14 17:42:14
看不懂!北京国安续约“玄冥二老”,球迷:不是要培养年轻球员吗

看不懂!北京国安续约“玄冥二老”,球迷:不是要培养年轻球员吗

足球大腕
2026-01-14 12:35:24
1975年,基辛格给毛主席下了一道命令,主席写了张纸条回击,尼克松看后直摇头:这气魄谁能比?

1975年,基辛格给毛主席下了一道命令,主席写了张纸条回击,尼克松看后直摇头:这气魄谁能比?

老杉说历史
2026-01-12 22:07:15
没了热度,没了爱情,没了兄弟的李晨,在《跑男》里慢慢被边缘化

没了热度,没了爱情,没了兄弟的李晨,在《跑男》里慢慢被边缘化

山谷里的怒吼
2026-01-13 19:54:07
2026-01-15 01:32:49
智东西 incentive-icons
智东西
聚焦智能变革,服务产业升级。
11069文章数 116942关注度
往期回顾 全部

科技要闻

携程因涉嫌垄断被市场监管总局调查

头条要闻

媒体:公开鼓动抗议者 特朗普新表态让全球嗅到火药味

头条要闻

媒体:公开鼓动抗议者 特朗普新表态让全球嗅到火药味

体育要闻

你是个好球员,我们就拿你交易吧

娱乐要闻

网红彭十六偷税被封杀 曾成功转型明星

财经要闻

携程被立案调查,最高或被罚超50亿

汽车要闻

曝Model Y或降到20万以内!

态度原创

教育
游戏
家居
时尚
数码

教育要闻

保底offer都拿到了,最值得继续加申的英国大学!

重生之我在丧尸末世当检察官

家居要闻

心之所向 现代建构之美

最时髦的单品,难道不是背肌吗?

数码要闻

存储涨价冲击DIY市场,DDR3主板销量意外逆势倍增

无障碍浏览 进入关怀版