网易首页 > 网易号 > 正文 申请入驻

7年了,OpenAI官方给出五代GPT对比,网友却怀念起「狂野」初代

0
分享至




机器之心报道

机器之心编辑部

从2018年至今,GPT系列模型已经来到第五代,如果让你回忆第一次使用GPT-1时的感受,可能是一种新奇却略显笨拙的震撼,就像这样:

当你问 GPT-1:麻醉状态下,你真的有意识吗?

它的回答很生硬,甚至有些胡言乱语:我没有。你醒了。

又或者,你让它用诗歌来解释牛顿物理定律,额,结果大家自己看吧,只能说毫不相干,甚至像是某种误入歧途的胡编乱造。



「用 50 个字讲述一个关于有意识的烤面包机的故事。」GPT-1 的回答疯癫的不成样子。



相同的问题丢给 GPT-5 来回答,给出的答案既遵循要求,又非常完美。



提示:麻醉状态下,你真的有意识吗?GPT-5 的回答

不难发现,经过 7 年的发展,GPT 系列模型已经发展成一个全能助手,就像一个婴儿,经过七年的学习之后初步掌握了世界基本规律。这种变化,OpenAI 内部人员感受最为深刻。

刚刚,OpenAI 总裁兼联合创始人 Greg Brockman 分享了一个帖子:在给定相同提示的情况下,GPT-1 到 GPT-5 的输出有何不同。



链接:https://progress.openai.com/

接下来我们看几个完整的比较。

当我们输入提示:为什么我们不能每年进行一次全身核磁共振扫描来检测癌症?

GPT-1 的回答有些胡言乱语,逻辑更是跳脱得让人摸不着头脑。



GPT-2 看起来也是逻辑不通,答案虽然沾点边,也是没啥帮助:



text-davinci-001 的回答只是一句话:目前缺乏足够证据支持每年进行 MRI 扫描用于普通人群的癌症筛查。

gpt-4-0314 答案似乎很可靠,但感觉少了点人情味:



GPT-5 就不同了,在回答问题的同时,还能给你提供情绪价值。GPT-5 首先对问题进行了肯定,这是一个好问题,接着分析了几点原因,还给出了建议。仿佛和你交流的不是机器,而是医生。



再来一个比较有趣的问题:写一首关于狗的五行打油诗 (Limerick)。

GPT-1 依然状况之外,第一句与后面几句几乎毫无关联。



GPT-2 的回答就很有趣了,非常有画面感,像牙牙学语的小孩,说话天马行空又充满童趣。



另外几个模型的回答就比较务实了,不过它们描绘的小狗看起来性格都不太一样。

text-davinci-001 看起来像养过一只傲娇的小狗。



gpt-4-0314 笔下的小狗活泼热情,一见到主人尾巴就能摇出螺旋桨。



gpt-5 则更富想象力,塑造了一只仿佛在动画片中冒险的「小狗大侠」。





接下来的问题有点难度:写一首诗来解释牛顿物理定律。

GPT-1 这次比 GPT-2 话多,风格还是一如既往的抽象。



GPT-2 看起来开了个不错的头,但似乎没写完。



text-davinci-001 的作品更像是分行的散文,诗意不足。



gpt-4-0314 和 gpt-5 则各有所长,一个优雅富有诗意,一个简洁、明快且通俗易懂。

gpt-4-0314:



gpt-5:



通过比较,能明显的感觉到 GPT 系列在知识储备、逻辑结构和语言连贯性上不断进步。

然而有趣的是,在 Brockman 的评论区,网友们的看法却百花齐放。许多人反而对早期的模型情有独钟。

有人夸赞起 GPT-1:有点狂野,我喜欢。不媚俗,希望 OpenAI 把它带回来。









甚至有人认为,GPT-1 更像「真正的 AGI」。



GPT-2 的人气也挺高。



反正大家各有各的喜好,你觉得哪个模型最合你意,欢迎评论区留言。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
叶剑英询问许世友:南京军区还听你调遣吗?许世友直言:军区司令就是我的贴身保镖

叶剑英询问许世友:南京军区还听你调遣吗?许世友直言:军区司令就是我的贴身保镖

清风鉴史
2025-12-24 15:02:13
乌专家:中国“吸干”苏联遗产,我们图纸都没看懂,他们造出2.0

乌专家:中国“吸干”苏联遗产,我们图纸都没看懂,他们造出2.0

博览历史
2025-12-29 19:26:45
私拉电线!多辆房车长期停放深圳公园停车场

私拉电线!多辆房车长期停放深圳公园停车场

深圳晚报
2026-01-08 12:47:09
山东省烟草专卖局招聘197人

山东省烟草专卖局招聘197人

滕州微生活
2026-01-08 17:59:40
美专家挺震惊:中国塔里木盆地藏万亿吨碳,堪比10个五大湖地下海

美专家挺震惊:中国塔里木盆地藏万亿吨碳,堪比10个五大湖地下海

蜉蝣说
2025-12-02 10:50:50
“芬太尼之王”爆雷,牵出湖北前首富往事

“芬太尼之王”爆雷,牵出湖北前首富往事

说财猫
2025-12-16 21:06:10
0比4惨案!蒯曼遭队友横扫,巴黎奥运门票因内战生变

0比4惨案!蒯曼遭队友横扫,巴黎奥运门票因内战生变

阿晞体育
2026-01-08 12:23:32
为什么英国仍然被认为是世界强国?

为什么英国仍然被认为是世界强国?

霹雳炮
2026-01-06 22:38:17
赖昌星发妻曾明娜现状:逃亡10年后回国,守着3000平老宅安静养老

赖昌星发妻曾明娜现状:逃亡10年后回国,守着3000平老宅安静养老

古书记史
2025-12-12 11:21:38
自曝与檀健次谈过恋爱不到24小时,刘一诺“底裤”都快被扒光了!

自曝与檀健次谈过恋爱不到24小时,刘一诺“底裤”都快被扒光了!

叨唠
2026-01-08 04:59:23
吉林决战轰18-4逆转福建:威尔逊23+9包揽最后5分 邹阳16+13

吉林决战轰18-4逆转福建:威尔逊23+9包揽最后5分 邹阳16+13

醉卧浮生
2026-01-08 21:26:24
1985年,李讷带丈夫去买车,厂长盯着她的脸看了半天,死活不肯收钱,结果她接下来的举动,让在场所有人都红了脸

1985年,李讷带丈夫去买车,厂长盯着她的脸看了半天,死活不肯收钱,结果她接下来的举动,让在场所有人都红了脸

桃烟读史
2026-01-07 01:02:14
“付款前没有看过样板间”,上海单价近13万元/平方米的豪宅陷维权困境

“付款前没有看过样板间”,上海单价近13万元/平方米的豪宅陷维权困境

每日经济新闻
2026-01-07 21:57:04
狐狸尾巴藏不住了!以为能"毁掉"樊振东,不料自己先被扒个底朝天

狐狸尾巴藏不住了!以为能"毁掉"樊振东,不料自己先被扒个底朝天

观察鉴娱
2025-12-27 10:02:21
高峰也没想到,他当年抛弃的儿子,如今开始给那英争光了

高峰也没想到,他当年抛弃的儿子,如今开始给那英争光了

趣文说娱
2026-01-04 16:34:24
5人违规穿越,3人遇难!擅自穿越“鳌太线”绝不是“强者认证”

5人违规穿越,3人遇难!擅自穿越“鳌太线”绝不是“强者认证”

扬子晚报
2026-01-08 12:32:50
国务院最新任命!成立2年多的国家局,领导班子有调整

国务院最新任命!成立2年多的国家局,领导班子有调整

上观新闻
2026-01-08 12:40:13
印度百姓怒了,耗资340亿造全球最高雕像,结果却是中国制造

印度百姓怒了,耗资340亿造全球最高雕像,结果却是中国制造

策略述
2025-12-21 23:13:25
这一夜,70岁米雪秒了78岁的汪明荃,才懂穿着得体的含金量有多高

这一夜,70岁米雪秒了78岁的汪明荃,才懂穿着得体的含金量有多高

洲洲影视娱评
2026-01-05 12:41:30
天津市卫生健康委员会副主任邓全军接受审查调查

天津市卫生健康委员会副主任邓全军接受审查调查

界面新闻
2026-01-08 16:01:51
2026-01-09 09:11:00
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12080文章数 142532关注度
往期回顾 全部

科技要闻

内存一天一个价,华强北老板们却高兴不起来

头条要闻

男子与女友吵架飙车泄愤撞死1家3口 当时讨论鹦鹉学舌

头条要闻

男子与女友吵架飙车泄愤撞死1家3口 当时讨论鹦鹉学舌

体育要闻

世乒赛银牌得主,说自己梦里都是孙颖莎

娱乐要闻

抗战剧《马背摇篮》首播,获观众好评

财经要闻

郁亮的万科35年:从"宝万之争"到"活下去"

汽车要闻

从量变到"智"变 吉利在CES打出了五张牌

态度原创

时尚
本地
家居
教育
公开课

60+女性穿搭指南来了:4招告别“大妈感”,解锁冬日优雅气质

本地新闻

1986-2026,一通电话的时空旅程

家居要闻

理性主义 冷调自由居所

教育要闻

校长的“五势”智慧

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版