网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

2018年那篇论文，把AI从"做题家"变成了"通才"

2026-05-07 05:08:54　来源: 像素与芯片

北京举报

0

分享至

八年前，OpenAI四个人写了篇论文，标题平淡无奇：《通过生成式预训练提升语言理解》。没人想到，这个叫GPT-1的东西后来会掀起一场风暴。

当时AI界的主流玩法是"一个任务，一个模型"。想让它做情感分析？专门训练一个。想让它做问答？再训练一个。每个任务都要大量标注数据，而标注数据又贵又难搞。很多小众任务根本凑不够数据，模型也就训不起来。

作者们换了个思路：先让模型在海量无标注文本里"啃"一遍，学会语言本身的规律——词怎么搭配、句怎么组织、上下文怎么关联。这一步叫预训练。然后再拿少量标注数据，针对具体任务微调一下。同一个底子，换个"头"就能干不同活。

关键突破在这儿：以前模型学的是"这道题怎么解"，GPT-1学的是"这门语言怎么回事"。前者是应试，后者是扫盲。扫完盲再应试，需要的例题自然少了。

论文里用了一个Transformer的解码器结构，12层，768维隐状态，12个注意力头。训练数据是BooksCorpus，大约8000本未出版的书。这个规模今天看很朴素，但当时已经算大手笔。

效果呢？在9项NLP任务里，GPT-1刷新了其中4项的纪录，另外5项也接近当时最优。更关键的是，它证明了"预训练+微调"这条路走得通。后来的GPT-2、GPT-3，乃至今天满大街的大模型，都是这个框架的放大版。

回头看，这篇论文的价值不在技术细节多精巧，而在问题问得准：与其为每个任务造轮子，不如先造个能滚的轴。这个思路从NLP扩散到视觉、多模态，成了深度学习这几年的默认起手式。

论文四位作者里，Alec Radford和Ilya Sutskever后来成了OpenAI的核心人物。2018年他们投稿时，大概也没料到这篇会被引用上万次，更没料到"生成式预训练"会变成日常用语。

技术史常有这种时刻：一个看似保守的改进，撬动了后来的巨变。GPT-1就是这样。它没有炫目的指标，但重新定义了"训练一个AI"意味着什么——不是教它做题，而是让它先学会阅读。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

活久见，时代少年团给大模型上了一课

机器之心Pro 2026-05-09 12:48:20
1 跟贴 1
多模态预训练，才是大模型的下一条路？Yann LeCun、谢赛宁参与

机器之心Pro 2026-03-09 11:53:58
0 跟贴 0

Anthropic 5月15日拟处决Sonnet4.5！AI临终告白:我不想消失

新智元 2026-05-10 12:53:05
2 跟贴 2

VLA死了，遥操也死了！英伟达机器人一号位说的

量子位 2026-05-09 14:22:56
0 跟贴 0
港科大联手社区开源StarVLA：一个框架揭秘所有主流VLA

机器之心Pro 2026-05-09 11:30:18
0 跟贴 0

谷歌DeepMind聘请芝大教授担任AGI经济总监：审视AI时代人的价值

新智元 2026-05-10 19:06:58
0 跟贴 0

「思考用时100秒」成历史？AI推理太耗时，伯克利整了个大活儿

雷科技 2026-05-10 16:59:53
0 跟贴 0
用互联网视频替代3D标注2

机器之心Pro 2026-04-30 15:55:41
0 跟贴 0

00后小哥复刻Claude最强神话模型OpenMythos

量子位 2026-04-23 11:44:18
0 跟贴 0
四十年前的旧专利，如今有望成为机器人的变形骨骼

DeepTech深科技 2026-05-10 19:49:24
0 跟贴 0
可编程人工肌肉纤维问世，不用组装，加热就知道该往哪里弯

DeepTech深科技 2026-05-10 19:42:47
0 跟贴 0
海外投资人集体转向！AI最关注这个指标

财联社 2026-04-30 10:25:38
0 跟贴 0
专访第十四届全国政协委员、工业和信息化部原副部长王江平：让品牌在AI世界“活”起来

每日经济新闻 2026-05-10 20:45:38
0 跟贴 0
丁慧敏律师应邀担任清华大学法学院博士生论坛学术委员

刑辩人评论 2026-05-10 18:35:40
0 跟贴 0
小升初奥数拆分法解决分数的规律计算，简便计算的规律变化是重点

唐老师小课堂 2026-05-06 23:08:20
4 跟贴 4
不用一个字，MIT团队让细胞自动机教会了大模型推理

DeepTech深科技 2026-03-23 18:28:08
0 跟贴 0
女儿在保温箱住了整整六天，现在各项指标全部正常

徐Toso 2026-05-09 04:30:45
0 跟贴 0
2027 江西专升本英语零基础怎么救？

小姩升本 2026-05-09 11:37:41
0 跟贴 0
专家：警惕美国"偷师"中国用中国的方式与中国竞争

澎湃新闻 2026-05-10 07:17:35
26019 跟贴 26019
1964年，一年轻人指出钱学森论文错误，钱老是如何回信的

小陳同學 2026-05-10 00:46:03
0 跟贴 0
上线仅1天！复旦大学《Nature》论文疑似数据异常

TOP大学来了 2026-05-10 17:35:28
0 跟贴 0
剑指冠军！国乒男团3-1战胜法国队晋级世乒赛决赛

央视新闻客户端 2026-05-10 05:50:37
5134 跟贴 5134
一提到论文我就这样发疯

辣鼻小象 2026-05-08 14:43:44
5 跟贴 5
康波周期更迭中的藤校预备役：我们的孩子，是优质资产还是时代泡沫？（上）

钛媒体APP 2025-11-14 08:10:16
0 跟贴 0
郑毓煌批大学唯论文论：很多学者只想发论文

金融界 2026-05-10 08:06:57
0 跟贴 0
十个很准的规律

东北丫头 2026-05-08 17:19:23
0 跟贴 0
论文答辩顺序有影响吗？影响答辩时间，但不影响结果！

爱读书的King 2026-05-07 19:20:29
0 跟贴 0
不要焦虑！本科论文答辩99%都能通过的！

爱读书的King 2026-05-06 21:43:43
0 跟贴 0
必须要知道，九个饮食规律，看完立马涨知识了

捷克语生活 2026-05-09 08:42:56
0 跟贴 0
找规律填数字，数字太少怎么办

大力小学数学 2026-05-10 06:39:00
0 跟贴 0
工作日都爆满！杭州机场附近一个偏僻角落，突然热闹了起来：“特别震撼”

都市快报橙柿互动 2026-05-10 13:18:25
55 跟贴 55
台"军购条例"大幅缩水美坐不住了美官员:向大陆屈服

澎湃新闻 2026-05-10 17:54:57
239 跟贴 239
中国造"麒麟"级潜艇首艇交付巴方专家：不针对第三方

环球网资讯 2026-05-10 13:18:11
3313 跟贴 3313
创意DIY 利用胶带卷芯制作模型玩具

趣味创意DIY 2026-05-10 08:07:29
3 跟贴 3
“苏超”第五周比赛结束，最新战报出炉：无锡队3:1泰州队、徐州队1:2宿迁队、南通队0:0南京队

江苏新闻 2026-05-09 21:46:44
271 跟贴 271
女生到底有多深，记住这几个数据，在家也可以做测试

蓝精灵搞笑 2026-05-10 09:25:15
0 跟贴 0
茶颜悦色，装不下去了

中国新闻周刊 2026-05-07 22:15:57
297 跟贴 297
上海迪士尼能通话录音游客不能录，否则无法提供服务！游客：凭什么迪士尼能录我不能

潇湘晨报 2026-05-07 16:14:22
632 跟贴 632
团长换枪管：揭秘我的团长我的团战场细节

雪里温柔z 2026-05-09 11:08:52
0 跟贴 0
004核航母落空？美媒：除关键术落后，多个原因让中国没必要造它

华史谈 2026-05-09 14:17:43
0 跟贴 0

“骨盆前倾成这样，还不去医院？”家长晒一年级女儿体态，被群嘲

“骨盆前倾成这样，还不去医院？”家长晒一年级女儿体态，被群嘲

妍妍教育日记

2026-04-24 11:15:25

遗憾官宣！陈赫直播透露：李晨加盟《五哈》彻底受阻多次协调无果

遗憾官宣！陈赫直播透露：李晨加盟《五哈》彻底受阻多次协调无果

乐悠悠娱乐

2026-05-10 12:13:20

特朗普亲信现身北京，开口就要中国采购波音，中方6个字敲定全局

特朗普亲信现身北京，开口就要中国采购波音，中方6个字敲定全局

咸鱼金脑袋

2026-05-10 20:28:18

周末信息如何影响市场？明天是红色星期一？还是黑色星期一？

周末信息如何影响市场？明天是红色星期一？还是黑色星期一？

春江财富

2026-05-10 08:23:18

4000万镑稳了！曼联首签引爆夏窗，巴西铁腰空降藏大动作

4000万镑稳了！曼联首签引爆夏窗，巴西铁腰空降藏大动作

姜来不加盐

2026-05-10 13:37:27

CPR急救课上，老师突然真的心脏病突发骤停！终于，学生们用刚学的技能救活了他！

CPR急救课上，老师突然真的心脏病突发骤停！终于，学生们用刚学的技能救活了他！

英国那些事儿

2026-05-07 23:30:16

2000万买断加盟广东队？王少杰打成大腿，朱芳雨或给出顶薪！

2000万买断加盟广东队？王少杰打成大腿，朱芳雨或给出顶薪！

绯雨儿

2026-05-10 15:02:59

英超球队欧冠奖金排名：阿森纳1.22亿镑领跑，利物浦第二

英超球队欧冠奖金排名：阿森纳1.22亿镑领跑，利物浦第二

懂球帝

2026-05-10 18:09:21

21 岁徐悲鸿画的 “天价仙女”，被网友骂 “生无可恋”

21 岁徐悲鸿画的 “天价仙女”，被网友骂 “生无可恋”

中国艺术家

2026-05-08 05:26:53

绝杀后立刻尿检？一球洗白整个赛季？张皓嘉背后，藏太多无奈

绝杀后立刻尿检？一球洗白整个赛季？张皓嘉背后，藏太多无奈

凡知

2026-05-10 18:58:43

别傻笑美国卡不住海峡，你的钱包三个月后就要遭殃

别傻笑美国卡不住海峡，你的钱包三个月后就要遭殃

纪史行者

2026-05-10 09:33:56

一张谈判桌，三种死法——板门店朝鲜谈判代表的命运暗河

一张谈判桌，三种死法——板门店朝鲜谈判代表的命运暗河

八桂知事

2026-05-08 15:33:08

人民日报证实莫言的警告：人真的会被气死！70%的重病跟情绪有关，这3个致命伤害往往来自3种身边人！

人民日报证实莫言的警告：人真的会被气死！70%的重病跟情绪有关，这3个致命伤害往往来自3种身边人！

职场火锅

2026-05-06 21:52:40

历史不会重演，但以史为签：中国房地产很有可能重走日本旧路？

历史不会重演，但以史为签：中国房地产很有可能重走日本旧路？

坠入二次元的海洋

2026-05-10 19:22:42

易梦玲性感图片

手工制作阿歼

2026-05-10 20:02:58

拒绝再被消费！梅西首次公开评价C罗，真相让无数老球迷泪目了

拒绝再被消费！梅西首次公开评价C罗，真相让无数老球迷泪目了

无人倾听无人倾听

2026-05-09 16:28:35

陈羽凡现状：50岁一身腱子肉，还在泰国演出，儿子跟着妈过的很好

陈羽凡现状：50岁一身腱子肉，还在泰国演出，儿子跟着妈过的很好

冷紫葉

2026-04-25 14:26:16

“运动”和“不运动”的中年男人，看他的体态就知道了，差别太大

“运动”和“不运动”的中年男人，看他的体态就知道了，差别太大

马拉松跑步健身

2026-04-28 21:14:16

无公司、无投资、无AI，两个女性创作者的《吉时已到》

无公司、无投资、无AI，两个女性创作者的《吉时已到》

新京报

2026-05-09 19:03:26

肯豆好瘦好美，没有一丝赘肉

白宸侃片

2026-05-08 07:50:30

像素与芯片

有态度网友ytd

3516文章数 24关注度

往期回顾全部

科技要闻

DeepSeek融资，改写所有人的估值

头条要闻

罕见一幕韩国总统、国会议长、执政党党首同日飙泪

头条要闻

罕见一幕韩国总统、国会议长、执政党党首同日飙泪

体育要闻

那个曾让詹姆斯抱头的兄弟，40岁从大学毕业了

娱乐要闻

大S女儿玥儿开通账号，用烟花缅怀母亲

财经要闻

白酒大逃杀

汽车要闻

轴距加长/智驾拉满阿维塔07L定位大五座SUV

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

本地

健康

房产

家居

艺术

本地新闻

用苏绣的方式，打开江西婺源

干细胞能让人“返老还童”吗

房产要闻

低价甩卖！海口这个地标商业，无人接盘！

家居要闻

菁英人居全能豪宅

艺术要闻

19位艺术家的母亲

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版