网易首页 > 网易号 > 正文 申请入驻

台大李宏毅老师教程《预训练语言模型》教程,261页ppt

0
分享至


预训练语言模型(PLMs)是在大规模语料库上以自监督方式进行预训练的语言模型。在过去的几年中,这些PLM从根本上改变了自然语言处理社区。在本教程中,我们旨在从两个角度提供广泛而全面的介绍:为什么这些PLM有效,以及如何在NLP任务中使用它们。本教程的第一部分对PLM进行了一些有见地的分析,部分解释了PLM出色的下游性能。第二部分首先关注如何将对比学习应用于PLM,以改进由PLM提取的表示,然后说明如何在不同情况下将这些PLM应用于下游任务。这些情况包括在数据稀缺的情况下对PLM进行微调,以及使用具有参数效率的PLM。我们相信,不同背景的与会者会发现本教程内容丰富和有用。

https://d223302.github.io/AACL2022-Pretrain-Language-Model-Tutorial/

PDF和PPT下载

后台回复:李宏毅

近年来,基于深度学习的自然语言处理(NLP)已经成为主流研究,比传统方法有了显著改进。在所有深度学习方法中,在感兴趣的下游任务上微调自监督预训练语言模型(PLM)已经成为NLP任务中的标准流程。自ELMo (Peters等人,2018年)和BERT (Devlin等人,2019年)于2018年提出以来,从PLM微调的模型在各种任务中占据了许多排行榜,包括问答、自然语言理解、自然语言推理、机器翻译和句子相似度。除了将PLM应用于各种下游任务之外,许多人一直在深入了解PLM的属性和特征,包括PLM表示中编码的语言知识,以及PLM在预训练期间获得的事实知识。

有两个教程专注于自监督学习/ PLM:一个是NAACL 2019的教程(Ruder等人,2019),另一个是AACL 20201的教程。然而,考虑到该领域不断发展的性质,可以想象PLM的研究已经取得了重大进展。具体来说,与2019年PLM主要由科技巨头持有并用于科学研究相比,如今的PLM被具有不同硬件基础设施和数据量的用户更广泛地应用于各种现实场景中,从而提出了以前从未出现过的问题。已经取得了实质性的进展,包括对PLM的有效性和新的训练范式的可能答案,以使PLM更好地部署在更现实的环境中。因此,我们认为通过一个组织良好的教程将PLM的最新进展告知NLP社区是必要和及时的。本教程分为两个部分:为什么PLM工作和PLM如何工作。表1总结了本教程将涉及的内容。本教程旨在促进NLP社区的研究人员对近年来PLM进展有一个更全面的看法,并将这些新出现的技术应用于他们感兴趣的领域。

教程结构

预训练语言模型是在大规模语料库上以自监督方式进行预训练的语言模型。传统的自监督预训练任务主要涉及恢复损坏的输入句子,或自回归语言建模。在对这些PLM进行预训练后,可以对下游任务进行微调。按照惯例,这些微调协议包括在PLM之上添加一个线性层,并在下游任务上训练整个模型,或将下游任务表述为句子补全任务,并以seq2seq的方式微调下游任务。在下游任务上对PLM进行微调通常会带来非凡的性能提升,这就是plm如此受欢迎的原因。在教程的第一部分(估计40分钟)中,我们将总结一些发现,这些发现部分解释了为什么PLM会导致出色的下游性能。其中一些结果帮助研究人员设计了更好的预训练和微调方法。在第二部分(估计2小时20分钟)中,我们将介绍如何预训练和微调PLM的最新进展;本部分中介绍的新技术已经被证明在实现卓越性能的同时,在硬件资源、训练数据和模型参数方面带来了显著的效率。

PDF和PPT下载

后台回复:李宏毅










PDF和PPT下载

后台回复:李宏毅

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
张兰现身韩国,首次与儿媳妇小梅同框吃饭,一家三口幸福无比

张兰现身韩国,首次与儿媳妇小梅同框吃饭,一家三口幸福无比

黑哥侃娱
2024-04-28 21:40:21
确认了!利拉德跟腱受伤!雄鹿彻底完了

确认了!利拉德跟腱受伤!雄鹿彻底完了

篮球教学论坛
2024-04-28 05:58:46
突发!快船更新伦纳德伤病状态,第四场比赛B计划已有答案

突发!快船更新伦纳德伤病状态,第四场比赛B计划已有答案

奕辰说球
2024-04-28 15:20:55
多地高校禁止学生“五一”自行组团旅游,建议与家人朋友结伴出行

多地高校禁止学生“五一”自行组团旅游,建议与家人朋友结伴出行

澎湃新闻
2024-04-28 12:28:41
不等了!足协表态:国足主帅伊万提供归化建议,奥斯卡或加盟国足

不等了!足协表态:国足主帅伊万提供归化建议,奥斯卡或加盟国足

刺头体育
2024-04-28 21:38:05
中国网友极度舒适!美国新电影《内战》吓坏了“中国润人”?

中国网友极度舒适!美国新电影《内战》吓坏了“中国润人”?

军武次位面
2024-04-26 10:37:51
4月28日,央视主持人朱迅,真的万万想不到!

4月28日,央视主持人朱迅,真的万万想不到!

柠檬有娱乐
2024-04-28 16:42:16
刚刚, 日本突然宣布!半导体和量子将被纳入出口管制,所有出口均需获得官方许可

刚刚, 日本突然宣布!半导体和量子将被纳入出口管制,所有出口均需获得官方许可

和讯网
2024-04-28 16:35:48
班凯罗登上热搜,成为历史第一人!

班凯罗登上热搜,成为历史第一人!

小豆豆赛事
2024-04-28 15:09:02
疯狂的职业索赔:有人一年内以“无证拍黄瓜”向1372家餐饮店索赔

疯狂的职业索赔:有人一年内以“无证拍黄瓜”向1372家餐饮店索赔

澎湃新闻
2024-04-28 21:40:27
价格屠夫来了!吉利银河降至9万元起,网友:你让比亚迪怎么打?

价格屠夫来了!吉利银河降至9万元起,网友:你让比亚迪怎么打?

厨二锅
2024-04-28 17:28:25
皇马客战拜仁名单:贝林、维尼修斯领衔,阿拉巴库尔图瓦随队出征

皇马客战拜仁名单:贝林、维尼修斯领衔,阿拉巴库尔图瓦随队出征

直播吧
2024-04-28 20:23:10
悲痛!自称山西问界M7事故家属来发声,涉事车主是该品牌真粉…

悲痛!自称山西问界M7事故家属来发声,涉事车主是该品牌真粉…

火山诗话
2024-04-28 13:40:08
证券市场再出重大消息,透露必有大事发生,明天A股或将大变天!

证券市场再出重大消息,透露必有大事发生,明天A股或将大变天!

彩云的夕阳
2024-04-28 18:18:48
卖淫女子接到宾馆老板通风报信后上天台躲避坠亡,家属起诉宾馆方索赔151万被驳回

卖淫女子接到宾馆老板通风报信后上天台躲避坠亡,家属起诉宾馆方索赔151万被驳回

红星新闻
2024-04-27 20:15:15
周鸿祎突发怪病,发病前一天,他曾在车展上喝过陌生女子递来的水

周鸿祎突发怪病,发病前一天,他曾在车展上喝过陌生女子递来的水

剑齿猫de动物志
2024-04-28 02:55:56
童年买的小鸡仔,为什么那么快就死了?终于知道答案了!

童年买的小鸡仔,为什么那么快就死了?终于知道答案了!

科普中国
2024-04-26 21:42:31
慢镜还原!湖人119-108胜掘金,哈姆“弃用1人”收奇效

慢镜还原!湖人119-108胜掘金,哈姆“弃用1人”收奇效

开心体育站
2024-04-28 15:08:21
老年痴呆提前34年就有征兆!你以为的好习惯,其实是痴呆的元凶!

老年痴呆提前34年就有征兆!你以为的好习惯,其实是痴呆的元凶!

105度的世界
2024-04-26 09:58:13
这个瓜,其实有点炸?

这个瓜,其实有点炸?

刘空青
2024-04-26 20:39:19
2024-04-29 00:10:44
机器学习与Python社区
机器学习与Python社区
机器学习算法与Python
2397文章数 10242关注度
往期回顾 全部

科技要闻

特斯拉生死时速,马斯克西天取经

头条要闻

周鸿祎的二手迈巴赫以990万元成交 半个车圈到场

头条要闻

周鸿祎的二手迈巴赫以990万元成交 半个车圈到场

体育要闻

湖人的G4,尽人事得到了回报

娱乐要闻

张杰谢娜发文为何炅庆生,亲如家人!

财经要闻

上财万字报告深度解读Q1经济

汽车要闻

鸿蒙首款行政旗舰轿车 华为享界S9实车亮相车展

态度原创

时尚
家居
亲子
数码
公开课

裤子+小猫跟,这个组合气质又好看

家居要闻

光影之间 空间暖意打造生活律动

亲子要闻

弟弟和姐姐打架,被姐姐一挥手撂倒,虽然打不过气势不能输

数码要闻

安克推出猫和老鼠联名苹果 iPad 手写笔:支持磁吸充电,208 元

公开课

父亲年龄越大孩子越不聪明?

无障碍浏览 进入关怀版