网易首页 > 网易号 > 正文 申请入驻

理想大模型实习面试题6道|含解析

0
分享至

12本七月在线内部电子书在文末,自取~

公众号福利

回复【100题】领取《名企AI面试100题》PDF

回复【干货资料】领取NLP、CV、ML、大模型等方向干货资料

问题1、LLAMA 和 ChatGLM 的区别。

模型

训练数据

训练数据量

模型参数量

词表大小

LLaMA

以英语为主的拉丁语系,不包含中日韩文

1T/1.4T tokens

7B、13B、33B、65B

ChatGLM-6B

中英双语,中英文比例为 1:1

1T tokens

6B

模型

模型结构

位置编码

激活函数

layer norm

LLaMA

Casual decoder

RoPE

SwiGLU

Pre RMS Norm

ChatGLM-6B

Prefix decoder

RoPE

GeGLU

Post Deep Norm

问题2、BatchNorm 和 LayerNorm 什么区别。

layernorm和batchnorm的区别:LN中同层神经元输入拥有相同的均值和方差,不同的输入样本有不同的均值和方差;

BN中则针对不同神经元输入计算均值和方差,同一个batch中的输入拥有相同的均值和方差。

LN不依赖于batch的大小和输入sequence的深度,因此可以用于batchsize为1和RNN中对变长的输入sequence的normalize操作。

由于NLP中的文本输入一般为变长,所以使用layernorm更好。

问题3、Bert 的参数量是怎么决定的。

Bert(Bidirectional Encoder Representations from Transformers)的参数量由其模型结构以及隐藏层的大小、层数等超参数所决定。具体来说,Bert 模型由多个 Transformer Encoder 层组成,每个 Encoder 层包含多个注意力头以及前馈神经网络层。因此,Bert 的参数量主要由这些层的数量、每层的隐藏单元数、注意力头的数量等因素决定。

问题4、p tuning v2 和 prompt tuning 的区别。

Prompt tuning是之前其他论文提出的一种方法,通过冻结语言模型仅去调整连续的prompts,在参数量超过10B的模型上,效果追上了fine-tune,但是在normal-sized模型上表现不好,并且无法解决序列标注任务。针对这两个问题,作者提出了P-tuning v2。

P-Tuning V2在P-Tuning V1的基础上进行了下述改进:

  • 在每一层都加入了Prompts tokens作为输入,而不是仅仅加在输入层,这与Prefix Tuning的做法相同。这样得到了更多可学习的参数,且更深层结构中的Prompt能给模型预测带来更直接的影响。

  • 去掉了重参数化的编码器。在 P-tuning v2 中,作者发现重参数化的改进很小,尤其是对于较小的模型,同时还会影响模型的表现。

  • 针对不同任务采用不同的提示长度。提示长度在提示优化方法的超参数搜索中起着核心作用。在实验中,我们发现不同的理解任务通常用不同的提示长度来实现其最佳性能,这与Prefix-Tuning中的发现一致,不同的文本生成任务可能有不同的最佳提示长度。

  • 可选的多任务学习。先在多任务的Prompt上进行预训练,然后再适配下游任务。一方面,连续提示的随机惯性给优化带来了困难,这可以通过更多的训练数据或与任务相关的无监督预训练来缓解;另一方面,连续提示是跨任务和数据集的特定任务知识的完美载体。

问题5、多头注意力机制和单个注意力机制时间复杂度会变吗?

多头注意力机制和单个注意力机制的时间复杂度都是

O(n^2d) ,其中 n 是序列长度,d 是每个词向量的维度。因为注意力机制涉及计算注意力分数的所有词对,因此时间复杂度与序列长度的平方成正比。无论是多头还是单个注意力机制,时间复杂度都是相同的。

问题6、大模型微调过程中如何避免灾难性遗忘?

在微调大模型的过程中,确实可能会遇到灾难性遗忘的问题,即模型在优化某一特定任务时,可能会忘记之前学到的其他重要信息或能力。 为了缓解这种情况,可以采用以下几种策略:

(1)重新训练:通过使用所有已知数据重新训练模型,可以使其适应数据分布的变化,从而避免遗忘。

(2)增量学习:增量学习是一种在微调过程中逐步添加新数据的方法。通过增量学习,大模型可以在不忘记旧知识的情况下学习新数据。

(3)知识蒸馏:知识蒸馏是一种将老模型的知识传递给新模型的方法。通过训练一个教师模型来生成数据标注或权重,然后将标注或权重传递给新模型进行训练,可以避免灾难性遗忘。

(4)正则化技术:限制模型参数的变化范围,从而减少遗忘,使得大模型在微调过程中保持稳定性。

(5)使用任务相关性数据:如果可能的话,尽量使用与原始任务相关或相似的数据进行微调。这样,模型在优化新任务时,更容易与先前学到的知识建立联系。

↓以下13本书电子版免费领,直接送↓





扫码回复【999】免费领13本电子书

(或找七月在线其他老师领取)

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
离开体制的年轻人:30岁那年 他辞去公务员寻找人生的旷野

离开体制的年轻人:30岁那年 他辞去公务员寻找人生的旷野

封面新闻
2024-05-01 12:30:34
闹大了!上海一女子称三代都是税务局人,评论炸锅,官方回应来了

闹大了!上海一女子称三代都是税务局人,评论炸锅,官方回应来了

鹏飞深文
2024-05-01 14:42:24
“蔚小理”4月成绩单出炉:蔚来汽车增长超130%!小米SU7交付7058台!它,蝉联月销量冠军

“蔚小理”4月成绩单出炉:蔚来汽车增长超130%!小米SU7交付7058台!它,蝉联月销量冠军

每日经济新闻
2024-05-01 18:21:35
5月1日俄乌最新:克里米亚的大规模导弹袭击

5月1日俄乌最新:克里米亚的大规模导弹袭击

西楼饮月
2024-05-01 15:00:03
历史惊人的相似:中国正在用美国搞垮苏联那一套拖垮美国!

历史惊人的相似:中国正在用美国搞垮苏联那一套拖垮美国!

星辰故事屋
2024-05-01 17:27:56
9-13!斯诺克世锦赛超级冷门:特鲁姆普惨遭大黑马4连鞭,止步8强

9-13!斯诺克世锦赛超级冷门:特鲁姆普惨遭大黑马4连鞭,止步8强

体坛扒客
2024-05-01 20:15:30
政治局会议召开,中国再释强烈改革信号

政治局会议召开,中国再释强烈改革信号

国是直通车
2024-05-01 13:54:03
乌克兰空军发言人表示,F-16战机将于复活节(5月5日)后很快出现

乌克兰空军发言人表示,F-16战机将于复活节(5月5日)后很快出现

山河路口
2024-05-01 18:43:49
如果华强北做导弹的话能把价格干到多少?

如果华强北做导弹的话能把价格干到多少?

龙牙的一座山
2024-05-01 10:33:28
梅州高速塌方31死伤者身份曝光,画面流出,目击者披露可怕细节

梅州高速塌方31死伤者身份曝光,画面流出,目击者披露可怕细节

求实者
2024-05-01 12:09:44
东航空姐因和上级闹矛盾打开客机紧急滑梯?知情人:她已经飞了10年了,事发时情绪不是很稳定

东航空姐因和上级闹矛盾打开客机紧急滑梯?知情人:她已经飞了10年了,事发时情绪不是很稳定

纵相新闻
2024-05-01 17:37:28
这是什么风气?网上接连出现高速上开自动驾驶的视频,网友:危险引导应该封杀!

这是什么风气?网上接连出现高速上开自动驾驶的视频,网友:危险引导应该封杀!

可达鸭面面观
2024-05-01 14:16:55
北约秘书长:乌对盟友信任已动摇

北约秘书长:乌对盟友信任已动摇

参考消息
2024-05-01 14:56:23
太惨了!梅州高速塌方已致24死,30伤!现场图片曝光,触目惊心…

太惨了!梅州高速塌方已致24死,30伤!现场图片曝光,触目惊心…

火山诗话
2024-05-01 17:14:59
塌方事故定责全流程!广东梅洲雨太大,五一造成18辆车19人死亡

塌方事故定责全流程!广东梅洲雨太大,五一造成18辆车19人死亡

影孖看世界
2024-05-01 17:52:18
梅大高速事故已确认24人死亡,医院:全县救护车都去了现场

梅大高速事故已确认24人死亡,医院:全县救护车都去了现场

第一财经资讯
2024-05-01 17:34:11
后续!广东梅龙高速路塌方:总投资21亿,施工期间就多次塌方!

后续!广东梅龙高速路塌方:总投资21亿,施工期间就多次塌方!

古希腊掌管松饼的神
2024-05-01 11:55:39
副国级乌云其木格突然去世,官方回应死因,疑似最后露面照流出

副国级乌云其木格突然去世,官方回应死因,疑似最后露面照流出

求实者
2024-05-01 19:46:59
笑死了!看到周鸿祎和二手车商的饭局,我才知道这些人情商有多低

笑死了!看到周鸿祎和二手车商的饭局,我才知道这些人情商有多低

户外小阿隋
2024-05-01 14:28:59
石宏:福建舰开始进行海试,离正式服役还有多久?

石宏:福建舰开始进行海试,离正式服役还有多久?

直新闻
2024-05-01 21:11:33
2024-05-01 22:50:44
七月在线
七月在线
AI与智能网联汽车职教平台
757文章数 37关注度
往期回顾 全部

头条要闻

媒体:福建舰开始海试 最快正式服役可能要到2026年

头条要闻

媒体:福建舰开始海试 最快正式服役可能要到2026年

体育要闻

詹眉湖人:洛杉矶大型烟花秀

娱乐要闻

黄子韬被曝求婚徐艺洋 大量亲密照曝光

财经要闻

万科突发!王石,放弃了!

科技要闻

余承东卸任华为终端CEO 新任命为董事长

汽车要闻

预售2.89-3.49万 奔腾小马正式开启预售

态度原创

教育
时尚
手机
房产
健康

教育要闻

天水求最小值考试题,目标优先,学霸解法很气巧妙

小长假必备!五一出游超适合的单品和搭配!

手机要闻

4月发布新机全综合对比,哪款值得买?

房产要闻

单价2万内,装标4200+,主城改善大盘无套路硬刚!

春天野菜不知不识莫乱吃

无障碍浏览 进入关怀版