网易首页 > 网易号 > 正文 申请入驻

百度文新一言提前批面试题7道|含解析

0
分享至

13本七月在线内部电子书在文末,自取~

公众号福利

回复【100题】领取《名企AI面试100题》PDF

回复【干货资料】领取NLP、CV、ML、大模型等方向干货资料

1、transformer的结构

Transformer是一种基于注意力机制的深度学习模型,广泛应用于自然语言处理(NLP)任务。它的结构主要由以下几个部分组成:

  • Encoder-Decoder结构:Transformer模型分为两个部分:编码器(Encoder)和解码器(Decoder)。

    • Encoder:由多个相同的编码层(通常是6层)堆叠而成,每层由两部分组成:自注意力机制(Self-Attention Mechanism)和前馈神经网络(Feed-Forward Neural Network, FFNN)。

    • Decoder:同样由多个相同的解码层(通常也是6层)堆叠而成,每层包括三部分:自注意力机制(Self-Attention Mechanism)、编码器-解码器注意力机制(Encoder-Decoder Attention)和前馈神经网络(FFNN)。

  • Attention机制:Transformer的核心是注意力机制,尤其是多头自注意力机制(Multi-Head Self-Attention),它允许模型关注输入序列中不同位置的关系。

  • Position Encoding:由于Transformer不使用循环结构(如RNN中的时间步),它使用位置编码(Positional Encoding)来捕捉序列中各位置的位置信息。

  • Layer Normalization:每一层中使用归一化来加速训练并提高稳定性。

2、transformer残差连接的目的

残差连接(Residual Connection)的主要目的是解决梯度消失问题,使得在深度网络训练时梯度能够更容易地传播,从而有助于更深层次网络的训练。此外,残差连接也可以保留输入信息,防止信息在层之间丢失,有助于模型的稳定性和收敛速度。

题3、transformer encoder的归一化是什么

Transformer Encoder使用的是Layer Normalization(层归一化)。在每个子层的输出上应用LayerNorm,以稳定模型的训练并加快收敛速度。

4、cv常用的归一化是什么,和transformer归一化的区别

在计算机视觉(CV)中,常用的归一化方法是Batch Normalization(批归一化)。BatchNorm在训练时会基于一个mini-batch的数据来计算均值和方差,然后使用这些统计量对数据进行归一化。

区别:

  • BatchNorm: 对整个mini-batch的数据进行归一化,依赖于batch内的统计量;主要用于卷积神经网络(CNN)。

  • LayerNorm: 对每个单独的样本进行归一化,不依赖于batch的大小;更适合像Transformer这种序列模型。

5、layernorm的公式

LayerNorm对每一个输入样本 x 的每一个特征 x_i 进行归一化。具体公式如下:

其中:

是输入特征的均值。

是一个小的正数,用于防止除以零。

- H 是输入的维度。

最后,归一化后的值会通过两个可学习参数 和 进行缩放和平移:

6、batchnorm推理时的方差和均值如何计算

在推理时,BatchNorm不再使用每个batch内的均值和方差,而是使用在训练过程中累积的全局均值和方差。这些全局统计量通常通过指数移动平均(Exponential Moving Average, EMA)在训练期间进行估计。

具体来说,全局均值和方差的计算公式如下:

  • 全局均值:通过所有训练batch的均值按如下方式计算:


  • 全局方差:通过所有训练batch的方差按如下方式计算:


其中,是衰减因子(通常接近1)。

7、RAG的流程

RAG(Retrieval-Augmented Generation) 是一种结合了检索与生成的模型结构,特别适用于需要大量外部知识的自然语言生成任务。RAG的主要流程如下:

  1. 检索(Retrieval):给定一个输入查询,使用检索模型(如DPR)从预先构建的文档数据库中获取与查询相关的文档片段。

  2. 生成(Generation):将检索到的文档片段与查询拼接,输入到生成模型(如BART或GPT)中进行回答生成。

  3. 输出(Output):生成模型利用检索到的信息生成最终的答案。

RAG的优势在于能够利用大量外部知识库,增强生成模型的知识能力,从而生成更加准确和信息丰富的答案。

↓以下13本书电子版免费领,直接送↓

扫码回复【999】免费领13本电子书

(或找七月在线其他老师领取)

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
张艺谋:第一次见她,我对她说,你等着我们来找你,不要乱演电影

张艺谋:第一次见她,我对她说,你等着我们来找你,不要乱演电影

秀语千寻
2026-02-22 19:28:42
媒体人:中国篮球历史上第一位美式后卫的生涯可能要结束了

媒体人:中国篮球历史上第一位美式后卫的生涯可能要结束了

懂球帝
2026-03-06 08:34:06
薛之谦是“长宁海王”!?

薛之谦是“长宁海王”!?

八卦疯叔
2026-03-05 11:14:49
卷来卷去,工资重回3000元时代!为什么这次大家不再抱怨了?

卷来卷去,工资重回3000元时代!为什么这次大家不再抱怨了?

另子维爱读史
2026-01-26 20:08:00
专家:美以想要摧毁伊朗导弹能力难度很大

专家:美以想要摧毁伊朗导弹能力难度很大

参考消息
2026-03-06 11:44:13
“人体艺术”,绝非色情!

“人体艺术”,绝非色情!

文刀万
2026-03-06 06:05:03
中国货船通过霍尔木兹海峡,伊朗:仅针对美以欧…

中国货船通过霍尔木兹海峡,伊朗:仅针对美以欧…

观察者网
2026-03-05 18:05:08
年入5亿,腾讯投的自行车要IPO

年入5亿,腾讯投的自行车要IPO

投资家
2026-03-06 20:55:51
他成为韩国大学教授了?

他成为韩国大学教授了?

奋斗在韩国
2026-03-06 13:26:13
小米发布国内第一个手机版龙虾,正式开启小范围封测,首批支持小米17系列机型

小米发布国内第一个手机版龙虾,正式开启小范围封测,首批支持小米17系列机型

极目新闻
2026-03-06 13:46:51
中东大战日本先崩!日媒哀叹:缺乏中国的战略远见

中东大战日本先崩!日媒哀叹:缺乏中国的战略远见

北向财经
2026-03-06 20:28:33
NBA MVP榜:亚历山大榜首,前四保持不变,杜兰特第九

NBA MVP榜:亚历山大榜首,前四保持不变,杜兰特第九

懂球帝
2026-03-07 07:31:05
养老金公平性引热议!四大群体的诉求,戳中制度痛点,太扎心了

养老金公平性引热议!四大群体的诉求,戳中制度痛点,太扎心了

老特有话说
2026-03-06 15:46:13
怒其不争!皇马绝杀夜最尴尬之人,攻防全崩,他已成最大软肋!

怒其不争!皇马绝杀夜最尴尬之人,攻防全崩,他已成最大软肋!

澜归序
2026-03-07 06:29:18
中国女篮72-66胜巴西,球员评分:三人满分三人优秀一人及格

中国女篮72-66胜巴西,球员评分:三人满分三人优秀一人及格

吴朑爱游泳
2026-03-06 22:16:07
台湾天然气供应恐中断?郭正亮:民进党能源政策碰到危机难以处理

台湾天然气供应恐中断?郭正亮:民进党能源政策碰到危机难以处理

海峡导报社
2026-03-06 07:18:14
官宣!5月1日起烟花燃放全面新规,普通人买、放、存全变了

官宣!5月1日起烟花燃放全面新规,普通人买、放、存全变了

老特有话说
2026-03-06 16:14:54
耿爽,有新职

耿爽,有新职

南方都市报
2026-03-06 16:43:06
社保重仓16个筹码高度集中股,这4股股东才3000户,全是行业龙头

社保重仓16个筹码高度集中股,这4股股东才3000户,全是行业龙头

鹏哥投研
2026-03-06 08:08:27
老年人的性生活多久一次合理?要戴套吗?答案颠覆认知

老年人的性生活多久一次合理?要戴套吗?答案颠覆认知

贱议你读史
2026-03-06 23:28:50
2026-03-07 08:20:49
七月在线
七月在线
AI与智能网联汽车职教平台
837文章数 37关注度
往期回顾 全部

科技要闻

OpenClaw爆火,六位"养虾人"自述与AI共生

头条要闻

伊朗大规模发射新一代导弹 摧毁美军大量设施、装备

头条要闻

伊朗大规模发射新一代导弹 摧毁美军大量设施、装备

体育要闻

跑了24年,他终于成为英超“最长的河”

娱乐要闻

周杰伦社交媒体晒昆凌,夫妻感情稳定

财经要闻

关于经济、股市等,五部门都说了啥?

汽车要闻

逃离ICU,上汽通用“止血”企稳

态度原创

教育
时尚
旅游
家居
公开课

教育要闻

本科扩招10万人!深度解析战略布局

这些才是适合普通人的穿搭!搭配腰带、多穿牛仔裤,简单舒适

旅游要闻

郑州海昌海洋公园:以“友好”为笔,绘就春日共融画卷

家居要闻

暖棕撞色 轻法奶油风

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版