网易首页 > 网易号 > 正文 申请入驻

大模型面经 - 通义实验室

0
分享至

作者:小森(阿里巴巴大模型算法工程师)

部门与岗位:阿里集团 - 通义实验室 - 大语言模型

一面

  1. 首先自我介绍和过项目,因为之前在阿里系实习,用过 Qwen 做业务,面试官就很感兴趣,问为什么选 Qwen,Qwen 落地的实际效果怎么样等等

  2. Qwen 的模型结构是怎么样的,相比于 LLaMA , DeepSeek 有什么区别

  3. 对于超长上下文业界一般是怎么做的,你知道 Qwen 是怎么做的吗

  4. 大模型的 MoE 结构 相比于 Dense 结构 训练的难点在什么地方,DeepSeekMoE 为什么效果好,有什么值得我们借鉴创新点

  5. 怎么缓解大模型的幻觉问题

  6. 讲一下 RLHF 的流程, PPO 和 DPO 算法是什么思想,写一下 PPO 和 DPO 的 Loss 表达式

  7. 代码:Transformer Encoder

  8. 代码: 152. 乘积最大子数组


一面整体难度我感觉还是比较大的,考察的内容更加注重对大模型整体的理解,面的时间也比较久,通义 bar 还是高呀

二面

  1. 自我介绍和过项目,项目这里还是类似的,问 Qwen,为什么用 Qwen,相比于其他开源模型好在哪里

  2. 除了 Qwen 还了解哪些模型,LLaMA、DeepSeek、GLM……

  3. 你觉得 DeepSeek 做的好的有哪几个点,讲讲 DeepSeekMoE 和 MLA

  4. 说一下 LoRA 是什么原理

  5. 了解 DeepSpeed 吗, ZeRO-1 , ZeRO-2 和 ZeRO-3 分别做了哪些优化

  6. 知道 FP16 和 BF16 有什么区别吗,包括 FP32 和 INT8 这些,在训练大模型的时候,应该怎么选择

  7. 除了 DeepSpeed,在训练和推理的时候,显存不足还有什么优化方法吗, FlashAttention 具体是怎么做的

  8. 代码: 200. 岛屿数量


二面问的模型结构方面的内容比较少,更多的是训练推理优化方面的内容,更偏底层一些。从 DeepSeek 的动向来看,降低大模型的时间复杂度和空间复杂度应该也是接下来一段时间的重点

三面

  1. 自我介绍,过项目,还是重点问了 Qwen,在过程中还一起讨论了当前做法的优缺点,是否调研过其他方案等

  2. 开放题:站在你的视角,Qwen目前还存在哪些问题

  3. 开放题:你觉得目前大模型的上限在哪里

  4. 假如给你发了 Offer,会来吗


三面还是常规的大老板面,相对气氛比较轻松,会更加看重自己对于大模型的思考

总结

整体面下来感觉难度还是蛮大的,几乎各个方面都被考察到了,通义目前应该算是阿里系 bar 最高的一个部门了吧,之前面达摩院压力都没有这么大

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
人神共愤!最新数据曝光,伊朗神权政府血债累累

人神共愤!最新数据曝光,伊朗神权政府血债累累

山间听雨
2026-01-27 20:05:08
赫尔松俄军主动后撤,美国会对川普强吞格陵兰发出弹劾通牒

赫尔松俄军主动后撤,美国会对川普强吞格陵兰发出弹劾通牒

史政先锋
2026-01-27 19:58:21
HBO斥巨资打造,把美剧拍出了新高度

HBO斥巨资打造,把美剧拍出了新高度

来看美剧
2026-01-27 20:21:56
全国9地取消固定分时电价

全国9地取消固定分时电价

第一财经资讯
2026-01-27 13:53:11
闫学晶送祝福光速复活,网友炸锅:这哪是拜年,是赤裸裸的挑衅!

闫学晶送祝福光速复活,网友炸锅:这哪是拜年,是赤裸裸的挑衅!

好贤观史记
2026-01-27 09:39:55
中纪委通报!两所高校原校长、副校长同日被查

中纪委通报!两所高校原校长、副校长同日被查

TOP大学来了
2026-01-27 22:11:33
嚯!“性商教母”超大规格课程手把手教你勾男人令人面红耳赤

嚯!“性商教母”超大规格课程手把手教你勾男人令人面红耳赤

魔都囡
2026-01-27 10:59:04
这次军委的动作,真是让人倒吸一口凉气!

这次军委的动作,真是让人倒吸一口凉气!

百态人间
2026-01-27 15:31:38
小区内装卸钢化玻璃,不到一小时连发两起事故,有伤者送医后身亡;家属:用工方负责人已被逮捕

小区内装卸钢化玻璃,不到一小时连发两起事故,有伤者送医后身亡;家属:用工方负责人已被逮捕

大风新闻
2026-01-27 17:10:11
香港多家金店涌现卖金长龙

香港多家金店涌现卖金长龙

中国日报网
2026-01-27 20:23:04
超广东升第一!广厦拒青岛29分逆转 胡金秋31+8+6赛季新高

超广东升第一!广厦拒青岛29分逆转 胡金秋31+8+6赛季新高

醉卧浮生
2026-01-27 21:23:35
张雨绮多个商务被取消,护肤、美妆等多个品牌紧急删除其相关代言内容;此前被实名举报代孕、插足婚姻及律师威胁家属等

张雨绮多个商务被取消,护肤、美妆等多个品牌紧急删除其相关代言内容;此前被实名举报代孕、插足婚姻及律师威胁家属等

鲁中晨报
2026-01-27 20:53:09
2026取钱新规:光有密码取不出!5万以上免登记,这2张"纸"是关键

2026取钱新规:光有密码取不出!5万以上免登记,这2张"纸"是关键

另子维爱读史
2026-01-27 20:57:38
全是假的!涉及多个品牌,检测结果触目惊心!网友:老人小孩都在吃

全是假的!涉及多个品牌,检测结果触目惊心!网友:老人小孩都在吃

环球网资讯
2026-01-27 15:41:14
沉默24小时后,卡尼终于发声,与中国协议作废,美财长得寸进尺

沉默24小时后,卡尼终于发声,与中国协议作废,美财长得寸进尺

天仙无味小仙女
2026-01-28 00:41:45
要打就打痛!中国手段已升级,日本:中方不批准驻重庆总领事任命

要打就打痛!中国手段已升级,日本:中方不批准驻重庆总领事任命

沧海旅行家
2026-01-27 17:17:15
你知道咱妈为何要拍《太平年》吗?知道这是拍给谁看的吗?

你知道咱妈为何要拍《太平年》吗?知道这是拍给谁看的吗?

李健政观察
2026-01-27 09:50:28
凯恩将续约拜仁,创队史顶薪纪录

凯恩将续约拜仁,创队史顶薪纪录

星耀国际足坛
2026-01-27 21:18:40
花200万补课后续:380分儿子执意补课,母亲重病陪读,曝更痛隐情

花200万补课后续:380分儿子执意补课,母亲重病陪读,曝更痛隐情

阿讯说天下
2026-01-27 13:45:23
3679元起!苹果突然上架多款 iPhone

3679元起!苹果突然上架多款 iPhone

科技堡垒
2026-01-27 11:49:24
2026-01-28 02:35:00
人工智能研究 incentive-icons
人工智能研究
分享深度学习、CV、NLP
295文章数 134关注度
往期回顾 全部

科技要闻

马化腾3年年会讲话透露了哪些关键信息

头条要闻

美报告称中国是其19世纪以来面对过的最强大国家

头条要闻

美报告称中国是其19世纪以来面对过的最强大国家

体育要闻

冒充职业球员,比赛规则还和对手现学?

娱乐要闻

张雨绮风波持续发酵,曝多个商务被取消

财经要闻

多地对垄断行业"近亲繁殖"出手了

汽车要闻

标配华为乾崑ADS 4/鸿蒙座舱5 华境S体验车下线

态度原创

游戏
本地
时尚
教育
公开课

LPL春季赛:决绝让一追二,AL三局击溃IG,大家的排名都不变

本地新闻

云游中国|拨开云雾,巫山每帧都是航拍大片

这些韩系穿搭最适合普通人!多穿深色、衣服基础,简洁耐看

教育要闻

再创历史新高!南京高三期末调研考划线及成绩出炉

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版