网易首页 > 网易号 > 正文 申请入驻

厉害!天才博士刚毕业,就被前OpenAI CTO抢走!年薪或300万起步

0
分享至


MIT天才博士一毕业,火速加盟OpenAI前CTO初创!

最近,肖光烜(Guangxuan Xiao)在社交媒体官宣,刚刚完成了MIT博士学位。

下一步,他将加入Thinking Machines,专注于大模型预训练的工作。


评论区下方,英伟达科学家、xAI研究员、UCSD等一众大佬,为他本人送上了祝贺。



清华双学位学霸,MIT博士开挂人生

打开他的个人主页,多元而充实的经历便映入眼帘。

肖光烜本科毕业于清华大学,拿到了双学位,主修的是计算机科学,金融学是第二学位。


在此期间,他获得了清华大学综合优秀奖学金(2019)、全国大学生数学建模竞赛(CUMCM)一等奖(2020)、国家奖学金(2020)、清华大学「未来学者」奖学金(2021)等多项奖项。

他曾于2020–2021年作为访问生(Visiting Student),前往斯坦福大学计算机系开展科研工作。

2022年,肖光烜加入MIT攻读博士学位,导师为韩松(Song Han)教授。

个人研究方向聚焦于:深度学习的高效算法与系统,尤其是大规模基础模型(Foundation Model)。


他于2022年9月至2026年1月,在MIT EECS担任全职研究助理(Research Assistant)。

读博期间,肖光烜曾多次进入全球顶级科技大厂从事前沿研究实习,具备了丰富的一线工业研发的经验。


论文地址:https://arxiv.org/pdf/2309.17453

2024年2-5月期间,他作为英伟达实习生,研究方向是为长上下文大语言模型推理加速。

他和团队提出了DuoAttention,结合检索与流式注意力头,实现高效推理。


论文地址:https://research.nvidia.com/labs/eai/publication/duoattention/

随后,他又参与了多项核心研究项目,其中包括:

  • XAttention:基于反对角评分的块稀疏注意力机制

  • StreamingVLM:面向无限视频流的实时理解模型

  • FlashMoBA:混合块注意力(Mixture of Block Attention)的高效优化

值得一提的是,肖光烜在研究之外,还有丰富的兴趣爱好,比如足球、乒乓球、围棋、钢琴。

他曾担任所在院系足球队的队长兼先锋,贝多芬的作品是个人最爱。


一篇博士论文,破解LLM三大难题

比起耀眼的履历,肖光烜的博士论文本身更值得深入研析与拆解。


不得不承认,如今大模型已经无所不能,但它们依然太贵了。

显存爆炸、推理太慢、长上下文直接OOM(内存溢出),这是几乎所有LLM工程团队每天都在面对的现实。

Efficient Algorithms and Systems for Large Language Models这篇论文,给出了一个罕见的、从工程到理论、从算法到架构的完整答案。

论文中, 他们提出了SmoothQuant,解决了一个长期困扰工业界的问题——激活值异常(activation outliers)。

SmoothQuant通过一个巧妙的数学等价变换,把量化难点从「激活」转移到「权重」。

结果,它实现了首个在十亿级模型上W8A8无损量化,无需重新训练,显存更小、推理更快。

针对超长序列的处理,作者在StreamingLLM中发现了「注意力汇点」(attention sink)现象——

即使没有任何语义,初始token会被后续token持续关注。这些token的作用不是「理解」,而是数值稳定。

结果,实现了常数内存的流式推理,模型上下文长度从数千token扩展到百万级

更进一步,他们又把这一思想推广到多模态,StreamingVLM可以在保持时间一致性的同时处理长达数小时的视频内容。

对于超长上下文场景,团队又提出一个互补方案,分别针对不同的性能瓶颈。

  • KVCache太大,采用DuoAttention

注意力头本身就有分工:少数负责「全局检索」,多数只看「最近上下文」。

DuoAttention用混合策略,大幅降低显存,却几乎不掉性能。

  • 预填充(Prefill)太慢,采用XAttention

利用反对角线评分机制,仅识别、计算必要的注意力块,从而实现显著的加速效果。

论文的最后,并没有止步于「优化现有模型」,通过对MoBA(块混合注意力) 的信噪比分析,作者证明了:

理论上,block越小越好。

但现实是,GPU不答应,于是有了FlashMoBA,一种定制化的CUDA内核,使小块架构在实践中可行,并实现了最高可达9倍的速度提升。

这篇论文的价值在于,构建了一整套高效大模型的完整框架,既回应了当下的现实挑战,也为下一代计算高效、普惠可及的AGI奠定了基础。

平均350万年薪,碾压OpenAI

最后来到一个大家比较感兴趣的话题——薪资。

去年,硅谷人才争夺战激烈,BI一篇独家挖到了Thinking Machines(TML)给员工们开出的薪资——

基础年薪高达50万美元(约350万元)。


据BI获取的招聘数据,TML向两名技术员工支付了45万美元的基础年薪,另一名员工的年薪则高达50万美元。

第四名员工被列为「联合创始人/机器学习专家」,其年薪同样为45万美元。

这些薪酬数据,来自2025年第一季度,早于Murati以100亿美元的估值,成功完成20亿美元的种子轮融资。

总体来看,TML为这四名技术员工提供的平均年薪达到462,500美元。

相较之下,TML明显高于业内更为成熟LLM公司——

OpenAI在相关申报文件中列出的29名技术员工,平均年薪为292,115美元。

其中最高薪资为53万美元,最低为20万美元。

Anthropic向14名技术员工支付的平均年薪为387,500美元,薪资区间在30万至69万美元之间。

虽然比起Meta疯狂的超1亿美元薪酬还差得远,但这一水平也在硅谷数一数二。

果然,21世纪最贵的还是人才。

来源:新智元 编辑:桃子

参考资料:

https://x.com/Guangxuan_Xiao/status/2008779396497502337

https://guangxuanx.com/

https://scholar.google.com/citations?user=sRGO-EcAAAAJ

https://www.eecs.mit.edu/eecs-events/doctoral-thesis-efficient-algorithms-and-systems-for-large-language-models/

https://www.businessinsider.com/muratis-new-ai-startup-salary-technical-talent-2025-6

数学好物

最后再来关注一下

超模君精心研发的数学文化T恤!

原创版权设计

穿在身上的

不仅仅是信仰!


原价 269 元

超模君特惠价 139元!

加5元换购限量版公式之美钥匙扣

大家好,这是【超模君】项目的主理人中大数学博士【大Lee】的个人Vlog视频号,欢迎大家关注我的视频号。

喜欢《数学有什么用系列》记得关注超模君Vlog,点赞和点小爱心哦,

一路坚持,靠的是大家!

在这里我会争取日更(大家可以监督),一天一个主题。

在视频号,分享知识,见解,生活碎片,以及家庭生活的日常花絮。

最近在做【优质国货赋能】【安全产品溯源】。也欢迎大家一起做云股东和云监工。

也希望大家可以一起留言互相讨论分享进步。

点击长按关注

简介:超模君,数学与交叉科学教育自媒体博主,中大数学博士,有俩崽崽和一洁癖的太太。爱分享有用的数学建模知识,爱深挖有趣的交叉科学人物故事,爱为靠谱的现代教育、提升幸福感的产品打call。著有 《芥子须弥·大科学家的小故事》、《数学之旅:闪耀人类的54个数学家》、《漫画数学:闪耀人类的54个数学家》、《一份钟数学》 (已售罄)、《薛定谔的猫:漫画大科学家的小萌宠》(已售罄)、超模君幽灵魔方、超模君丙烯马克笔等广受大人与孩子们喜爱的作品。

在这里,超模君不定期会有脑洞大开,和你分享一些新研发出来的,小而美的,有故事的,有知识的理工创意产品,期待与您分享。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
爱泼斯坦私人飞机驾驶员:克林顿曾坐过26次,空姐像糖果脱衣舞娘

爱泼斯坦私人飞机驾驶员:克林顿曾坐过26次,空姐像糖果脱衣舞娘

海佑讲史
2026-02-05 13:00:05
立陶宛:我们确实犯下大错,只要中国低头示好,我们也愿意访华

立陶宛:我们确实犯下大错,只要中国低头示好,我们也愿意访华

指忘崖
2026-02-05 19:23:51
家庭存款6个等级,80%被卡在第3级,你属于第几级

家庭存款6个等级,80%被卡在第3级,你属于第几级

坠入二次元的海洋
2026-01-30 06:39:08
重磅!湖人的交易全部结束!正式公布新阵容!

重磅!湖人的交易全部结束!正式公布新阵容!

林子说事
2026-02-06 07:46:46
GDP负增长!这个特大城市,水逆很久了

GDP负增长!这个特大城市,水逆很久了

城市财经
2026-02-06 11:51:21
3-0!5-0!疯狂一夜,尤文耻辱出局,马竞杀入4强,新月狂轰6球

3-0!5-0!疯狂一夜,尤文耻辱出局,马竞杀入4强,新月狂轰6球

足球狗说
2026-02-06 06:24:03
无力支付120万诉讼费,许家印拘留生活曝光

无力支付120万诉讼费,许家印拘留生活曝光

帅真商业
2026-02-04 20:09:05
徐正源笑着告诉韩媒:中国足协催我应聘他们的主帅,但被我拒绝了

徐正源笑着告诉韩媒:中国足协催我应聘他们的主帅,但被我拒绝了

风过乡
2026-02-06 10:52:42
4000场里程碑!文班29+11马刺送独行侠6连败 弗拉格连4场30+

4000场里程碑!文班29+11马刺送独行侠6连败 弗拉格连4场30+

醉卧浮生
2026-02-06 11:55:16
中方领导人将访美?外交部回应

中方领导人将访美?外交部回应

澎湃新闻
2026-02-05 17:13:03
原来洪金宝说的都是实话,香港演艺圈只有周星驰在向家活出了尊严

原来洪金宝说的都是实话,香港演艺圈只有周星驰在向家活出了尊严

林雁飞
2025-12-30 16:30:40
最惨一代,中年危机遭遇大规模失业潮

最惨一代,中年危机遭遇大规模失业潮

诗词中国
2026-02-04 20:58:36
华国锋孙女华真,目前担任苏富比亚洲区副主席,此前系李云迪妻子

华国锋孙女华真,目前担任苏富比亚洲区副主席,此前系李云迪妻子

老杉说历史
2026-02-03 00:39:20
勇士送上大礼!湖人1日内5喜临门,詹姆斯的第五冠真的有戏了

勇士送上大礼!湖人1日内5喜临门,詹姆斯的第五冠真的有戏了

小路看球
2026-02-06 18:49:35
金兀术全族 70 余口被斩尽杀绝,历史的清算从不会缺席

金兀术全族 70 余口被斩尽杀绝,历史的清算从不会缺席

岸卡卡
2026-02-03 23:15:15
萝莉岛,是进入核心圈层的投名状,你猜他们为什么都穿红皮鞋

萝莉岛,是进入核心圈层的投名状,你猜他们为什么都穿红皮鞋

月满大江流
2026-02-06 09:25:07
今夜,无眠!全崩了

今夜,无眠!全崩了

中国基金报
2026-02-06 00:19:45
追梦:临近交易截止时我非常紧张;我喜欢波尔津吉斯的交易

追梦:临近交易截止时我非常紧张;我喜欢波尔津吉斯的交易

懂球帝
2026-02-06 15:30:07
八部门发布关于进一步防范和处置虚拟货币等相关风险的通知

八部门发布关于进一步防范和处置虚拟货币等相关风险的通知

界面新闻
2026-02-06 20:56:54
快递春节停运上热搜 记者实测:不存在春节全面停运公司 部分网点称无法保证时效

快递春节停运上热搜 记者实测:不存在春节全面停运公司 部分网点称无法保证时效

红星新闻
2026-02-06 21:17:27
2026-02-06 23:47:00
超级数学建模
超级数学建模
专业数学建模、数据挖掘自媒体
7648文章数 99418关注度
往期回顾 全部

科技要闻

独角兽版图巨变:SpaceX奔万亿 中美差在哪

头条要闻

电动车行业"老三"冲刺上市 分股东2亿克扣员工社保3亿

头条要闻

电动车行业"老三"冲刺上市 分股东2亿克扣员工社保3亿

体育要闻

西甲射手榜第2,身价不到姆巴佩1/40

娱乐要闻

微博之夜抢C风波 杨幂工作室9字讨说法

财经要闻

爱尔眼科董事长旗下7家精神病院骗保

汽车要闻

宝马"本命年"关键词:20款新车与"新世代"耐力赛

态度原创

时尚
亲子
手机
公开课
军事航空

豆瓣8.5分,人美剧甜衣品好,小韩拍恋爱剧还是有两把刷子

亲子要闻

当孩子有了自己的审美眼光,理解了家长为什么会帮孩子买丑衣服!

手机要闻

荣耀600被曝光:6.57英寸+9000mAh±电池,友商拿什么打!

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

美国“肯尼迪”号核动力航母完成首次海试

无障碍浏览 进入关怀版