网易首页 > 网易号 > 正文 申请入驻

李沐:大模型发展趋势与个人职业选择

0
分享至

思源Source报道

编辑:seefun

2024.8.23,李沐学长回交大讲座纪要。 李沐学长在讲座中介绍了大语言模型的发展趋势,创业Boson.AI的心得体会,以及个人职业选择(PhD,打工 or 创业)

李沐学长在今天上海交通大学的讲座上,分享了过去两年在大语言模型训练、部署、产品化、和基础架构上的一些实际经验,对大语言模型未来趋势做一些预测,以及个人职业生涯选择上的一些建议;

大语言模型

与传统AI一样,LLM(大语言模型)的三大基础依然是:算力,数据,算法

从硬件上看,摩尔定律依然活着。带宽和存储的增长或许逼近极限,但更低bit数据格式带来了更大的通量和更快的速度。由于显卡规模的增大,水冷散热变得非常必要。由于大语言模型火热带来的高溢价,和老黄关系再好,也不得不加价买卡。新卡每年性能翻倍,但价格是原先的1.4倍。但长期看算力依然是越来越便宜。各种厂商AI加速卡很多,但大多只在推理阶段还算OK,nVIDIA依然垄断了大模型的训练阶段的算力,短期很难找到替代品。

长期看算力的持续贬值,大模型训练成本也会不断下降,所以大模型本身也不是一个能保值的东西,价值会随着时间降低,也某种意义上受摩尔定律的影响。

10-50T token的预训练数据规模已经接近极限(因为全人类的知识量有限,当前数据质量的提升比数量提升更重要);由于硬件和数据瓶颈,大模型的激活参数在 500B 可能是极限,100-500B 的大模型会是未来主流的大小。

End-to-end和多模态是当前大模型的趋势。由于文本是信息密度最高的,也是最容易获得的。通过文本模型的泛化能力,用文本模态作为多个模态中介是一个很好的方案。

在人机交互产品设计方面,对于单一的简单操作,比如关窗户,用户更倾向于手动点一下按钮,可能会觉得和大模型交互不是那么有意义。而对于一些复杂的任务则并非如此,需要按一系列条件执行一系列任务,交给大模型则更为省事。但长文本的prompt控制也远不如直接说话方便,使用语音更符合用户习惯。

模型层面,语言模态已经比较成熟,能给个80-85分;语音(audio)则是勉强可用,70-80分水平,而视觉(video)则比较薄弱,大概只能给个50分。

应用层面,数据越多的领域,就越能被自动化。当前大模型在简单的文科任务上已经能很好地代替人类。因为文科任务是最能简单快速采集大量数据的。在简单理科任务和复杂文科任务上能力正在突破。而当前想要替代蓝领,还非常遥远。工厂需要投放大量传感器,做好数字化基础设施建设,数据收集和整理方案成熟起来,才有大模型落地的希望。而这一切当前看来还很难,但一旦实现就会是重大变革。

我们在创业中学到了什么?高质量数据和后训练算法的创新,对行业大模型的提升很大。OpenAI的RLHF有点牵强,(RL)这套技术很原始。Llama标数据据说花了5000w美金,和内部人士聊过,感觉数据没标好,算法也没花太多时间,所以开源的Llama还有很大提升空间。

对于不一样的数据,不一样的目标函数,针对性做研发是有意义的。

之前的机器学习范式:先做好Evaluation(评估),再去做其他事情。自然语言非常难评估,但是也非常关键。LLM本质还是ML(机器学习),都吃数据,都需要很好的评估方法,特点都是一致的。

自建GPU集群不会比租便宜很多,利润大头都被nv吃掉了。

职业规划建议

沐神兜兜转转,什么地方都去过,无论是学校,大公司还是创业。在交大6年读完本硕,CMU读了5年PhD,也还在港科有2年科研助理经历。也去过UCB和斯坦福做过访问学者。大厂在百度待过2年(首席架构师),在亚马逊待过7年(资深首席科学家)。加上两年的创业经历。(这些经历时间线上可能有重叠)

沐神总结了一下大厂打工人、PhD,创业的区别。大厂的目标是升职加薪,PhD的目标就是博士毕业,创业的目标就是套现退出;为了达成这些目标,作为大厂员工,就得去解决问题,对其公司目标;读博则是需要找到有价值的科研问题并解决;而创业是要为付费客户解决问题。而这三者需要的动力则是不一样的,而创业需要最强的动力。

作为打工人、PhD、创业者,有着不同的优缺点:

无论哪个选项,都面临着不同程度上的延迟满足:打工一般做出成果,很快便能升职加薪,PhD做出成果可能要延迟几年才能收获认可,而创业通常至少要5年以上才能得到正反馈。

创业是最艰难的,要面临长时间没有正反馈的生活,也要能一直保持着热情。

关于大厂工作、读博、创业,沐神都写过对应的文章,《工作五年反思》《博士这五年》《创业一年,人间三年》,这种定期总结的习惯,也是持续自我提升的一个不错的方法。

QA彩蛋,关于toB:

国内toB环境差,toB相比于美国而言更加难做,这已经是共识。但越艰难也意味着竞争对手会更少,不至于陷入低价值的内卷,早入场也许会更有机会。随着人力成本的不断增加,企业的付费意愿也会相应增加。交付超出用户预期的产品是企业获得竞争优势的关键。

——The End——

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
访陆第4天,郑丽文见到最想见的人!闭门会谈1小时,大陆4点建议

访陆第4天,郑丽文见到最想见的人!闭门会谈1小时,大陆4点建议

坠入二次元的海洋
2026-04-11 04:19:10
你敢拖船,我就动手!菲军已做开战准备,中国强拖菲舰就是导火索?

你敢拖船,我就动手!菲军已做开战准备,中国强拖菲舰就是导火索?

明月史说
2026-04-11 00:18:27
高市摊牌了,东京降级对华关系,并通告全球:中国欠日本两笔账

高市摊牌了,东京降级对华关系,并通告全球:中国欠日本两笔账

近史博览
2026-04-11 01:09:05
陪玩陪睡都是毛毛雨!王思聪前女友曝“丑闻”,王家彻底坐不住了

陪玩陪睡都是毛毛雨!王思聪前女友曝“丑闻”,王家彻底坐不住了

一窥究竟
2026-04-10 04:24:44
长公主被家暴流产了

长公主被家暴流产了

毒舌扒姨太
2026-04-08 22:29:19
1公里“开出”5000元车费?上海警方:20名网约车司机落网

1公里“开出”5000元车费?上海警方:20名网约车司机落网

新民晚报
2026-04-10 15:51:04
绿营将“追杀”郑丽文,爆料称高层交代不放过一人,直到达成目的

绿营将“追杀”郑丽文,爆料称高层交代不放过一人,直到达成目的

谛听骨语本尊
2026-04-10 18:30:15
欣旺达成为特斯拉供应商!

欣旺达成为特斯拉供应商!

电动知家
2026-04-10 09:22:44
网上大量的自媒体,你们已经变成伊朗宣传部中国分部了么?

网上大量的自媒体,你们已经变成伊朗宣传部中国分部了么?

世界圈
2026-04-10 13:15:02
花200元买水果被骂吃死你,怀孕妻子心寒不欲生子,已入冷静期!

花200元买水果被骂吃死你,怀孕妻子心寒不欲生子,已入冷静期!

川渝视觉
2026-04-10 15:59:55
中国学霸赴美沦为妓女,嫁给白人赌鬼,说美国是世界上最棒的国家

中国学霸赴美沦为妓女,嫁给白人赌鬼,说美国是世界上最棒的国家

萧鮖记录风土人情
2026-04-09 19:33:39
震惊!老师下班买杯奶茶,竟被家长深夜追责,一段聊天记录炸锅了

震惊!老师下班买杯奶茶,竟被家长深夜追责,一段聊天记录炸锅了

火山詩话
2026-04-08 07:24:29
民进党,极有可能在下一届台湾地区选举后,成为长期一家独大政党

民进党,极有可能在下一届台湾地区选举后,成为长期一家独大政党

李橑在北漂
2026-04-02 10:22:26
我只坚持:“左倍量抄底,右倍量逃顶”,几乎吃掉全部持仓涨幅!

我只坚持:“左倍量抄底,右倍量逃顶”,几乎吃掉全部持仓涨幅!

股经纵横谈
2026-04-10 17:19:16
可能创下50万元级新销量记录,蔚来ES9,领先同行1年?

可能创下50万元级新销量记录,蔚来ES9,领先同行1年?

路咖汽车
2026-04-10 15:49:47
33岁男子4年前车祸身亡,近90万赔偿家属仅拿到30万,肇事车买的是“安全统筹”导致维权难

33岁男子4年前车祸身亡,近90万赔偿家属仅拿到30万,肇事车买的是“安全统筹”导致维权难

大风新闻
2026-04-10 23:07:04
金价大反转

金价大反转

新浪财经
2026-04-10 18:52:09
“我女儿敢这样,腿给砸断”,宝妈晒2个女儿出门,装束让人怒了

“我女儿敢这样,腿给砸断”,宝妈晒2个女儿出门,装束让人怒了

蝴蝶花雨话教育
2026-04-10 13:01:09
宋庆龄爱女隋永清离世,常年烟不离手,68岁结局令人痛心

宋庆龄爱女隋永清离世,常年烟不离手,68岁结局令人痛心

TVB的四小花
2026-02-28 11:30:39
中国通用技术(集团)原总经理助理李克全接受监察调查

中国通用技术(集团)原总经理助理李克全接受监察调查

界面新闻
2026-04-10 10:01:37
2026-04-11 07:11:00
人工智能研究 incentive-icons
人工智能研究
分享深度学习、CV、NLP
299文章数 134关注度
往期回顾 全部

科技要闻

马斯克狂发大火箭也养不起AI 年亏50亿美元

头条要闻

73岁骑友抄近路摔倒身亡 女儿:赔偿问题无法达成共识

头条要闻

73岁骑友抄近路摔倒身亡 女儿:赔偿问题无法达成共识

体育要闻

17岁赚了一百万美元,25岁被CBA裁员

娱乐要闻

黄景瑜王玉雯否认恋情!聚会细节被扒

财经要闻

李强主持召开经济形势专家和企业家座谈会

汽车要闻

搭载第二代刀片电池及闪充技术 腾势N8L闪充版预售35万起

态度原创

艺术
教育
旅游
家居
公开课

艺术要闻

曾熙『仿思翁山水册』

教育要闻

上海小升初压轴题,求面积,难住太多人

旅游要闻

周末来这里!足不出沪体验首尔韩屋风情

家居要闻

复古风格 自然简约

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版