网易首页 > 网易号 > 正文 申请入驻

李沐:大模型发展趋势与个人职业选择

0
分享至

思源Source报道

编辑:seefun

2024.8.23,李沐学长回交大讲座纪要。 李沐学长在讲座中介绍了大语言模型的发展趋势,创业Boson.AI的心得体会,以及个人职业选择(PhD,打工 or 创业)

李沐学长在今天上海交通大学的讲座上,分享了过去两年在大语言模型训练、部署、产品化、和基础架构上的一些实际经验,对大语言模型未来趋势做一些预测,以及个人职业生涯选择上的一些建议;

大语言模型

与传统AI一样,LLM(大语言模型)的三大基础依然是:算力,数据,算法

从硬件上看,摩尔定律依然活着。带宽和存储的增长或许逼近极限,但更低bit数据格式带来了更大的通量和更快的速度。由于显卡规模的增大,水冷散热变得非常必要。由于大语言模型火热带来的高溢价,和老黄关系再好,也不得不加价买卡。新卡每年性能翻倍,但价格是原先的1.4倍。但长期看算力依然是越来越便宜。各种厂商AI加速卡很多,但大多只在推理阶段还算OK,nVIDIA依然垄断了大模型的训练阶段的算力,短期很难找到替代品。

长期看算力的持续贬值,大模型训练成本也会不断下降,所以大模型本身也不是一个能保值的东西,价值会随着时间降低,也某种意义上受摩尔定律的影响。

10-50T token的预训练数据规模已经接近极限(因为全人类的知识量有限,当前数据质量的提升比数量提升更重要);由于硬件和数据瓶颈,大模型的激活参数在 500B 可能是极限,100-500B 的大模型会是未来主流的大小。

End-to-end和多模态是当前大模型的趋势。由于文本是信息密度最高的,也是最容易获得的。通过文本模型的泛化能力,用文本模态作为多个模态中介是一个很好的方案。

在人机交互产品设计方面,对于单一的简单操作,比如关窗户,用户更倾向于手动点一下按钮,可能会觉得和大模型交互不是那么有意义。而对于一些复杂的任务则并非如此,需要按一系列条件执行一系列任务,交给大模型则更为省事。但长文本的prompt控制也远不如直接说话方便,使用语音更符合用户习惯。

模型层面,语言模态已经比较成熟,能给个80-85分;语音(audio)则是勉强可用,70-80分水平,而视觉(video)则比较薄弱,大概只能给个50分。

应用层面,数据越多的领域,就越能被自动化。当前大模型在简单的文科任务上已经能很好地代替人类。因为文科任务是最能简单快速采集大量数据的。在简单理科任务和复杂文科任务上能力正在突破。而当前想要替代蓝领,还非常遥远。工厂需要投放大量传感器,做好数字化基础设施建设,数据收集和整理方案成熟起来,才有大模型落地的希望。而这一切当前看来还很难,但一旦实现就会是重大变革。

我们在创业中学到了什么?高质量数据和后训练算法的创新,对行业大模型的提升很大。OpenAI的RLHF有点牵强,(RL)这套技术很原始。Llama标数据据说花了5000w美金,和内部人士聊过,感觉数据没标好,算法也没花太多时间,所以开源的Llama还有很大提升空间。

对于不一样的数据,不一样的目标函数,针对性做研发是有意义的。

之前的机器学习范式:先做好Evaluation(评估),再去做其他事情。自然语言非常难评估,但是也非常关键。LLM本质还是ML(机器学习),都吃数据,都需要很好的评估方法,特点都是一致的。

自建GPU集群不会比租便宜很多,利润大头都被nv吃掉了。

职业规划建议

沐神兜兜转转,什么地方都去过,无论是学校,大公司还是创业。在交大6年读完本硕,CMU读了5年PhD,也还在港科有2年科研助理经历。也去过UCB和斯坦福做过访问学者。大厂在百度待过2年(首席架构师),在亚马逊待过7年(资深首席科学家)。加上两年的创业经历。(这些经历时间线上可能有重叠)

沐神总结了一下大厂打工人、PhD,创业的区别。大厂的目标是升职加薪,PhD的目标就是博士毕业,创业的目标就是套现退出;为了达成这些目标,作为大厂员工,就得去解决问题,对其公司目标;读博则是需要找到有价值的科研问题并解决;而创业是要为付费客户解决问题。而这三者需要的动力则是不一样的,而创业需要最强的动力。

作为打工人、PhD、创业者,有着不同的优缺点:

无论哪个选项,都面临着不同程度上的延迟满足:打工一般做出成果,很快便能升职加薪,PhD做出成果可能要延迟几年才能收获认可,而创业通常至少要5年以上才能得到正反馈。

创业是最艰难的,要面临长时间没有正反馈的生活,也要能一直保持着热情。

关于大厂工作、读博、创业,沐神都写过对应的文章,《工作五年反思》《博士这五年》《创业一年,人间三年》,这种定期总结的习惯,也是持续自我提升的一个不错的方法。

QA彩蛋,关于toB:

国内toB环境差,toB相比于美国而言更加难做,这已经是共识。但越艰难也意味着竞争对手会更少,不至于陷入低价值的内卷,早入场也许会更有机会。随着人力成本的不断增加,企业的付费意愿也会相应增加。交付超出用户预期的产品是企业获得竞争优势的关键。

——The End——

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
国家出手抓的4位首富,罪行太恶劣坑惨老百姓,个个都不配原谅

国家出手抓的4位首富,罪行太恶劣坑惨老百姓,个个都不配原谅

阅微札记
2026-01-23 16:19:38
尹锡悦狱中遭晴天霹雳,奉命行事的下属被狠判,他的下场只会更糟

尹锡悦狱中遭晴天霹雳,奉命行事的下属被狠判,他的下场只会更糟

国际阿尝
2026-01-23 14:05:32
"第一软饭男"去世了,伺候美国老妇13年,继承268亿,死后钱给谁

"第一软饭男"去世了,伺候美国老妇13年,继承268亿,死后钱给谁

毒sir财经
2025-12-08 22:57:40
绿营动手,黄国昌恐被判刑,新加坡反对“台独”,或撤走在台部队

绿营动手,黄国昌恐被判刑,新加坡反对“台独”,或撤走在台部队

风干迷茫人
2026-01-23 15:54:15
高市早苗有种不祥预感,已做好辞职准备,提到继任者时表情很落寞

高市早苗有种不祥预感,已做好辞职准备,提到继任者时表情很落寞

王墨观察
2026-01-23 16:25:03
辽宁一银行进入破产程序

辽宁一银行进入破产程序

本账号停运
2026-01-23 09:30:02
左手背再现新瘀青,特朗普最新回应:吃药副作用,磕到桌子容易青

左手背再现新瘀青,特朗普最新回应:吃药副作用,磕到桌子容易青

环球网资讯
2026-01-23 10:33:07
北京周日再迎小雪,最高温又将降至零下!

北京周日再迎小雪,最高温又将降至零下!

鲁中晨报
2026-01-23 13:47:02
A股:放量普涨,逾3941股飘红,成交额超3万亿!下周行情预测

A股:放量普涨,逾3941股飘红,成交额超3万亿!下周行情预测

虎哥闲聊
2026-01-23 15:22:48
国际奥委会主席,第三次找上门,想让中国办2036年奥运会。

国际奥委会主席,第三次找上门,想让中国办2036年奥运会。

南权先生
2026-01-19 15:43:28
马克龙称法国扣押一艘从俄罗斯出发的油轮 俄方发声

马克龙称法国扣押一艘从俄罗斯出发的油轮 俄方发声

财联社
2026-01-23 16:34:06
特朗普摊牌了:谁敢抛美债就报复,丹麦打响第一枪,中国照抛不误

特朗普摊牌了:谁敢抛美债就报复,丹麦打响第一枪,中国照抛不误

沧海旅行家
2026-01-23 16:02:45
美国发起的所谓“和平委员会”首次会议在瑞士达沃斯举行

美国发起的所谓“和平委员会”首次会议在瑞士达沃斯举行

财联社
2026-01-22 18:27:07
司令正要吃饭,警卫员跑来报告:军区来大官了,您快点去迎接吧!

司令正要吃饭,警卫员跑来报告:军区来大官了,您快点去迎接吧!

浩渺青史
2026-01-21 05:46:54
睡完首富睡首相:从厂妹到顶级名媛,靠男人捞到268亿,她凭什么

睡完首富睡首相:从厂妹到顶级名媛,靠男人捞到268亿,她凭什么

深度报
2026-01-21 22:54:05
南方医科大学太憋屈,合并省人民医院握三强院仍无缘双一流

南方医科大学太憋屈,合并省人民医院握三强院仍无缘双一流

初见音乐吧
2026-01-23 15:00:06
每体:巴萨新主席将于7月1日就任,目前共4人参与角逐

每体:巴萨新主席将于7月1日就任,目前共4人参与角逐

懂球帝
2026-01-23 04:28:12
国乒教练重新分配!莎头被重点照顾,蒯曼失望,樊振东也有教练

国乒教练重新分配!莎头被重点照顾,蒯曼失望,樊振东也有教练

章民解说体育
2026-01-22 11:40:57
直到央视公开“点名”朱亚文,才明白,原来李幼斌一个字都没说错

直到央视公开“点名”朱亚文,才明白,原来李幼斌一个字都没说错

寒士之言本尊
2025-12-01 22:07:44
官方:新任中国乒协主席王励勤辞去上海乒协会长一职

官方:新任中国乒协主席王励勤辞去上海乒协会长一职

懂球帝
2026-01-23 12:05:05
2026-01-23 17:24:49
人工智能研究 incentive-icons
人工智能研究
分享深度学习、CV、NLP
295文章数 134关注度
往期回顾 全部

科技要闻

TikTok守住了算法"灵魂" 更握紧了"钱袋子"

头条要闻

涉发文侮辱记者 上市公司及实控人一审被判道歉并赔偿

头条要闻

涉发文侮辱记者 上市公司及实控人一审被判道歉并赔偿

体育要闻

跑个步而已,他们在燃什么?

娱乐要闻

刘大锤曝料 将王星越的“体面”撕粉碎

财经要闻

茂名首富,这次糟了

汽车要闻

主打家庭大六座 奕境首款SUV将北京车展亮相

态度原创

健康
旅游
本地
房产
游戏

打工人年终总结!健康通关=赢麻了

旅游要闻

各地以创新供给激活市场潜力 冰雪奇景、首店经济齐发力“燃”动消费新引擎

本地新闻

云游中国|格尔木的四季朋友圈,张张值得你点赞

房产要闻

正式官宣!三亚又一所名校要来了!

不做性感角色!《神鬼寓言》将注重展现不同种族

无障碍浏览 进入关怀版