网易首页 > 网易号 > 正文 申请入驻

大模型入门超全指南来了!人大团队力作,内附一线开发经验

0
分享至


智东西
作者 陈骏达
编辑 漠影

2025年,DeepSeek-R1的发布在国内AI领域掀起了一场前所未有的开源风暴。作为一款性能卓越的开源大模型,它不仅开放了模型的获取权限,还主动分享算法细节以及优化策略,激发了整个行业的开放共享热潮。

与此同时,科研论文、技术博客和开源社区的讨论如雨后春笋般涌现,这种开放透明的氛围极大地推动了AI科研知识的共享与传播,吸引了更多研究者和开发者参与到大模型的创新与应用中。

不过,对于刚刚入门大模型的初学者而言,这些论文、研究中涉及的诸多高阶概念或许意味着较高的认知挑战。

一方面,国内外主流AI教科书的成书或更新时间,大多早于本轮生成式AI浪潮,对新近AI技术的发展缺乏全面覆盖。

另一方面,许多大模型“Know How”只能从一线实践中获取,且需要大量算力的投入,但像DeepSeek这样愿意分享此类知识的AI企业,依旧是少数。

令人庆幸的是,已经有一批一线AI研究者在从事大模型基础知识和应用经验的普及工作。

在国内,中国人民大学的科研团队于2023年3月底发布A Survey of Large Language Models论文,全面综述了大模型界的最新研究成果,此后,这篇综述持续更新,截至2025年3月,已有整整16个版本,最新一版文章达144页,引用了1000余篇论文。


去年年底,由上述文章整理而来的《大语言模型》一书,在历经数月的编辑之后,由高等教育出版社正式出版。与英文综述文章的定位不同,修订后的中文版更关注为大模型学习者供整体的技术讲解,对内容上进行了大范围的更新与重组,力图展现一个系统的大模型技术框架和路线图。

《大语言模型》一书由中国人民大学高瓴人工智能学院赵鑫教授和文继荣教授领衔主编,博士生李军毅、周昆和硕士唐天一参与编著,作者团队在大模型领域有着丰富的研究与开发经验,曾主导研发了文澜、玉兰等大模型。

编者团队认为,大模型研发的众多训练细节无法从已有的科学文献中直接获取,通常需要开展实验进行摸索。但实际上,很多研究人员并没有充足的算力资源去完成一次完整的大规模预训练实验,无法获取一手经验,极大限制了学术界在此次AI技术发展中所起到的作用。

然而,学术界在AI研究中的独特价值依然不可替代,且需要在多个领域持续发声并贡献力量。学术界更为长远和多元的研究视角,可以在大模型的基础理论研究中发挥重要作用,或是深入探索如AI安全、AI治理这样短期内难以变现,但对人类未来至关重要的议题。

本书前言中有这么一句话:“人类社会的技术发展从不会因为某个公司或某个国家的技术封锁而停滞不前。”《大语言模型》一书的出版,恰好为学术界提供了获取一线大模型知识和实践经验的渠道。这本书全面覆盖了大语言模型训练与使用的全流程,从预训练到微调与对齐,从使用技术到评测应用,帮助读者全面掌握大语言模型的核心技术。

在核心算法技术的基础之上,编者团队还提供了大量的代码实战与讲解,同时搭配相关的开发工具包LLMBox与YuLan大模型,供读者深入阅读理解相关技术。

书中大量的可视化内容可帮助读者更好地理解相关概念,下方这张图表就呈现了基于LLaMA模型的各类衍生工作,通过继续预训练、指令微调等方法,LLaMA可以适配到不同的语言、多样的领域。

发布之际,《大语言模型》一书也得到了多位知名AI学者的推荐。北京智源人工智能研究院学术顾问委员会主任、美国国家工程院外籍院士张宏江称:“本书内容深入结合了编者在研发大模型过程中的第一手经验,……,可以作为深入学习大模型技术的参考书籍。”北京大学讲席教授、中国科学院院士鄂维南、清华大学智能科学讲席教授、中国工程院外籍院士张亚勤也为本书撰写了推荐语。

在AI技术飞速发展的当下,《大语言模型》的出版恰逢其时,相信无论是普通读者还是专业读者,都能从此书中获得关于AI前沿技术的最新见解。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
西湖大学打了谁的脸?外籍学生学费35万一年,国内学生仅6千元

西湖大学打了谁的脸?外籍学生学费35万一年,国内学生仅6千元

妍妍教育日记
2026-02-24 18:35:18
“DeepSeek打破惯例,不让英伟达先用了”

“DeepSeek打破惯例,不让英伟达先用了”

观察者网
2026-02-26 09:44:08
好消息:2026年起70岁以上老人可享优待,农民也不例外

好消息:2026年起70岁以上老人可享优待,农民也不例外

风雨与阳光
2026-02-25 22:03:05
希望我国出手相助?计划在中国建厂,还承诺将整条生产线搬来我国

希望我国出手相助?计划在中国建厂,还承诺将整条生产线搬来我国

古事寻踪记
2026-01-18 07:06:23
白天作陪晚上同宿?明码标价8000一回!高端伴游沦为色情交易窝点

白天作陪晚上同宿?明码标价8000一回!高端伴游沦为色情交易窝点

网络易不易
2026-01-20 10:17:46
特朗普苦等4天,被中方“泼了冷水”,来不了北京?中国话里有话

特朗普苦等4天,被中方“泼了冷水”,来不了北京?中国话里有话

嫹笔牂牂
2026-02-25 14:26:29
送他走吧!湖人109-110惜败魔术,詹姆斯砍21+6+4,东契奇22+9+15

送他走吧!湖人109-110惜败魔术,詹姆斯砍21+6+4,东契奇22+9+15

星Xin辰大海
2026-02-25 15:10:22
特朗普突放大招,稀有金属要变天?

特朗普突放大招,稀有金属要变天?

每日经济新闻
2026-02-25 15:52:23
我为什么那么厌恶高市早苗

我为什么那么厌恶高市早苗

天真无牙
2026-02-23 11:06:20
50岁重回单身!加拿大前第一夫人苏菲谈离婚后生活:当特鲁多与水果姐出双入对,她活出了另一种美...

50岁重回单身!加拿大前第一夫人苏菲谈离婚后生活:当特鲁多与水果姐出双入对,她活出了另一种美...

二胎妈妈圈
2026-02-25 21:46:23
北京庙会离谱谢幕:京味儿消亡史,一场关于"智商税"的集体记忆

北京庙会离谱谢幕:京味儿消亡史,一场关于"智商税"的集体记忆

据说说娱乐
2026-02-25 15:41:39
从左权之妻到改嫁左权秘书,再到山西夺权,刘志兰究竟经历了什么

从左权之妻到改嫁左权秘书,再到山西夺权,刘志兰究竟经历了什么

旧书卷里的长安
2026-02-22 00:08:58
上海这晚,57岁周涛秒了30岁李雪琴,不愧是央视严选的国泰民安脸

上海这晚,57岁周涛秒了30岁李雪琴,不愧是央视严选的国泰民安脸

大铁猫娱乐
2026-02-08 00:10:03
美军不想打仗,跑到航母最底层甲板的厕所,往马桶里丢垃圾

美军不想打仗,跑到航母最底层甲板的厕所,往马桶里丢垃圾

安安说
2026-02-26 10:29:39
特朗普突然发文昭告全球,包括中国俄罗斯在内,这次一个都跑不掉

特朗普突然发文昭告全球,包括中国俄罗斯在内,这次一个都跑不掉

华史谈
2026-02-26 09:04:22
除夕前一天,李书福的好搭档病逝,享年61岁

除夕前一天,李书福的好搭档病逝,享年61岁

龚进辉
2026-02-25 15:07:57
“体坛败类”马俊仁,强迫队员集体切阑尾,亲自为女队员打禁药

“体坛败类”马俊仁,强迫队员集体切阑尾,亲自为女队员打禁药

米果说识
2026-02-22 11:29:00
小学阶段的大实话:小学差的,那是真的差,基本没有逆袭的可能

小学阶段的大实话:小学差的,那是真的差,基本没有逆袭的可能

好爸育儿
2026-02-25 19:22:49
四川26岁男子离世:初三去奶奶坟前,遗体距家不远,手机留着遗言

四川26岁男子离世:初三去奶奶坟前,遗体距家不远,手机留着遗言

墨印斋
2026-02-26 04:11:04
库尔图瓦:16强大概率会抽到曼城,但还是希望这次能换个对手

库尔图瓦:16强大概率会抽到曼城,但还是希望这次能换个对手

懂球帝
2026-02-26 07:48:09
2026-02-26 11:32:49
智东西 incentive-icons
智东西
聚焦智能变革,服务产业升级。
11255文章数 116980关注度
往期回顾 全部

科技要闻

单季营收681亿净利429亿!英伟达再次炸裂

头条要闻

"花坛白骨案"2名凶手因4万元杀人埋尸 受害人儿子发声

头条要闻

"花坛白骨案"2名凶手因4万元杀人埋尸 受害人儿子发声

体育要闻

从排球少女到冰壶女神,她在米兰冬奥练出6块腹肌

娱乐要闻

尼格买提撒贝宁滑雪被偶遇 17年老友情

财经要闻

短剧市场风云突变!有人投百万赔得精光

汽车要闻

雷克萨斯ES双色特别版上市 售30.79万元起

态度原创

手机
艺术
亲子
公开课
军事航空

手机要闻

想买抓紧!2026年中国手机市场迎全面普涨:3月后新机至少涨千元 老款机也提价

艺术要闻

谁能认出这幅14字草书的真正作者?

亲子要闻

筱梅沉浸当母亲喜悦!分享小宝睁眼吃奶照!箖箖看弟弟一举动被赞

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

美政府给新伊核协议设限内容遭披露

无障碍浏览 进入关怀版