网易首页 > 网易号 > 正文 申请入驻

大模型综述出书了

0
分享至

在2023年3月,我们发表了大语言模型综述文章《A Survey of Large Language Models》。这篇综述文章已经更新到第13个版本,包含了83页的正文内容,并收录了900余篇参考文献。该综述文章旨在系统地梳理大语言模型的研究进展与核心技术,讨论了大量的相关工作。自大语言模型综述的预印本上线以来,受到了不少读者的关注。

自英文综述文章上线后,陆续有读者询问是否有对应的中文版本。为此,我们于2023年8月发布了该综述的中文翻译版。为了更好地提供大模型技术的中文参考资料,我们于2023年12月底继续启动了中文书的编写工作,并且于近日完成初稿。与英文综述文章的定位不同,中文版书籍更注重为大模型技术的入门读者提供讲解,为此我们在内容上进行了大幅度的更新与重组,力图展现一个整体的大模型技术框架和路线图。本书适用于具有深度学习基础的高年级本科生以及低年级研究生使用,可以作为一本入门级的参考资料。

中文书项目链接: https://llmbook-zh.github.io/

中文书下载链接1:

https://github.com/LLMBook-zh/LLMBook-zh.github.io/blob/main/LLMBook.pdf

中文书下载链接2:

http://aibox.ruc.edu.cn/zws/index.htm

全书章节组织:

一、背景与基础知识

第一章引言(大模型发展历程、重要技术概览)

第二章基础介绍(Scaling Law、GPT系列模型发展历程)

第三章大模型资源(开源模型、数据、代码库)

二、预训练

第四章数据准备(数据收集、清洗、配比、课程方法)

第五章模型架构(Transformer 结构、大模型主流架构、细节改进)

第六章模型预训练(预训练任务、优化参数设置、并行训练方法)

三、微调与对齐

第七章指令微调(指令数据收集与合成方法、指令微调策略与作用)

第八章人类对齐(3H标准、RLHF算法、非RL算法)

四、大模型使用

第九章解码与部署(解码生成算法、解码加速算法、模型压缩算法)

第十章提示学习(基础提示方法、上下文学习、思维链)

第十一章规划与智能体(复杂规划方法、智能体搭建方法)

五、评测与应用

第十二章评测(评测指标与方法、基础与高级能力评测、评测体系)

第十三章应用(概览研究领域与专业领域的应用)

大语言模型发展时间线

LLaMA 系列模型的衍生工作进化图

在本书撰写过程中,我们收到了来自许多同行的大量修改意见,在此一并表示感谢,希望大家一如既往支持与关注我们的大模型中文书,您的支持与反馈将是我们前行最大的动力。本书的初版仅是一个起点,我们计划在网上持续进行内容的更新和完善,并特别欢迎读者提出宝贵的批评与建议,也会同步在网站上对于提出宝贵建议的读者进行致谢。如果您有任何意见、评论以及建议,请通过GitHub的Issue页面(https://github.com/LLMBook-zh/LLMBook-zh.github.io/issues)或邮箱进行反馈。

为了更好地整理和传播大模型技术的最新进展与技术体系,我们为读者提供了以下配套资源,供读者在阅读本书时进行参考和使用。

大模型代码工具库:我们开发了一个全面的代码工具库LLMBox,专门用于开发和实现大语言模型,其基于统一化的训练流程和全面的模型评估框架。LLMBox旨在成为训练和利用大语言模型的一站式解决方案,其内部集成了大量实用的功能,实现了训练和利用阶段高度的灵活性和效率。工具库链接:https://github.com/RUCAIBox/LLMBox。

YuLan大模型:YuLan系列模型是中国人民大学高瓴人工智能学院师生共同开发的支持聊天的大语言模型(名字“玉兰”取自中国人民大学校花)。最新版本从头完成了整个预训练过程,并采用课程学习技术基于中英文双语数据进行有监督微调,包括高质量指令和人类偏好数据。模型链接:https://github.com/RUC-GSAI/YuLan-Chat。

本书各章节的主要负责人和参与人名单如下:

  • 第三章的负责人是闵映乾和杨晨,参与人有李军毅、周昆;

  • 第四章的负责人是张君杰、侯宇蓬和周昆;

  • 第五章的负责人是董梓灿,参与人有田震和唐天一;

  • 第六章的负责人是唐天一和陈昱硕;

  • 第七章的负责人是唐天一,参与人有成晓雪;

  • 第八章的负责人是李军毅和陈志朋;

  • 第九章的负责人是陈昱硕、刘沛羽和唐天一,参与人有周昆;

  • 第十章的负责人是李军毅、汤昕宇和都一凡;

  • 第十一章的负责人是任瑞阳和蒋锦昊,参与人有李军毅;

  • 第十二章的负责人是张北辰和周昆,参与人有张高玮;

  • 第十三章的负责人是周昆,参与人(按拼音字母排序)有蒋锦昊、李依凡、刘子康、孙文奇、王禹淏、徐澜玲、杨锦霞和郑博文。

同时感谢其他所有参与本书编写、校对的同学和老师们。 点击“ 阅读更多 ”即可下载中文书!

更多内容,点击下方关注:

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
9岁抗癌女孩去世前整夜呼喊妈妈,临终前说“我想去世了”令人心碎

9岁抗癌女孩去世前整夜呼喊妈妈,临终前说“我想去世了”令人心碎

观威海
2026-02-11 21:18:25
米兰冬奥|中国速滑名将廉子文被取消成绩,虽尊重判罚但仍感意外

米兰冬奥|中国速滑名将廉子文被取消成绩,虽尊重判罚但仍感意外

文汇报
2026-02-12 07:39:26
决定了:过年攻略全都不过脑子,让AI去想

决定了:过年攻略全都不过脑子,让AI去想

机器之心Pro
2026-02-11 16:37:00
比亚迪年底现离职潮,员工爆要接三四人活扛不住

比亚迪年底现离职潮,员工爆要接三四人活扛不住

新浪财经
2026-02-11 14:56:47
掘金双杀灰熊超火箭升西部第三 约基奇26+15+11+9失误连4场三双

掘金双杀灰熊超火箭升西部第三 约基奇26+15+11+9失误连4场三双

醉卧浮生
2026-02-12 12:33:49
拍摄妻子分娩抢救全过程,裸露画面引众怒,千万粉丝网红凉了?

拍摄妻子分娩抢救全过程,裸露画面引众怒,千万粉丝网红凉了?

千浔观点
2026-02-12 00:38:54
中芯国际这次真够抢风头的

中芯国际这次真够抢风头的

蔚然先声
2026-02-12 08:33:06
美籍华裔冬奥花滑冠军刘美贤,曝系代孕儿,曾登上“吉米秀”,真实又可爱

美籍华裔冬奥花滑冠军刘美贤,曝系代孕儿,曾登上“吉米秀”,真实又可爱

爆角追踪
2026-02-12 10:30:32
消失240天复出宣布退役!你的K级大神!

消失240天复出宣布退役!你的K级大神!

贵圈真乱
2026-02-12 10:44:24
感谢日本籍主帅!史上最强U17国足故意放水 仍3-2双杀 剑指世界杯

感谢日本籍主帅!史上最强U17国足故意放水 仍3-2双杀 剑指世界杯

侃球熊弟
2026-02-12 00:35:09
《阿凡达 3:火与烬》即将结束全球院线放映,最终票房约为14亿美元,较前两作出现显著下滑,或难越回本红线

《阿凡达 3:火与烬》即将结束全球院线放映,最终票房约为14亿美元,较前两作出现显著下滑,或难越回本红线

台州交通广播
2026-02-12 01:27:55
女子故意扮丑去相亲,男子一眼看中,女子吃惊:他是不是太饿了

女子故意扮丑去相亲,男子一眼看中,女子吃惊:他是不是太饿了

丫头舫
2026-02-10 22:18:05
立陶宛总理:考虑将“台湾代表处”更名为“台北代表处”

立陶宛总理:考虑将“台湾代表处”更名为“台北代表处”

扬子晚报
2026-02-12 11:04:17
狂飙20℃再大跌!雨雨雨!江苏天气最新预测

狂飙20℃再大跌!雨雨雨!江苏天气最新预测

最江阴
2026-02-12 00:17:58
筱梅提前报喜:小宝贝迫不及待,奔赴新年与温暖

筱梅提前报喜:小宝贝迫不及待,奔赴新年与温暖

观察鉴娱
2026-02-12 11:53:34
春节假期我国无大范围雨雪冰冻,十大热门出游地天气指南来了

春节假期我国无大范围雨雪冰冻,十大热门出游地天气指南来了

澎湃新闻
2026-02-12 11:58:03
女子二胎哺乳期丈夫出轨与他人生子,公婆竟常去照料婚外幼童!离婚后房子归女方,但公婆拒不搬离,法官出手3小时“夺”回一个家

女子二胎哺乳期丈夫出轨与他人生子,公婆竟常去照料婚外幼童!离婚后房子归女方,但公婆拒不搬离,法官出手3小时“夺”回一个家

扬子晚报
2026-02-12 12:20:59
春节理发猛涨价,顾客直接用脚投票:正在把自己干倒闭?

春节理发猛涨价,顾客直接用脚投票:正在把自己干倒闭?

复转这些年
2026-02-12 08:11:21
联想moto X70 Air Pro 以百倍长焦与云台防抖亮相新加坡航展

联想moto X70 Air Pro 以百倍长焦与云台防抖亮相新加坡航展

科技视讯
2026-02-11 21:04:14
智谱GLM-5被质疑蒸馏美国大模型,自我介绍自称“Claude”,网友:真不要脸

智谱GLM-5被质疑蒸馏美国大模型,自我介绍自称“Claude”,网友:真不要脸

知识圈
2026-02-12 10:09:38
2026-02-12 13:52:49
AI科技评论 incentive-icons
AI科技评论
点评学术,服务AI
7079文章数 20728关注度
往期回顾 全部

教育要闻

巧用线段图,倒推法解题!

头条要闻

女子哺乳期丈夫出轨与他人生子 公婆竟去照料婚外幼童

头条要闻

女子哺乳期丈夫出轨与他人生子 公婆竟去照料婚外幼童

体育要闻

31岁首次参加冬奥,10年前她是个水管工

娱乐要闻

体操运动员坠楼涉事教练被立案调查

财经要闻

中国乳业2025年回顾:行业寒潮压顶

科技要闻

xAI高层大地震!马斯克紧急重组,反手画饼

汽车要闻

宝马全球大召回 起火隐患涉及多款热门车型

态度原创

旅游
家居
数码
教育
健康

旅游要闻

一站式乐享海派中国年!东方明珠2026新春文旅地图出炉

家居要闻

本真栖居 爱暖伴流年

数码要闻

三星:HBM4获正面反馈 内存短缺将持续到明年

教育要闻

《青少年网言网语面面观》即将播出

转头就晕的耳石症,能开车上班吗?

无障碍浏览 进入关怀版