![]()
介绍
《从零构建大模型》是一本基于PyTorch框架的实战指南,摒弃了对现成库的依赖,引导读者从零开始亲手构建功能强大的大语言模型。本书由畅销书作家塞巴斯蒂安·拉施卡撰写,从基础知识讲起,由内而外地剖析大模型核心原理,并通过清晰的文字、图表和实例,系统讲解模型各组成部分的规划与实现、数据集的准备、通用语料预训练及任务定制微调的全过程。
书中不仅详细阐述了如何利用人工反馈确保模型遵循指令、加载预训练权重等关键技术,还特别设置了DeepSeek彩蛋章节,深入解析推理模型的构建与优化策略。通过理论与实践的结合,本书旨在帮助读者在掌握LLM理论知识的同时,获得从零打造大模型的完整实战能力。
目录
第1章:理解大型语言模型
第2章:处理文本数据
第3章:编码注意力机制
第4章:从零开始实现 GPT 模型
第5章:在无标注数据上进行预训练
第6章:进行文本分类的微调
第7章:进行遵循指令的微调
扫码回复“大模型神书”
如果你想写大模型论文,但却没有合适的idea,我收集整理了来自QS前50名校大佬的大模型研究思路!这些idea都是从顶会论文中提炼出来的精华,冲刺CVPR/NIPS也不在话下!
![]()
领取福利
科研资料大放送:
1.《申博咨询规划一次》
2.《1000+热门idea合集》
3.《往期大牛热点分析直播课》
4.《全方向顶会顶刊论文合集》
![]()
![]()
![]()
扫码免费领取科研大礼包
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.