网易首页 > 网易号 > 正文 申请入驻

大模型入门超全指南来了!人大团队力作,内附一线开发经验

0
分享至


智东西
作者 陈骏达
编辑 漠影

2025年,DeepSeek-R1的发布在国内AI领域掀起了一场前所未有的开源风暴。作为一款性能卓越的开源大模型,它不仅开放了模型的获取权限,还主动分享算法细节以及优化策略,激发了整个行业的开放共享热潮。

与此同时,科研论文、技术博客和开源社区的讨论如雨后春笋般涌现,这种开放透明的氛围极大地推动了AI科研知识的共享与传播,吸引了更多研究者和开发者参与到大模型的创新与应用中。

不过,对于刚刚入门大模型的初学者而言,这些论文、研究中涉及的诸多高阶概念或许意味着较高的认知挑战。

一方面,国内外主流AI教科书的成书或更新时间,大多早于本轮生成式AI浪潮,对新近AI技术的发展缺乏全面覆盖。

另一方面,许多大模型“Know How”只能从一线实践中获取,且需要大量算力的投入,但像DeepSeek这样愿意分享此类知识的AI企业,依旧是少数。

令人庆幸的是,已经有一批一线AI研究者在从事大模型基础知识和应用经验的普及工作。

在国内,中国人民大学的科研团队于2023年3月底发布A Survey of Large Language Models论文,全面综述了大模型界的最新研究成果,此后,这篇综述持续更新,截至2025年3月,已有整整16个版本,最新一版文章达144页,引用了1000余篇论文。


去年年底,由上述文章整理而来的《大语言模型》一书,在历经数月的编辑之后,由高等教育出版社正式出版。与英文综述文章的定位不同,修订后的中文版更关注为大模型学习者供整体的技术讲解,对内容上进行了大范围的更新与重组,力图展现一个系统的大模型技术框架和路线图。

《大语言模型》一书由中国人民大学高瓴人工智能学院赵鑫教授和文继荣教授领衔主编,博士生李军毅、周昆和硕士唐天一参与编著,作者团队在大模型领域有着丰富的研究与开发经验,曾主导研发了文澜、玉兰等大模型。

编者团队认为,大模型研发的众多训练细节无法从已有的科学文献中直接获取,通常需要开展实验进行摸索。但实际上,很多研究人员并没有充足的算力资源去完成一次完整的大规模预训练实验,无法获取一手经验,极大限制了学术界在此次AI技术发展中所起到的作用。

然而,学术界在AI研究中的独特价值依然不可替代,且需要在多个领域持续发声并贡献力量。学术界更为长远和多元的研究视角,可以在大模型的基础理论研究中发挥重要作用,或是深入探索如AI安全、AI治理这样短期内难以变现,但对人类未来至关重要的议题。

本书前言中有这么一句话:“人类社会的技术发展从不会因为某个公司或某个国家的技术封锁而停滞不前。”《大语言模型》一书的出版,恰好为学术界提供了获取一线大模型知识和实践经验的渠道。这本书全面覆盖了大语言模型训练与使用的全流程,从预训练到微调与对齐,从使用技术到评测应用,帮助读者全面掌握大语言模型的核心技术。

在核心算法技术的基础之上,编者团队还提供了大量的代码实战与讲解,同时搭配相关的开发工具包LLMBox与YuLan大模型,供读者深入阅读理解相关技术。

书中大量的可视化内容可帮助读者更好地理解相关概念,下方这张图表就呈现了基于LLaMA模型的各类衍生工作,通过继续预训练、指令微调等方法,LLaMA可以适配到不同的语言、多样的领域。

发布之际,《大语言模型》一书也得到了多位知名AI学者的推荐。北京智源人工智能研究院学术顾问委员会主任、美国国家工程院外籍院士张宏江称:“本书内容深入结合了编者在研发大模型过程中的第一手经验,……,可以作为深入学习大模型技术的参考书籍。”北京大学讲席教授、中国科学院院士鄂维南、清华大学智能科学讲席教授、中国工程院外籍院士张亚勤也为本书撰写了推荐语。

在AI技术飞速发展的当下,《大语言模型》的出版恰逢其时,相信无论是普通读者还是专业读者,都能从此书中获得关于AI前沿技术的最新见解。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
棋子永远成不了下棋者,中国的存在,是黄种人文明脊梁不卑微根本

棋子永远成不了下棋者,中国的存在,是黄种人文明脊梁不卑微根本

书纪文谭
2025-12-18 15:20:21
女护士处理男患者隐私部位,会感觉难为情吗?美女护士说出大实话

女护士处理男患者隐私部位,会感觉难为情吗?美女护士说出大实话

第7情感
2025-09-17 12:12:15
官方公告:吴侯仲长期失联、无法履职,被解聘

官方公告:吴侯仲长期失联、无法履职,被解聘

新京报政事儿
2026-01-08 00:16:30
流落柬埔寨女网红毒品检测呈阳性,视频主页称“靠自己没用的”,家人赴柬,大使馆提醒

流落柬埔寨女网红毒品检测呈阳性,视频主页称“靠自己没用的”,家人赴柬,大使馆提醒

潇湘晨报
2026-01-06 17:20:18
调整!1月8日央视直播WTT冠军赛有变,王曼昱首秀,向鹏大战张本

调整!1月8日央视直播WTT冠军赛有变,王曼昱首秀,向鹏大战张本

皮皮观天下
2026-01-08 05:39:19
周小平发表逆天神论:世界没有阿拉伯数字,是西方“剽窃”中国

周小平发表逆天神论:世界没有阿拉伯数字,是西方“剽窃”中国

知鉴明史
2025-12-30 18:33:55
分手8年,胖到认不出的coco自曝私密事,89岁谢贤还要为风流买单

分手8年,胖到认不出的coco自曝私密事,89岁谢贤还要为风流买单

好贤观史记
2026-01-06 15:20:16
300986,连续4个“20cm”涨停!氢能产业拐点将至,机构密集关注这些高增长股

300986,连续4个“20cm”涨停!氢能产业拐点将至,机构密集关注这些高增长股

数据宝
2026-01-08 12:20:23
公安分局公示的三个监督电话打不通?官方回应:未及时更新,已要求整改

公安分局公示的三个监督电话打不通?官方回应:未及时更新,已要求整改

大风新闻
2026-01-07 15:31:10
中方发布2号公告,断高市光刻胶后路,日媒:当众问中国一个问题

中方发布2号公告,断高市光刻胶后路,日媒:当众问中国一个问题

知法而形
2026-01-07 16:52:08
美军全世界第一,为什么美国没有出现军政府?

美军全世界第一,为什么美国没有出现军政府?

忠于法纪
2026-01-07 17:56:34
上海银行行长选妃:腿要长,腰要细,皮肤要白,各个对其死心塌地

上海银行行长选妃:腿要长,腰要细,皮肤要白,各个对其死心塌地

凯裕说故事
2025-01-10 10:48:42
细思恐极!老板曝司晓迪事件来龙去脉,她曾暗示鹿晗关晓彤有娃!

细思恐极!老板曝司晓迪事件来龙去脉,她曾暗示鹿晗关晓彤有娃!

古希腊掌管月桂的神
2026-01-08 10:51:38
一人中542万大奖,目前尚未联系,兑奖期限不足12小时!

一人中542万大奖,目前尚未联系,兑奖期限不足12小时!

浙江之声
2026-01-07 17:47:56
印尼求中国重组雅万高铁债务:运营两年盈利难 暴高铁商业化痛点

印尼求中国重组雅万高铁债务:运营两年盈利难 暴高铁商业化痛点

社会日日鲜
2026-01-07 12:07:02
中国已买不到委内瑞拉油,而美国却依然顺利拿到

中国已买不到委内瑞拉油,而美国却依然顺利拿到

桂系007
2026-01-07 03:09:51
委内瑞拉军方集体叛变,古巴人血战至死,世界变了但古巴依然站着

委内瑞拉军方集体叛变,古巴人血战至死,世界变了但古巴依然站着

晚雾空青
2026-01-07 15:44:03
艾滋病新增130万!很多人中招很冤枉!在外“5不碰”一定要记死

艾滋病新增130万!很多人中招很冤枉!在外“5不碰”一定要记死

今朝牛马
2025-12-31 19:31:04
这两个人可谓是金童玉女,如此般配的两个人,实在是太少见了

这两个人可谓是金童玉女,如此般配的两个人,实在是太少见了

TVB的四小花
2026-01-07 10:26:19
3厘米厚的保命门竟敞开!马杜罗最绝望的瞬间,不是美军兵临城下

3厘米厚的保命门竟敞开!马杜罗最绝望的瞬间,不是美军兵临城下

达文西看世界
2026-01-07 16:49:37
2026-01-08 13:00:49
智东西 incentive-icons
智东西
聚焦智能变革,服务产业升级。
11029文章数 116937关注度
往期回顾 全部

科技要闻

雷军:现在听到营销这两个字都有点恶心

头条要闻

委内瑞拉外长:感谢中方支持

头条要闻

委内瑞拉外长:感谢中方支持

体育要闻

约基奇倒下后,一位故人邪魅一笑

娱乐要闻

2026春节档将有六部电影强势上映

财经要闻

微软CTO韦青:未来人类会花钱"戒手机"

汽车要闻

不谈颠覆与奇迹,智驾企业还能聊点什么?

态度原创

教育
本地
游戏
房产
公开课

教育要闻

孩子的科技教育怎么跟上时代?

本地新闻

“闽东利剑·惠民安商”高效执行专项行动

《星际裂变》EA评测:老工厂游戏迷哈气了

房产要闻

三亚新房,又全国第一了!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版