网易首页 > 网易号 > 正文 申请入驻

大模型入门超全指南来了!人大团队力作,内附一线开发经验

0
分享至


智东西
作者 陈骏达
编辑 漠影

2025年,DeepSeek-R1的发布在国内AI领域掀起了一场前所未有的开源风暴。作为一款性能卓越的开源大模型,它不仅开放了模型的获取权限,还主动分享算法细节以及优化策略,激发了整个行业的开放共享热潮。

与此同时,科研论文、技术博客和开源社区的讨论如雨后春笋般涌现,这种开放透明的氛围极大地推动了AI科研知识的共享与传播,吸引了更多研究者和开发者参与到大模型的创新与应用中。

不过,对于刚刚入门大模型的初学者而言,这些论文、研究中涉及的诸多高阶概念或许意味着较高的认知挑战。

一方面,国内外主流AI教科书的成书或更新时间,大多早于本轮生成式AI浪潮,对新近AI技术的发展缺乏全面覆盖。

另一方面,许多大模型“Know How”只能从一线实践中获取,且需要大量算力的投入,但像DeepSeek这样愿意分享此类知识的AI企业,依旧是少数。

令人庆幸的是,已经有一批一线AI研究者在从事大模型基础知识和应用经验的普及工作。

在国内,中国人民大学的科研团队于2023年3月底发布A Survey of Large Language Models论文,全面综述了大模型界的最新研究成果,此后,这篇综述持续更新,截至2025年3月,已有整整16个版本,最新一版文章达144页,引用了1000余篇论文。


去年年底,由上述文章整理而来的《大语言模型》一书,在历经数月的编辑之后,由高等教育出版社正式出版。与英文综述文章的定位不同,修订后的中文版更关注为大模型学习者供整体的技术讲解,对内容上进行了大范围的更新与重组,力图展现一个系统的大模型技术框架和路线图。

《大语言模型》一书由中国人民大学高瓴人工智能学院赵鑫教授和文继荣教授领衔主编,博士生李军毅、周昆和硕士唐天一参与编著,作者团队在大模型领域有着丰富的研究与开发经验,曾主导研发了文澜、玉兰等大模型。

编者团队认为,大模型研发的众多训练细节无法从已有的科学文献中直接获取,通常需要开展实验进行摸索。但实际上,很多研究人员并没有充足的算力资源去完成一次完整的大规模预训练实验,无法获取一手经验,极大限制了学术界在此次AI技术发展中所起到的作用。

然而,学术界在AI研究中的独特价值依然不可替代,且需要在多个领域持续发声并贡献力量。学术界更为长远和多元的研究视角,可以在大模型的基础理论研究中发挥重要作用,或是深入探索如AI安全、AI治理这样短期内难以变现,但对人类未来至关重要的议题。

本书前言中有这么一句话:“人类社会的技术发展从不会因为某个公司或某个国家的技术封锁而停滞不前。”《大语言模型》一书的出版,恰好为学术界提供了获取一线大模型知识和实践经验的渠道。这本书全面覆盖了大语言模型训练与使用的全流程,从预训练到微调与对齐,从使用技术到评测应用,帮助读者全面掌握大语言模型的核心技术。

在核心算法技术的基础之上,编者团队还提供了大量的代码实战与讲解,同时搭配相关的开发工具包LLMBox与YuLan大模型,供读者深入阅读理解相关技术。

书中大量的可视化内容可帮助读者更好地理解相关概念,下方这张图表就呈现了基于LLaMA模型的各类衍生工作,通过继续预训练、指令微调等方法,LLaMA可以适配到不同的语言、多样的领域。

发布之际,《大语言模型》一书也得到了多位知名AI学者的推荐。北京智源人工智能研究院学术顾问委员会主任、美国国家工程院外籍院士张宏江称:“本书内容深入结合了编者在研发大模型过程中的第一手经验,……,可以作为深入学习大模型技术的参考书籍。”北京大学讲席教授、中国科学院院士鄂维南、清华大学智能科学讲席教授、中国工程院外籍院士张亚勤也为本书撰写了推荐语。

在AI技术飞速发展的当下,《大语言模型》的出版恰逢其时,相信无论是普通读者还是专业读者,都能从此书中获得关于AI前沿技术的最新见解。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
中方罕见公开西太对峙细节!日舰模拟攻击辽宁舰,结果彻底沉默?

中方罕见公开西太对峙细节!日舰模拟攻击辽宁舰,结果彻底沉默?

时光流转追梦人
2026-06-30 16:17:21
4日凌晨大满贯:女单8强诞生,陈幸同强势横扫,莎莎下轮对手确定

4日凌晨大满贯:女单8强诞生,陈幸同强势横扫,莎莎下轮对手确定

行舟问茶
2026-07-04 06:03:42
密春雷9亿债务危机4年了,董卿没离婚没落魄,却悄悄布局一盘大棋

密春雷9亿债务危机4年了,董卿没离婚没落魄,却悄悄布局一盘大棋

娱小余
2026-06-27 22:42:52
去省厅报到遇前妻,她羞辱我不懂规矩,我坐上厅长位:你再说一遍

去省厅报到遇前妻,她羞辱我不懂规矩,我坐上厅长位:你再说一遍

千秋文化
2026-07-02 19:53:21
0-3温网大冷门,世界第9遭世界第74掀翻,梅德韦杰夫止步32强

0-3温网大冷门,世界第9遭世界第74掀翻,梅德韦杰夫止步32强

俯身冲顶
2026-07-04 00:08:08
我国和不丹为何争议区越来越少了?看看这些抵边村就知道了

我国和不丹为何争议区越来越少了?看看这些抵边村就知道了

老谢谈史
2026-05-10 02:51:04
世界杯:阿根廷3-2佛得角进16强!梅西破门+罗梅罗造乌龙绝杀

世界杯:阿根廷3-2佛得角进16强!梅西破门+罗梅罗造乌龙绝杀

乒烧泳球
2026-07-04 08:54:17
鲍鹏山:如果中国真的足够强大!我们没必要脆弱到那么害怕批评!

鲍鹏山:如果中国真的足够强大!我们没必要脆弱到那么害怕批评!

用冷眼洞悉世界
2026-06-24 00:44:14
唐嫣案判了!罗晋近况曝光,难堪一幕发生,原来他和辛柏青同病相怜

唐嫣案判了!罗晋近况曝光,难堪一幕发生,原来他和辛柏青同病相怜

情感大头说说
2026-07-03 16:56:13
曼联追楚阿梅尼恐成泡影,皇马官宣不签恩佐!需避免重蹈德容覆辙

曼联追楚阿梅尼恐成泡影,皇马官宣不签恩佐!需避免重蹈德容覆辙

罗米的曼联博客
2026-07-04 07:11:14
A股正在憋着一场阴谋

A股正在憋着一场阴谋

睿知睿见
2026-07-04 07:36:07
不甩亲妹争议!钟丽缇长女晒比基尼辣照 「岸边脱泳裤」曲线傲人

不甩亲妹争议!钟丽缇长女晒比基尼辣照 「岸边脱泳裤」曲线傲人

ETtoday星光云
2026-07-03 14:02:04
因男友嫌弃猫腿太短,妹子不想要了,网友开开心心来收猫,结果骂骂咧咧的走了!

因男友嫌弃猫腿太短,妹子不想要了,网友开开心心来收猫,结果骂骂咧咧的走了!

拜见喵主子
2026-07-03 11:46:52
伊朗给全球上了一课:要想赢得特朗普的尊敬,必须要打疼他

伊朗给全球上了一课:要想赢得特朗普的尊敬,必须要打疼他

福建睿平
2026-07-04 06:58:41
老公去世时我查出怀孕,公婆劝我打掉,7年后孩子进门他们红了眼

老公去世时我查出怀孕,公婆劝我打掉,7年后孩子进门他们红了眼

千秋文化
2026-07-02 19:38:21
曼晚:B费在本届世界杯表现挣扎,战术适配存在问题

曼晚:B费在本届世界杯表现挣扎,战术适配存在问题

懂球帝
2026-07-03 19:43:10
举报整整10个月无人问津,蒋方舟论文造假为什么今天才炸

举报整整10个月无人问津,蒋方舟论文造假为什么今天才炸

林子说事
2026-07-04 00:29:51
韩红基金会回应质疑,避谈明细评论区沦陷,曾说一包泡面都能公示

韩红基金会回应质疑,避谈明细评论区沦陷,曾说一包泡面都能公示

萌神木木
2026-07-02 21:13:20
贝隆:如今科技发展,球员都能踢到很大岁数,但梅西还是令人惊叹

贝隆:如今科技发展,球员都能踢到很大岁数,但梅西还是令人惊叹

兰亭墨未干
2026-07-03 15:14:11
韩红再次回应传闻:善款理财,利益输送,高价工资,网友不买账!

韩红再次回应传闻:善款理财,利益输送,高价工资,网友不买账!

眼光很亮
2026-07-03 08:05:06
2026-07-04 09:08:49
智东西 incentive-icons
智东西
智东西,AI产业新媒体,专注报道人工智能的前沿技术发展,和技术应用带来的千行百业产业变革。
12175文章数 117119关注度
往期回顾 全部

科技要闻

万亿富豪马斯克 舍不得特斯拉员工敞开用AI

头条要闻

牛弹琴:很罕见 普京突然穿上了军装

头条要闻

牛弹琴:很罕见 普京突然穿上了军装

体育要闻

C罗穿已故队友若塔球衣谢场 眼中含泪

娱乐要闻

海来阿木孕期出轨指控掀起全网热议

财经要闻

千亿茶市场无赢家:澜沧巨亏 八马停"蹄"

汽车要闻

方程豹钛9内饰曝光 用上了长联屏设计/下半年上市

态度原创

数码
家居
房产
亲子
健康

数码要闻

消息称Apple Watch Series 12表带内嵌传感器,支持血糖监测等

家居要闻

传奇筑 日常诗

房产要闻

总裁空缺17个月、现金缺口超1000亿:金融局“局外人”入局万科

亲子要闻

一妇婴领衔全国81家医院共筑“好孕联盟”,破解复发性流产跨区域转诊难题

听说少吃点能抗衰老?专家讲解!

无障碍浏览 进入关怀版