网易首页 > 网易号 > 正文 申请入驻

AI智能非天生,预训练塑造的智慧与陷阱

0
分享至



哈喽,大家好,今天就带大家揭秘大模型的“成长密码”——从只会“猜单词”的“书呆子”到懂你心意的“智能伙伴”,它到底经历了怎样的双重训练?

但很少有人知道,这些“数字大脑”并非天生智能,而是像人类成长一样,经历了“基础教育”与“社会打磨”两大阶段。

从海量数据中“学知识”,到在人类引导下“守规矩”,大模型的训练过程藏着AI能力的核心密码。





数据海洋里的“知识打底”

如果说大模型的成长是盖房子,预训练就是筑牢地基。

这一阶段的核心,是让模型在海量数据中“博闻强识”,建立对语言规律的直觉。与传统认知不同,现代大模型的预训练早已超越单纯的“预测下一个词”,而是构建多维度知识体系。

训练数据的规模和质量直接决定模型的基础能力。

据人民论坛网发布的研究显示,大模型“涌现能力”的出现,必须以足够量级的训练数据为前提,当模型参数达到千亿级、训练数据突破万亿token时,就会出现类似“开窍”的质变,比如GPT-3在未专门训练的情况下,突然具备两位数乘法能力。



一本正经地编造虚假信息。更值得关注的是,若训练数据存在偏见,模型还会复刻这些问题。



预训练后的模型就像“满腹经纶却不懂社交的书呆子”,表达生硬、逻辑跳跃,甚至无法识别敏感问题。



人类引导下的“行为校准”

预训练结束后,模型虽具备基础能力,却难以直接服务人类。

后训练阶段的核心,是通过技术手段与人类反馈,让模型“学会说人话、守规矩”,这也是大模型从“工具”到“伙伴”的关键一跃。

后训练的核心技术是RLHF(基于人类反馈的强化学习),这一技术被ChatGPT成功应用并普及。



光明网报道显示RLHF分为三个步骤:首先由人类训练师扮演用户与AI,生成高质量对话样本进行监督微调。

再由训练师对模型的多个回复打分,训练奖励模型,最后用强化学习算法让模型持续优化,贴合人类偏好。



训练师在这一阶段扮演着“AI导师”的关键角色。随着大模型产业爆发,人工智能训练师成为热门职业,招聘需求同比增长56%,薪资区间在6000-19000元,毕业生简历常被企业“秒抢”。

他们的工作远比“标注数据”复杂,在医疗领域,高年资医生需亲自标注病理切片数据,避免模型误诊。

在客服场景,训练师要输入上千条相似问句,让模型精准理解用户需求。

在伦理层面,还要通过标注敏感内容、设定拒答规则,引导模型树立正确价值观。





算力与语料的双重保障

大模型的训练之路,离不开算力与语料的硬核支撑。

算力方面大模型训练堪称“电力巨兽”。OECD与IEEE联合报告显示,GPT-4单次训练耗电达2.4亿千瓦时,相当于3000户家庭一年的用电量,而推理阶段的能耗更是训练阶段的10倍。



声明:个人原创,仅供参考

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
郑丽文民调再攀新高!新年祝福引发热议!孙中山手写对联成焦点!

郑丽文民调再攀新高!新年祝福引发热议!孙中山手写对联成焦点!

小影的娱乐
2026-01-06 07:41:41
中方措辞强硬,要求美国立刻放人,特朗普掏出底牌后,自己都虚了

中方措辞强硬,要求美国立刻放人,特朗普掏出底牌后,自己都虚了

科普100克克
2026-01-06 19:18:21
马杜罗有四个儿子,亲儿子被起诉,是下一个目标,其他三子或幸免

马杜罗有四个儿子,亲儿子被起诉,是下一个目标,其他三子或幸免

悦心知足
2026-01-04 10:04:50
演都不演了!田朴珺承认嫌王石烦,她给所有的老夫少妻都提了个醒

演都不演了!田朴珺承认嫌王石烦,她给所有的老夫少妻都提了个醒

涵豆说娱
2026-01-04 18:40:14
刚刚,夜晚14家A股上市公司发布重大利好 利空消息,看看都有哪些?

刚刚,夜晚14家A股上市公司发布重大利好 利空消息,看看都有哪些?

股市皆大事
2026-01-06 19:19:56
少妇玉米地被奸杀,强奸部位及其变态

少妇玉米地被奸杀,强奸部位及其变态

衍月
2025-12-24 10:39:53
美军突袭委内瑞拉逮捕马杜罗,中国20年前险遭同样命运

美军突袭委内瑞拉逮捕马杜罗,中国20年前险遭同样命运

遍体鳞伤为我证明
2026-01-05 13:06:43
冯提莫直播掀衣晒松垮肚皮 认「瘦了25公斤」自嘲:全是皱褶

冯提莫直播掀衣晒松垮肚皮 认「瘦了25公斤」自嘲:全是皱褶

ETtoday星光云
2026-01-06 18:02:12
不知从什么时候,性,做不得也说不得

不知从什么时候,性,做不得也说不得

没有偏旁的常庆
2026-01-05 08:15:03
我带了没人要的实习生三个月,她走那天,递给我一张名片

我带了没人要的实习生三个月,她走那天,递给我一张名片

故事那点事
2025-12-13 13:10:08
几乎全是假货!利润高达2400%,咋消费者还前赴后继争相购买?

几乎全是假货!利润高达2400%,咋消费者还前赴后继争相购买?

奇思妙想草叶君
2026-01-05 23:13:15
关税大棒下,日企为避关税全球搬家,“日本制造”还能硬气多久?

关税大棒下,日企为避关税全球搬家,“日本制造”还能硬气多久?

科普100克克
2026-01-06 19:29:02
-3至-5℃,持续冰冻!浙江短暂回温,冲击18℃!新一股冷空气,定好了!

-3至-5℃,持续冰冻!浙江短暂回温,冲击18℃!新一股冷空气,定好了!

浙江天气
2026-01-06 11:08:05
马杜罗夫妇在美首次出庭,表示不认罪!马杜罗3月17日将再次出庭!联合国:“严峻时刻”

马杜罗夫妇在美首次出庭,表示不认罪!马杜罗3月17日将再次出庭!联合国:“严峻时刻”

每日经济新闻
2026-01-06 06:35:53
赵露思不尴尬吗?宝格丽900万珠宝给她戴了,却一身廉价味显难堪

赵露思不尴尬吗?宝格丽900万珠宝给她戴了,却一身廉价味显难堪

嫹笔牂牂
2025-12-23 07:09:08
瓦良格号送到中国后有多震撼?专家刮掉表面的锈迹:钢材品质极佳

瓦良格号送到中国后有多震撼?专家刮掉表面的锈迹:钢材品质极佳

古书记史
2026-01-06 16:31:56
美媒:参与对委军事行动的十余架F-22“猛禽”战斗机离开波多黎各

美媒:参与对委军事行动的十余架F-22“猛禽”战斗机离开波多黎各

环球网资讯
2026-01-06 17:21:37
大陆一锤定音,美武器禁入台省,赖清德天塌了,国民党4人现原形

大陆一锤定音,美武器禁入台省,赖清德天塌了,国民党4人现原形

浮光惊掠影
2026-01-02 09:40:35
脸都不要了!76人输三阵掘金!恩比德空砍32+10!一战看清4个现实

脸都不要了!76人输三阵掘金!恩比德空砍32+10!一战看清4个现实

毒舌NBA
2026-01-06 12:26:47
朝鲜谁都不服,却主动将三位中国人写进教科书,还为其树立了铜像

朝鲜谁都不服,却主动将三位中国人写进教科书,还为其树立了铜像

云霄纪史观
2025-12-27 15:49:05
2026-01-06 20:36:49
每一次点击
每一次点击
每一次点击,都是感恩的开始
659文章数 57关注度
往期回顾 全部

科技要闻

速看!黄仁勋万字实录:甩出"物理AI"王牌

头条要闻

媒体:遭美袭击后第三天 委局势进入关键阶段

头条要闻

媒体:遭美袭击后第三天 委局势进入关键阶段

体育要闻

从NBA最菜首发控卫,到NBA最强乔治

娱乐要闻

2026年央视春晚彩排照曝光!

财经要闻

丁一凡:中美进入相对稳定的竞争共存期

汽车要闻

摩登出街潮品 实拍奇瑞QQ冰淇淋女王版

态度原创

房产
亲子
健康
教育
军事航空

房产要闻

爆发!三亚开年超千亩城更计划曝光,香港城砸下100亿!

亲子要闻

看了上海张柏芝的家,无数宝妈酸了:这才是拼三胎的基本条件!

这些新疗法,让化疗不再那么痛苦

教育要闻

儿子在家里干多少活合适呢

军事要闻

美称对“占领”委内瑞拉保留选择权

无障碍浏览 进入关怀版