网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

2025AI核心变革，不是算力更强，而是后训练更懂用户！

2026-01-06 07:01:43　来源: 人生就是要简单

四川举报

0

分享至

2025年AI圈最猛的变化压根不是谁家算力堆得更高，而是后训练技术的全面崛起。

卡帕西年初发的一个视频，到年底还被AI产品经理们翻来覆去地看，原因很简单，这个视频把AI从“半成品”到“赚钱货”的路子讲得明明白白。

以前大家都盯着基座模型的参数量较劲，现在才发现，真正拉开产品差距的，全在后训练这道工序里。

2025年最后一天复盘的时候，很多人都发现了一个共识。

基座模型的参数量还在涨，但用户根本不关心这个数字。

用户能感受到的体验差异，全来自SFT的数据质量、RLHF的调优策略还有推理模型的思考能力。

本来想觉得大厂靠着算力优势能一直躺赢，但后来发现不是这么回事。

对于那些没实力搞大规模预训练的中小企业来说，后训练才是他们能抢蛋糕的主战场。

它不知道什么时候该闭嘴，不知道怎么拒绝用户的无理要求，甚至连自己是谁都搞不清。

后训练的目标，就是把这个“书呆子”改造成能上桌的商业产品。

这个转变的逻辑其实很清晰，预训练是拼资源的军备竞赛，烧钱烧算力，一般玩家根本玩不起。

后训练是拼策略的产品战场，靠的是对用户需求的理解和技术组合的智慧。

如此看来，2025年的AI行业已经悄悄完成了一次赛道切换，从“谁的模型更大”变成了“谁的产品更懂人”。

如果把基座模型比作一块刚挖出来的钻石原石，那监督微调（SFT）就是给这块石头定形状的第一步。

预训练的时候，模型只知道傻愣愣地预测下一个词，喂给它的都是乱七八糟的网页数据。

到了SFT阶段，数据就不一样了。

卡帕西强调，这时候要喂给模型的是格式严整的对话数据。

站在产品经理的角度看，SFT哪里是什么技术微调，这分明是把产品的交互设计固化到模型的权重里。

你希望AI被用户骂的时候礼貌回击，你希望AI写代码的时候遵守行业规范，这些东西都得在SFT阶段用数据教会它。

预训练追求的是“大而全”，SFT追求的是“精而准”。

它的数据量其实不大，也就几万到几十万条，但每一条都得是人类专家精心编写的。

这里面有个很关键的点，卡帕西也提到了，SFT只能教模型模仿专家的语气和格式，如果预训练的时候模型没见过某个知识点，SFT再怎么教也没用。

很多产品经理都栽在这个坑里，觉得靠SFT就能解决所有问题，最后做出来的产品还是漏洞百出。

毕竟，SFT只能保证模型“会说话”，没法保证模型“说人话”“说好话”。

SFT解决了模型“怎么说”的问题，可“什么是好话”这个问题，得靠强化学习人类反馈（RLHF）来搞定。

卡帕西说，RLHF的核心是改变模型的生成分布，让它更倾向于产出人类喜欢的回答，比如乐于助人、无害、诚实这些特质。

毫无疑问，这一点戳中了AI产品商业化的要害。

用户用产品的时候，体验感才是留住他们的关键。

基座模型容易犯的一个大错，就是喜欢一本正经地胡说八道。

你问它一个不存在的人名，它能给你编出一整套生平。

这是因为模型本质上是个概率统计引擎，它只在乎对话流不流畅，不在乎内容真不真实。

RLHF就是在帮模型纠正这个毛病，通过人类的反馈不断调整模型的输出偏好。

当然，RLHF也不是万能的，它需要大量的人类标注数据，成本不低，但对于想做出差异化产品的团队来说，这笔投入完全值得。

2025年下半年最火的AI技术，肯定是推理模型，像DeepSeek-R1、OpenAIo1这些产品，一出来就惊艳了整个行业。

而它们的理论基石，就藏在卡帕西的那个视频里。

卡帕西把AlphaGo的原理搬到了大语言模型上，AlphaGo能赢，是因为它能自己跟自己下棋，系统会判定每一次对弈的输赢。

这个逻辑用到数学和编程领域简直完美，因为这两个领域有明确的对错标准，代码能不能运行，答案对不对，一眼就能看出来。

这就意味着，不需要大量的人类老师做标注，只需要让模型自己反复尝试，做对了给奖励，做错了给惩罚。

在这个过程中，模型慢慢学会了在输出最终答案前，先在内部生成一段思考过程。

它能自我纠错，能反思，能尝试不同的解题路径，这个变化完全重塑了AI产品的商业逻辑和交互逻辑。

以前的AI是“问一答一”，现在的推理模型能“问一思三”，帮用户解决更复杂的问题。

作为一个在AI圈摸爬滚打几年的产品经理，我特别能理解这种技术变革带来的震撼。

以前我们总想着怎么去抢算力资源，怎么去做大模型参数，现在才明白，真正的核心竞争力是把这些技术工具组合好。

需要准确性的时候调用搜索工具，需要人性化的时候依赖SFT调优，需要攻克难题的时候启动推理模式。

技术迭代的速度确实快得吓人，但有一点是不变的。

不管技术怎么变，理解用户需求，用最合适的技术组合去满足需求，永远是产品经理的立身之本。

卡帕西的那个视频虽然已经发布了快一年，但现在看依然不过时。

没看过的朋友真的可以去翻出来看看，搞懂了后训练的逻辑，才算真正看懂了AI产品“从1到100”的路径。

声明：个人原创，仅供参考

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

歼-35开启新年第一飞媒体揭秘试飞机为何是"绿皮机"

央视新闻 2026-01-08 09:21:10
6588 跟贴 6588
上海男篮又要破纪录了？

新民晚报 2026-01-08 10:10:34
435 跟贴 435

中到大雪局部暴雪！山东迎强冷空气，最低温-10℃，9级大风+降温组团来袭

齐鲁壹点 2026-01-08 16:23:17
84 跟贴 84

河南三兄弟连续11年给家乡老人发放救助金，村支书：每人每月发300元到1000元，累计发了600多万元，有老人已经领了七八万元

极目新闻 2026-01-07 21:22:09
2097 跟贴 2097
浙江女子取现240万元，给“外甥订婚彩礼”！外甥懵了：没订婚

环球网资讯 2026-01-08 13:42:08
70 跟贴 70

“陈克明面馆”全国首店于长沙盛大开业，以非遗手延面重塑东方面馆美学

华声在线 2026-01-07 11:44:31
354 跟贴 354

微信辟谣网传新规则

界面新闻 2026-01-08 14:53:45
1727 跟贴 1727
黄鹤楼景区应修北门？建议来了

极目新闻 2026-01-06 10:23:04
818 跟贴 818

安徽542万大奖无人认领弃奖，工作人员：特意留门到23时59分

观威海 2026-01-08 10:38:22
97 跟贴 97
商务部回应审查Meta收购Manus

财联社 2026-01-08 15:20:32
1068 跟贴 1068
阿里：加大投入淘宝闪购以达到市场绝对第一

第一财经资讯 2026-01-08 13:44:51
1012 跟贴 1012
“一半是生活一半是热爱真好！” 炸串老板娘在摊位前跳起蒙古舞网友：有种在大草原里策马奔腾的感觉

环球网资讯 2026-01-08 22:27:52
23 跟贴 23
国内多条航线机票价格“大跳水” 1折机票来了

环球网资讯 2026-01-08 11:26:53
915 跟贴 915
每斤4.47万元！查干湖冬捕38斤“头鱼”拍出1699999元高价，将在直播间抽奖免费送网友

极目新闻 2026-01-08 13:22:08
555 跟贴 555
半场战报|U23亚洲杯中国队暂以0：0战平伊拉克队

齐鲁壹点 2026-01-08 23:40:15
17 跟贴 17
容器像猪食槽的火锅火了老板：老石头改造，猪没用过

封面新闻 2026-01-08 15:17:05
55 跟贴 55
一线调研 | 传统供销社“挖潜”消费新空间服务向“新”引导消费新潮流

国际在线 2026-01-08 20:50:24
5 跟贴 5
向新向优发展，中国经济向好

金台资讯 2026-01-08 06:40:04
192 跟贴 192
铅酸筑基锂电领衔！骆驼蓄电池双轨构建品质护城河

鲁中晨报 2026-01-08 17:31:34
183 跟贴 183
单亲妈妈柬埔寨寻子一个月无果，19岁小伙疑被16万元转卖，与母亲视频通话时曾按“酒窝”暗示“救我”

极目新闻 2026-01-08 21:08:49
0 跟贴 0
35万网红吃室友剩饭、翻垃圾桶吃播被封，网红乱象该警惕了！

眼光很亮 2026-01-09 01:44:59
0 跟贴 0
太原多人放烟花引燃上百个全新充电桩，记者实探：事发地杂草丛生，围挡上张贴了“禁止燃放烟花”告示

台州交通广播 2026-01-09 01:40:36
0 跟贴 0

李在明也没想到，访华仅3天，59岁妻子竟凭一个举动给他长脸了

李在明也没想到，访华仅3天，59岁妻子竟凭一个举动给他长脸了

浮光惊掠影

2026-01-08 00:49:35

湖南省农村信用社联合社党委副书记蒋俊文接受审查调查

湖南省农村信用社联合社党委副书记蒋俊文接受审查调查

界面新闻

2026-01-08 17:03:54

CBA一夜两大疯狂大逆转！广东克星14分逆袭翻盘：山西死里逃生？

CBA一夜两大疯狂大逆转！广东克星14分逆袭翻盘：山西死里逃生？

篮球快餐车

2026-01-09 01:32:06

澳洲重大发现! 糖尿病患者福音其实每家都有, 比药管用!

澳洲重大发现! 糖尿病患者福音其实每家都有, 比药管用!

澳微Daily

2026-01-05 14:57:21

牺牲贝林厄姆，边缘化罗德里戈，只为成全姆巴佩？皇马错了！

牺牲贝林厄姆，边缘化罗德里戈，只为成全姆巴佩？皇马错了！

篮球看比赛

2026-01-08 12:23:35

陪睡陪玩只是冰山一角！万达蒸发800亿后，王思聪再次传出大丑闻

陪睡陪玩只是冰山一角！万达蒸发800亿后，王思聪再次传出大丑闻

民间平哥

2025-12-25 14:54:58

特朗普指示美国退出“不符合该国利益”的66个国际组织

特朗普指示美国退出“不符合该国利益”的66个国际组织

环球网资讯

2026-01-08 06:29:06

轻度抑郁症的人，多半会有这 4句“口头禅”，希望你一句都没说过

轻度抑郁症的人，多半会有这 4句“口头禅”，希望你一句都没说过

不二大叔

2025-11-14 22:09:38

分手8年，胖到认不出的coco自曝私密事，89岁谢贤还要为风流买单

分手8年，胖到认不出的coco自曝私密事，89岁谢贤还要为风流买单

好贤观史记

2026-01-06 15:20:16

医生降薪这么严重的吗？

挪威Talk

2026-01-07 12:41:38

“买不起羽绒服，还敢生5个孩子？”老师一句话，让家长无地自容

“买不起羽绒服，还敢生5个孩子？”老师一句话，让家长无地自容

妍妍教育日记

2026-01-06 10:18:39

小米，这次不是别人黑你们了吧！

小米，这次不是别人黑你们了吧！

亮见

2026-01-07 14:48:20

起底太子集团创始人陈志

中国新闻周刊

2026-01-08 11:39:09

伊朗街道爆发冲突，两名警察死亡，30人受伤：有示威者携带武器并向警察开枪

伊朗街道爆发冲突，两名警察死亡，30人受伤：有示威者携带武器并向警察开枪

鲁中晨报

2026-01-08 07:05:03

资治通鉴：你根本不用怕任何人和事，看完此文会使你充满勇气！

资治通鉴：你根本不用怕任何人和事，看完此文会使你充满勇气！

金沛的国学笔记

2025-09-26 17:40:27

惨案诞生！巴尔韦德不敢相信，1.6亿进攻组合爆发，巴萨创造历史

惨案诞生！巴尔韦德不敢相信，1.6亿进攻组合爆发，巴萨创造历史

足球狗说

2026-01-08 07:53:07

老用户成“冤大头”？新号29元100G 老号89元不够用 3招破局不换号

老用户成“冤大头”？新号29元100G 老号89元不够用 3招破局不换号

Thurman在昆明

2026-01-03 15:59:21

她是国家一级演员，享正军级待遇，离异后至今单身，67岁依然美丽

她是国家一级演员，享正军级待遇，离异后至今单身，67岁依然美丽

老谢谈史

2025-12-16 14:59:41

爆！特朗普又盯上一块地？美国欲“再购”格陵兰，丹麦坚决说不！

爆！特朗普又盯上一块地？美国欲“再购”格陵兰，丹麦坚决说不！

娱乐的宅急便

2026-01-09 01:41:13

您有洗屁股的习惯吗？提醒：天天洗肛门的人，能收获4个惊人好处

您有洗屁股的习惯吗？提醒：天天洗肛门的人，能收获4个惊人好处

39健康网

2025-12-13 20:50:34

人生就是要简单

166文章数 100关注度

往期回顾全部

科技要闻

智谱拿下“全球大模型第一股”，凭什么

头条要闻

采用俄罗斯的防空系统委内瑞拉防空体系因何失效

头条要闻

采用俄罗斯的防空系统委内瑞拉防空体系因何失效

体育要闻

世乒赛银牌得主，说自己梦里都是孙颖莎

娱乐要闻

抗战剧《马背摇篮》首播，获观众好评

财经要闻

微软CTO韦青:未来人类会花钱"戒手机"

汽车要闻

从量变到"智"变吉利在CES打出了五张牌

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

游戏

时尚

本地

数码

公开课

山寨《黑神话》续作上架 PS 商店 / 《GTA 6》或第三次跳票

珍珠专场|| 无论18岁还是80岁，总是会为它再一次心动

本地新闻

1986-2026，一通电话的时空旅程

数码要闻

CES 2026 | TCL实业携全球首创SQD-Mini LED显示技术亮相

公开课

李玫瑾：为什么性格比能力更重要？

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版