网易首页 > 网易号 > 正文 申请入驻

2025AI核心变革,不是算力更强,而是后训练更懂用户!

0
分享至



2025年AI圈最猛的变化压根不是谁家算力堆得更高,而是后训练技术的全面崛起。

卡帕西年初发的一个视频,到年底还被AI产品经理们翻来覆去地看,原因很简单,这个视频把AI从“半成品”到“赚钱货”的路子讲得明明白白。

以前大家都盯着基座模型的参数量较劲,现在才发现,真正拉开产品差距的,全在后训练这道工序里。



2025年最后一天复盘的时候,很多人都发现了一个共识。

基座模型的参数量还在涨,但用户根本不关心这个数字。

用户能感受到的体验差异,全来自SFT的数据质量、RLHF的调优策略还有推理模型的思考能力。

本来想觉得大厂靠着算力优势能一直躺赢,但后来发现不是这么回事。



对于那些没实力搞大规模预训练的中小企业来说,后训练才是他们能抢蛋糕的主战场。

它不知道什么时候该闭嘴,不知道怎么拒绝用户的无理要求,甚至连自己是谁都搞不清。

后训练的目标,就是把这个“书呆子”改造成能上桌的商业产品。



这个转变的逻辑其实很清晰,预训练是拼资源的军备竞赛,烧钱烧算力,一般玩家根本玩不起。

后训练是拼策略的产品战场,靠的是对用户需求的理解和技术组合的智慧。

如此看来,2025年的AI行业已经悄悄完成了一次赛道切换,从“谁的模型更大”变成了“谁的产品更懂人”。



如果把基座模型比作一块刚挖出来的钻石原石,那监督微调(SFT)就是给这块石头定形状的第一步。

预训练的时候,模型只知道傻愣愣地预测下一个词,喂给它的都是乱七八糟的网页数据。

到了SFT阶段,数据就不一样了。

卡帕西强调,这时候要喂给模型的是格式严整的对话数据。



站在产品经理的角度看,SFT哪里是什么技术微调,这分明是把产品的交互设计固化到模型的权重里。

你希望AI被用户骂的时候礼貌回击,你希望AI写代码的时候遵守行业规范,这些东西都得在SFT阶段用数据教会它。

预训练追求的是“大而全”,SFT追求的是“精而准”。

它的数据量其实不大,也就几万到几十万条,但每一条都得是人类专家精心编写的。



这里面有个很关键的点,卡帕西也提到了,SFT只能教模型模仿专家的语气和格式,如果预训练的时候模型没见过某个知识点,SFT再怎么教也没用。

很多产品经理都栽在这个坑里,觉得靠SFT就能解决所有问题,最后做出来的产品还是漏洞百出。

毕竟,SFT只能保证模型“会说话”,没法保证模型“说人话”“说好话”。



SFT解决了模型“怎么说”的问题,可“什么是好话”这个问题,得靠强化学习人类反馈(RLHF)来搞定。

卡帕西说,RLHF的核心是改变模型的生成分布,让它更倾向于产出人类喜欢的回答,比如乐于助人、无害、诚实这些特质。



毫无疑问,这一点戳中了AI产品商业化的要害。

用户用产品的时候,体验感才是留住他们的关键。

基座模型容易犯的一个大错,就是喜欢一本正经地胡说八道。

你问它一个不存在的人名,它能给你编出一整套生平。



这是因为模型本质上是个概率统计引擎,它只在乎对话流不流畅,不在乎内容真不真实。

RLHF就是在帮模型纠正这个毛病,通过人类的反馈不断调整模型的输出偏好。

当然,RLHF也不是万能的,它需要大量的人类标注数据,成本不低,但对于想做出差异化产品的团队来说,这笔投入完全值得。



2025年下半年最火的AI技术,肯定是推理模型,像DeepSeek-R1、OpenAIo1这些产品,一出来就惊艳了整个行业。

们的理论基石,就藏在卡帕西的那个视频里。

卡帕西把AlphaGo的原理搬到了大语言模型上,AlphaGo能赢,是因为它能自己跟自己下棋,系统会判定每一次对弈的输赢。



这个逻辑用到数学和编程领域简直完美,因为这两个领域有明确的对错标准,代码能不能运行,答案对不对,一眼就能看出来。

这就意味着,不需要大量的人类老师做标注,只需要让模型自己反复尝试,做对了给奖励,做错了给惩罚。

在这个过程中,模型慢慢学会了在输出最终答案前,先在内部生成一段思考过程。

它能自我纠错,能反思,能尝试不同的解题路径,这个变化完全重塑了AI产品的商业逻辑和交互逻辑。



以前的AI是“问一答一”,现在的推理模型能“问一思三”,帮用户解决更复杂的问题。

作为一个在AI圈摸爬滚打几年的产品经理,我特别能理解这种技术变革带来的震撼。

以前我们总想着怎么去抢算力资源,怎么去做大模型参数,现在才明白,真正的核心竞争力是把这些技术工具组合好。

需要准确性的时候调用搜索工具,需要人性化的时候依赖SFT调优,需要攻克难题的时候启动推理模式。



技术迭代的速度确实快得吓人,但有一点是不变的。

不管技术怎么变,理解用户需求,用最合适的技术组合去满足需求,永远是产品经理的立身之本。

卡帕西的那个视频虽然已经发布了快一年,但现在看依然不过时。

没看过的朋友真的可以去翻出来看看,搞懂了后训练的逻辑,才算真正看懂了AI产品“从1到100”的路径。



声明:个人原创,仅供参考

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
李雨桐被拘!官方下场,曾自曝背后靠山大,拘留10天,逾期还罚款

李雨桐被拘!官方下场,曾自曝背后靠山大,拘留10天,逾期还罚款

离离言几许
2026-04-19 17:49:44
她被绑架后完美自救,却还是被坑死?!疯狂暗示911报警电话,就是听不懂...

她被绑架后完美自救,却还是被坑死?!疯狂暗示911报警电话,就是听不懂...

英国那些事儿
2026-04-20 23:31:38
沙特大幅削减斯诺克资金投入,世界台联强势回应:在中国增加赛事

沙特大幅削减斯诺克资金投入,世界台联强势回应:在中国增加赛事

杨华评论
2026-04-21 22:29:20
反转!亚足联确认,马宁亚冠执法“无错漏判”,沙特球队或遭重罚

反转!亚足联确认,马宁亚冠执法“无错漏判”,沙特球队或遭重罚

生活新鲜市
2026-04-21 21:22:06
恶心!浙江新娘吐槽,18万礼金被拿走15万,结婚像给婆婆赚养老钱

恶心!浙江新娘吐槽,18万礼金被拿走15万,结婚像给婆婆赚养老钱

火山詩话
2026-04-20 08:59:19
这一次,马頔彻底触碰了观众的底线,口碑翻车真不冤

这一次,马頔彻底触碰了观众的底线,口碑翻车真不冤

杰哥娱天下
2026-04-20 23:07:05
英超第33轮再成阿森纳梦魇,这一次“绝唱”会属于阿尔特塔吗?

英超第33轮再成阿森纳梦魇,这一次“绝唱”会属于阿尔特塔吗?

英超德甲才疯狂
2026-04-21 06:47:50
黑奴贸易里,将黑人扒光并让男女挤一起,只是为了省钱省事吗

黑奴贸易里,将黑人扒光并让男女挤一起,只是为了省钱省事吗

小豫讲故事
2026-04-18 06:00:12
凌晨3点 英超争冠反转之战!曼城赢球将登顶 还送对手降级

凌晨3点 英超争冠反转之战!曼城赢球将登顶 还送对手降级

叶青足球世界
2026-04-22 08:17:36
美专家:美国在伊朗正面临四个大问题

美专家:美国在伊朗正面临四个大问题

环球时报国际
2026-04-21 00:16:12
7-3领先后连丢7局!世锦赛诞生最惨逆转,中国3人晋级创历史

7-3领先后连丢7局!世锦赛诞生最惨逆转,中国3人晋级创历史

刘哥谈体育
2026-04-21 18:11:42
40 集《蜜语纪》大结局!鲁贞贞生下混血宝宝,聂予诚彻底崩溃了

40 集《蜜语纪》大结局!鲁贞贞生下混血宝宝,聂予诚彻底崩溃了

小猫追剧
2026-04-20 12:01:42
特朗普再次威胁古巴,古巴真的不慌吗?

特朗普再次威胁古巴,古巴真的不慌吗?

木虫
2026-04-22 09:05:09
沦为共享单车的女色虎

沦为共享单车的女色虎

深度报
2026-03-05 22:39:27
肝脂降低20%!复旦研究:这样吃,仅需三个月,超8成人脂肪肝好转

肝脂降低20%!复旦研究:这样吃,仅需三个月,超8成人脂肪肝好转

思思夜话
2026-04-21 11:18:45
现实版狂飙终落幕!比高启强更狂的黄大发,横行30年一审被判死刑

现实版狂飙终落幕!比高启强更狂的黄大发,横行30年一审被判死刑

瓜哥的动物日记
2026-04-22 00:15:31
“说好给2000,他给10元”:2011年75岁男子睡33岁女人拒付钱被杀

“说好给2000,他给10元”:2011年75岁男子睡33岁女人拒付钱被杀

汉史趣闻
2026-04-18 15:19:07
美日彻底慌了!日本军舰闯台海,中国解放军把军舰开到家门口!

美日彻底慌了!日本军舰闯台海,中国解放军把军舰开到家门口!

健身狂人
2026-04-21 11:59:49
韦应物最著名的一首诗,短短4句,火了1200年

韦应物最著名的一首诗,短短4句,火了1200年

长风文史
2026-04-18 12:29:44
《生化危机9》被挖曾删减一整个章节 或与DLC有关!

《生化危机9》被挖曾删减一整个章节 或与DLC有关!

3DM游戏
2026-04-22 09:00:44
2026-04-22 09:39:00
人生就是要简单
人生就是要简单
感谢关注
558文章数 171关注度
往期回顾 全部

科技要闻

凌晨突发!ChatGPT Images 2.0发布

头条要闻

牛弹琴:伊朗发出让人毛骨悚然的警告 玩的就是心跳

头条要闻

牛弹琴:伊朗发出让人毛骨悚然的警告 玩的就是心跳

体育要闻

一到NBA季后赛,四届DPOY就成了主角

娱乐要闻

宋承炫晒宝宝B超照,宣布老婆怀孕

财经要闻

伊朗拒绝出席 特朗普宣布延长停火期限

汽车要闻

全新坦克700正式上市 售价42.8万-50.8万元

态度原创

亲子
时尚
数码
公开课
军事航空

亲子要闻

才六天的马宝宝,发这个视频没有别的意思,只是想骗你们生女儿而已

顶流复工,已判若两人

数码要闻

Framework Computer发布Framework Laptop 13 Pro模块笔记本

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

特朗普宣布延长停火 伊朗表态

无障碍浏览 进入关怀版