网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

JetBrains科学家拆解大模型：后训练时代结束了？

2026-04-23 14:48:48　来源: 薛定谔的BUG

北京举报

0

分享至

Jodie Burchell又回来聊AI编程了。这位JetBrains的数据科学家、Python倡导团队负责人，在最新一期播客里扔了个判断：大语言模型的优化战场，已经从"后训练"转向了别处。

这不是术语游戏。如果你还在用2023年的思路调模型，可能正在错过整个2024年的关键转向。

后训练：曾经的黄金标准

过去两年，"微调"（fine-tuning）几乎是每个LLM项目的标配。拿到基础模型，灌入领域数据，调整参数，期待它在特定任务上表现更好。

这个逻辑很直接：模型已经学了通用知识，你只需要教它你的特殊需求。

但Burchell点出了两个硬约束。第一，微调需要大量标注数据——而高质量标注本身就是瓶颈。第二，计算成本。每次全参数微调都是一场资源消耗战，对小团队尤其不友好。

更隐蔽的问题是：微调后的模型往往过拟合到训练数据的分布上，遇到真实场景的边缘案例反而脆断。

行业开始意识到，与其不断修改模型权重，不如改变模型看到的世界。

上下文工程：给模型戴上有色眼镜

这就是"上下文工程"（context engineering）崛起的背景。

核心洞察很简单：同一个模型，在不同上下文里表现天差地别。与其花两周微调，不如花两小时设计提示词结构、检索策略和工具调用流程。

上下文工程不是写更好的提示词那么简单。它是一套系统设计——包括：

• 检索增强生成（RAG）的文档切分与排序策略

• 多轮对话的状态管理

• 工具调用的时机选择与错误恢复

• 长上下文的窗口利用与信息压缩

JetBrains的观察是，开发者正在从"模型中心"转向"上下文中心"。模型权重越来越像基础设施，真正的差异化发生在数据流设计和交互编排层。

这解释了为什么2024年向量数据库、提示词工程平台和Agent框架的热度持续走高——它们都是上下文工程的基建。

多智能体编排：从独奏到乐队

比上下文工程更进一步的是"多智能体编排"（multi-agent orchestration）。

不再追求一个万能模型，而是把多个专用模型/模块组合起来，各取所长。一个负责代码生成，一个负责安全审查，一个负责测试用例设计，通过编排层协调工作流。

Burchell认为这个趋势将"彻底改变自然语言处理的工作方式"。

技术实现上，这涉及：

• 任务分解与路由决策

• 智能体间的通信协议

• 冲突消解与一致性保证

• 执行轨迹的可观测性

多智能体架构的隐性优势是容错性。单个模型幻觉可以被其他智能体交叉验证，复杂任务可以并行拆解，系统整体鲁棒性高于任何单一组件。

这也降低了厂商锁定风险——你可以混用不同来源的模型，而不必押注某一家。

当前有效的三类技术

播客里Burchell还梳理了当下最实用的LLM优化手段。我们按实施难度排序：

数据增强：低成本扩围

在标注数据稀缺时，通过生成合成数据来扩充训练集。技术包括同义词替换、回译、模板填充，以及用更强模型生成弱模型的微调数据。

关键是如何保证合成数据的质量边界——垃圾进，垃圾出，在LLM时代尤其致命。

迁移学习：知识的跨域搬运

把模型在一个任务上学到的表示，迁移到相似的新任务。这比从头训练省 orders of magnitude 的计算量。

迁移学习的有效性高度依赖源域与目标域的相似度评估。选错源任务，迁移反而带来负迁移（negative transfer）。

元学习：学会学习

最高阶的玩法是让模型习得"快速适应新任务"的能力本身。少量示例就能触发有效推理，这正是当下提示工程与上下文学习（in-context learning）的理论基础。

元学习的工程化仍在早期，但它指向一个诱人前景：未来模型可能不再需要任务特定的微调，而是通过精心设计的上下文就能即时适配。

一张图看懂范式转移

如果我们把LLM优化画成一张架构图，2023年和2024年的版本会是这样：

【2023版】

基础模型 → 后训练微调 → 部署推理

（重心在箭头1：修改模型权重）

【2024版】

基础模型 → 上下文工程层 → 多智能体编排 → 部署推理

（重心在箭头2和3：设计数据流与协调机制）

这个转移的底层驱动力是成本结构变化。GPT-4级别的API调用成本在过去一年下降了约两个数量级，而高质量微调所需的标注人力成本几乎没变。当"用更多token"比"改模型权重"便宜一个量级时，优化策略自然向后者倾斜。

JetBrains作为IDE厂商，对这个趋势感受尤深。他们的AI助手功能（如代码补全、解释、重构）越来越多地依赖上下文检索和工具调用，而非模型微调。用户项目代码、依赖库文档、运行时错误信息——这些实时上下文比任何预训练知识都更值钱。

开发者的行动清单

如果你负责一个LLM应用项目，2024年的优先级可能需要重新排序：

第一，投资RAG基础设施。不是简单接个向量数据库，而是文档切分策略、重排序模型、查询改写、多路召回的完整 pipeline。

第二，建立评估体系。没有自动化的离线评估，上下文工程的迭代就是盲人摸象。需要覆盖相关性、忠实度、答案完整性的多维指标。

第三，探索Agent边界。从单轮问答转向多步任务，识别你场景中适合拆解为子任务的环节。但警惕过度设计——不是所有问题都需要多智能体。

第四，延迟与成本的trade-off监控。更复杂的上下文工程和Agent编排意味着更高的延迟和token消耗，需要在用户体验和运营成本间找到动态平衡点。

第五，保持模型层的中立性。上下文工程和多智能体架构的价值之一，就是降低对单一模型供应商的依赖。设计时预留模型切换的抽象层。

Burchell的播客没有给出确定的未来图景，但指出了一个清晰的方向：LLM技术栈正在分层固化，模型层趋向商品化，真正的竞争壁垒向上移动——谁能更好地理解用户场景、设计数据流、编排多智能体协作，谁就能在应用层建立优势。

这对开发者是好消息。你不需要再追逐每一个新发布的模型权重，而是可以把精力投入到更持久的工程能力建设中：系统设计、评估方法论、产品化思维。

大模型的"后训练时代"或许没有彻底终结，但它确实不再是唯一的主战场了。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

翻完DeepSeek报告，我们发现了中国AI的默契

机器之心Pro 2026-04-26 13:21:55
3 跟贴 3
在OpenAI把Chronicle做成订阅功能48小时后，一群00后把它开源了

机器之心Pro 2026-04-26 13:23:34
2 跟贴 2

字节养的“虾”与1500亿账本背后

钛媒体APP 2026-04-25 16:44:18
0 跟贴 0

今天起，DeepSeek V4成OpenClaw默认模型！

新智元 2026-04-26 11:28:20
3 跟贴 3
Epoch AI万人调研：老板不订阅，AI就是摆设！

新智元 2026-04-26 09:04:03
2 跟贴 2

EmbodiChain开源，用100%生成式数据自动训练具身智能模型

机器之心Pro 2026-01-20 15:49:43
0 跟贴 0

具身智能的数据难题，终于有了可规模化的解法

量子位 2025-12-18 14:13:03
0 跟贴 0
DeepSeek V4“寄予厚望”！国产算力“进攻的矛”--超节点

华尔街见闻官方 2026-04-26 20:21:15
0 跟贴 0

GPT image-2爆火后，设计师的天塌了吗？

虎嗅APP 2026-04-26 21:02:07
0 跟贴 0
AI最疯狂的一周，该知道的8大共识都在这了

智东西 2026-04-26 21:57:35
0 跟贴 0
谷歌收200美元的AI动态图表功能，今天被Claude免费开放！

新智元 2026-04-26 18:06:15
0 跟贴 0
00后小哥复刻Claude最强神话模型OpenMythos

量子位 2026-04-23 11:44:18
0 跟贴 0
第87届教装展直击丨海亮科技以AI解锁未来教育

芥末堆看教育 2026-04-26 20:57:19
0 跟贴 0
DeepSeek过于朴素了

虎嗅APP 2026-04-25 17:32:05
129 跟贴 129
赖清德窜访斯威士兰失败背后的三重逻辑

井芹仁小菜 2026-04-26 02:57:51
0 跟贴 0
美国富豪非洲打猎被5头大象踩死

看看新闻Knews 2026-04-25 19:38:18
4699 跟贴 4699
从数学博士到英国“纳税王”：他用AI撑起千亿美金量化帝国

DeepTech深科技 2026-04-26 17:13:46
1 跟贴 1
矩阵的若尔当标准型

返朴 2026-04-23 10:59:21
1 跟贴 1
Claude终于认了！降智坐实，越聊越傻，3个bug全曝光

量子位 2026-04-26 17:57:07
0 跟贴 0
22个省级政府主要负责人担任省级责任人！这一名单对外公布

政知新媒体 2026-04-26 17:44:16
83 跟贴 83
罗纳尔多的接球逻辑，独属于外星人的无解调整！

爱笑无厘头 2026-04-26 12:03:51
1 跟贴 1
“月薪1.6万招人放羊”老板再发声：多人通过初选，但担心条件艰苦留不住人；称就算降薪也要交社保

极目新闻 2026-04-25 16:12:24
2412 跟贴 2412
半挂模型玩具车买菜，要是超重了怎么办，雷军都不敢这么设计！

宇宙搞笑生活 2026-04-23 14:10:00
4 跟贴 4
苏超最新积分榜出炉！

无锡博报 2026-04-25 21:51:59
153 跟贴 153
基于古籍NER语义分析的城市历史空间解译研究

江西地名研究 2026-04-26 17:34:14
0 跟贴 0
锐评NBA：如何看待数据流，詹吹手段从哪来？

ChinaRain刘晓健 2026-04-26 15:35:35
0 跟贴 0
实测混元Hy3 preview：腾讯AI，终于能打了？

钛媒体APP 2026-04-26 15:15:26
0 跟贴 0
泡泡玛特推出Labubu冰箱，售价5999元，上千人预约

大象新闻 2026-04-26 13:01:02
2875 跟贴 2875
ACL 2026 | 不训练LLM也能支持未见语言问答？中科院计算所团队让多语言能力「外挂式」加载

新浪财经 2026-04-25 18:13:53
0 跟贴 0
南京一通信公司高管组织40多名员工上班时间干私活，研发竞品长达9年，被按法定上限判赔580万元

环球网资讯 2026-04-26 16:19:07
31 跟贴 31
制作直升机遥控模型，阿帕奇AH-64

制造科技 2026-04-22 16:29:03
0 跟贴 0
知识库3个月必崩？这个结构能撑3年

报错免疫体 2026-04-22 13:46:36
0 跟贴 0
广东一糖厂收购农户滞销果蔗：司机等候超24小时每吨补10元，日开销已超五万

潇湘晨报 2026-04-26 18:00:18
27 跟贴 27
紫牛头条｜父亲半生寻子走访50万公里，33年后才知儿子就在走失处30公里外

扬子晚报 2026-04-26 20:30:38
72 跟贴 72
公关公司的记者名单，为什么越用越笨？

固件更新中 2026-04-23 14:47:52
0 跟贴 0
赵心童两阶段9-7领先丁俊晖 “中国德比”今日17时决胜负

齐鲁壹点 2026-04-26 07:18:18
636 跟贴 636
欧尔班宣布退出匈牙利国会

参考消息 2026-04-26 13:18:23
0 跟贴 0
不到50元拥有“爱马仕”，热度超过养虾，MiniMax调用量全球第一梯队

上观新闻 2026-04-26 21:09:10
1 跟贴 1
“记者卧底桂林六日游低价团”后续：地接旅行社被罚30万并停业整顿

极目新闻 2026-04-24 08:03:58
550 跟贴 550
安全是最大的豪华，华为巨鲸电池平台重塑新能源安全标杆

快上车Go 2026-04-26 21:08:37
0 跟贴 0

山东菏泽一修车工打开机盖瞬间防冻液喷出数米高，三人仓皇逃跑，当事人：大概熄火有十几分钟，高温不能轻易打开水箱盖，人都没事

山东菏泽一修车工打开机盖瞬间防冻液喷出数米高，三人仓皇逃跑，当事人：大概熄火有十几分钟，高温不能轻易打开水箱盖，人都没事

潇湘晨报

2026-04-26 11:18:23

聪明过头！广东一男子为儿子备婚房，将房产证落自己名下，引热议

聪明过头！广东一男子为儿子备婚房，将房产证落自己名下，引热议

火山詩话

2026-04-26 08:58:51

黄金价格跌破1000元！看来这茬儿韭菜，是到收割的时候了？

黄金价格跌破1000元！看来这茬儿韭菜，是到收割的时候了？

正经说个事儿

2026-03-23 23:32:34

同时聊300个“老头”，能月入两三万？专挑8090后下手，批量收割

同时聊300个“老头”，能月入两三万？专挑8090后下手，批量收割

米果说识

2026-04-19 22:20:16

经典网吧糗事冷笑话，有一哥们去网吧上网通宵半夜突然着急上厕所，但厕所里有人这哥们就在门外等着！

经典网吧糗事冷笑话，有一哥们去网吧上网通宵半夜突然着急上厕所，但厕所里有人这哥们就在门外等着！

天天明星

2026-04-25 11:18:15

豪门阔太只拍一部戏就隐退，获演员丈夫宠爱30年

豪门阔太只拍一部戏就隐退，获演员丈夫宠爱30年

眼底星碎

2026-04-25 11:35:30

尴尬！一主管在工作群发离职感言，被下属怒怼，网友：就悄悄走吧

尴尬！一主管在工作群发离职感言，被下属怒怼，网友：就悄悄走吧

火山詩话

2026-04-26 14:15:15

随着穆帅率队4-1大胜，阿维卡2-1，葡超最新积分榜出炉

随着穆帅率队4-1大胜，阿维卡2-1，葡超最新积分榜出炉

侧身凌空斩

2026-04-26 03:12:20

98年我在东莞当保安，一个舞女为躲追杀藏我宿舍，竟是卧底女警

98年我在东莞当保安，一个舞女为躲追杀藏我宿舍，竟是卧底女警

千秋文化

2026-04-22 20:17:38

西媒：西班牙首相称“不担心”被逐出北约

西媒：西班牙首相称“不担心”被逐出北约

参考消息

2026-04-25 21:19:06

霍尔木兹海峡，传来大消息！伊朗总统，最新发声！比特币跳水，超9.9万人爆仓！

霍尔木兹海峡，传来大消息！伊朗总统，最新发声！比特币跳水，超9.9万人爆仓！

证券时报e公司

2026-04-25 22:11:02

局势反转！辽宁舰055南北夹击，美日菲联军在南海彻底抬不起头

局势反转！辽宁舰055南北夹击，美日菲联军在南海彻底抬不起头

利刃号

2026-04-26 18:52:16

哈里王子正式官宣！独立掌握王室权限，逼迫查尔斯国王出“狠招”

哈里王子正式官宣！独立掌握王室权限，逼迫查尔斯国王出“狠招”

梦想总会变成真

2026-04-25 18:20:21

至今，还有13个国家和中国没有建交，他们都是谁？

至今，还有13个国家和中国没有建交，他们都是谁？

深度报

2026-04-22 22:30:57

约基奇谈冲突：停止比赛了他还去得分；这么做不是想激励队友

约基奇谈冲突：停止比赛了他还去得分；这么做不是想激励队友

懂球帝

2026-04-26 13:16:09

大飞机交付连年跳票，C919量产困境背后只是发动机问题？

大飞机交付连年跳票，C919量产困境背后只是发动机问题？

火星宏观

2026-04-24 21:03:19

建国后外逃级别最高的贪官！至今未落网，23年来逃跑方式仍是谜

建国后外逃级别最高的贪官！至今未落网，23年来逃跑方式仍是谜

铁血江湖人

2026-04-23 22:21:26

美论坛：如果中国不再向美国出售任何东西，中国还能继续繁荣吗？

美论坛：如果中国不再向美国出售任何东西，中国还能继续繁荣吗？

爱史纪

2026-04-26 14:29:07

黄一鸣回应：孩子100%是王思聪的，不排斥和老头交往，八十岁也行

黄一鸣回应：孩子100%是王思聪的，不排斥和老头交往，八十岁也行

奇思妙想草叶君

2026-04-24 19:44:03

2026一定要多存钱：经济下行，建议你不要再买这9样东西

2026一定要多存钱：经济下行，建议你不要再买这9样东西

阿晪美食

2026-04-09 18:09:47

薛定谔的BUG

有态度网友ytd

1723文章数 37关注度

往期回顾全部

科技要闻

涨价浪潮下，DeepSeek推动AI“价格战”

头条要闻

以色列政坛重大变局内塔尼亚胡迎来劲敌

头条要闻

以色列政坛重大变局内塔尼亚胡迎来劲敌

体育要闻

森林狼3比1掘金：逆境中杀出了多孙穆？！

娱乐要闻

仅次《指环王》的美剧，有第二季

财经要闻

事关新就业群体，中办、国办发文

汽车要闻

预售19.38万元起哈弗猛龙PLUS七座版亮相

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

房产

本地

手机

公开课

军事航空

房产要闻

新一轮教育大爆发来了！海口，开始疯狂建学校！

本地新闻

云游中国｜逛世界风筝都留学生探秘中国传统文化

手机要闻

鸿蒙6，玻璃，光，和我

公开课

李玫瑾：为什么性格比能力更重要？

军事要闻

伊朗总统：不会在压力、威胁下进行谈判

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版