网易首页 > 网易号 > 正文 申请入驻

别卷模型微调了!吴恩达揭秘:75%的团队其实在无效努力

0
分享至

在进行微调之前,可以先考虑使用提示工程或智能体工作流,这样可能会得到更简单且易于维护的解决方案。。”

随着人工智能技术的发展,模型微调已经成为一个广受关注的话题。在与客户进行沟通时,研发团队常常会询问:究竟在什么情况下应该进行微调?又在什么情况下不适合呢?

根据吴恩达在多家公司实践经验的分析,现阶段大约有75%的团队在使用微调时,其实可以通过更简单的方法来实现目标。但在以下三种情况下,微调显然是最佳的选择:

  1. 提高关键应用的准确性

  2. 学习特定的沟通风格

  3. 降低模型的延迟和成本

吴恩达还特别强调,得益于LoRA等技术,进行微调所需的数据量远低于预期,有时仅需100个示例就能达到良好的效果。这为希望入门模型微调的团队提供了宝贵的参考指南。

01

模型微调的复杂性

虽然微调是一项重要且有价值的技术,但许多团队实际上可以通过更简单的方法取得良好效果,比如提示工程(包括长提示)、少样本提示或基本的智能体工作流。

这些团队为何不选择微调?主要是因为微调涉及对预训练模型进行额外训练,操作较为复杂。微调的过程包括收集训练数据、寻找服务提供商协助实施微调,并最终部署经过微调的模型。由于微调在训练和部署阶段都增加了额外的复杂性,因此通常只有在其他方法无法满足需求的情况下才会考虑使用。

尽管如此,在某些特定场景下,微调依然是合适的选择。技术如LoRA可以通过调整有限参数而非整个模型,使得微调变得更加经济,特别适合小型模型(如参数较少的13B模型)。此外,进行微调所需的数据量比大多数人想象的要少,有时只需100个示例或者更少即可取得良好效果。

以下是一些成功应用微调的场景。

02

提升关键应用的准确性

虽然提示工程能在很多情况下提供帮助,但在某些需求较高的应用中,微调可以进一步提升准确性。例如,构建客服聊天机器人时,如果希望其能够有效调用API(如进行交易或退款),提示工程可能在95%的情况下表现良好。然而,当需要达到99%的准确率时,基于相关对话和API调用的数据进行微调,可能是实现目标的理想方案。对于那些难以用语言明确规定的操作任务,微调尤其有效。

例如,当顾客不满意时,聊天机器人应该将问题升级给经理,还是直接退款?若团队为人类员工编写了标准操作流程,这些流程可以直接转化为提示。但如果流程不明确,或需要大量示例才能明确操作,则微调可能是更好的途径。在许多文本分类任务中,微调也表现得相当优异,例如对医疗记录进行分类。

03

学习特定的沟通风格

如吴恩达所述,通过微调模型,可以使其表达方式更符合个人风格。许多人的语言习惯各异,细微差别难以通过文本提示准确传达。若想让系统以特定风格交流,微调通常比单纯依赖提示更有效。

一些特定的输出格式,比如AI出题或生成问卷时,因输出结果有多种选项类型,这些格式通常需要对模型进行微调,以确保输出能被正确呈现。

04

在扩大规模时降低延迟或成本

在一些场景中,开发者通过提示工程成功让大模型完成复杂任务。但当规模扩大后,如果大模型速度缓慢或成本过高,团队可能希望转向小模型。然而,如果小模型的性能不足,通过微调可以使其在特定应用中达到和大模型相当的表现。同时,大模型也可以生成数据,帮助小模型进行微调。

05

总结

在前沿研究中,部分团队通过微调提升特定语言的理解能力。但若目标是让大模型更好地理解训练数据中未包含的知识,使用检索增强生成(RAG)可能是更简便的选择。总体来看,大约75%的团队能通过提示或智能体工作流取得良好结果,只有25%的团队需要微调来实现目标。

在技术上,微调的实施、超参数的设置及计算资源的优化仍具挑战性。不过,越来越多的公司致力于优化这些方面并提供高效的微调服务。

许多公司允许对开放权重模型进行微调并提供下载,而有些则对封闭模型进行微调但不允许下载微调后的权重。前者更具可移植性,并减小对服务提供商支持的依赖。

综上所述,在决定微调之前,可以优先考虑提示或智能体工作流,这将可能帮助你找到更简单且易于维护的方案。我的团队中大多数应用并未使用微调,但在某些关键环节上,微调依然发挥着重要作用。

我们相信人工智能为普通人提供了一种“增强工具”,并致力于分享全方位的AI知识。在这里,您可以找到最新的AI科普文章、工具评测、提升效率的秘籍以及行业洞察。 欢迎关注“福大大架构师每日一题”,让AI助力您的未来发展。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
伊朗总统再次强调伊朗不会发展核武器

伊朗总统再次强调伊朗不会发展核武器

界面新闻
2026-02-26 15:52:44
重磅!苹果将采用国产存储芯片!

重磅!苹果将采用国产存储芯片!

中国半导体论坛
2026-02-27 21:00:12
伊朗求购中国CM-302,美伊博弈再添新变量!

伊朗求购中国CM-302,美伊博弈再添新变量!

杨风
2026-02-26 22:39:41
女子8年拒绝8次男友求婚,男友无奈另娶她人,女友:凭什么?

女子8年拒绝8次男友求婚,男友无奈另娶她人,女友:凭什么?

小蒋爱唠嗑
2026-02-11 05:33:41
这次荷兰没话说了!中方正式摊牌:断供你的芯片,我们自己制造!

这次荷兰没话说了!中方正式摊牌:断供你的芯片,我们自己制造!

史襉的生活科普
2026-02-27 14:54:04
美股全线下跌,道指重挫超500点,英伟达跌超4%,金银油大涨

美股全线下跌,道指重挫超500点,英伟达跌超4%,金银油大涨

每日经济新闻
2026-02-28 11:31:38
美国欲对谷爱凌征税100%,可不是为了奥运金牌,而是争夺全球人才

美国欲对谷爱凌征税100%,可不是为了奥运金牌,而是争夺全球人才

林小明商业评说
2026-02-27 23:35:10
狐狸尾巴露出来了?默茨访华说漏嘴,中方当面回复,措辞极不寻常

狐狸尾巴露出来了?默茨访华说漏嘴,中方当面回复,措辞极不寻常

云舟史策
2026-02-28 07:44:46
十年轮回!25岁新旗手!二首轮换的未来?

十年轮回!25岁新旗手!二首轮换的未来?

篮球盛世
2026-02-28 11:39:07
1-1,83分钟绝平,23岁国米青训新星救主,帕尔马连续4轮不败

1-1,83分钟绝平,23岁国米青训新星救主,帕尔马连续4轮不败

俯身冲顶
2026-02-28 05:42:40
年后快递员大批离职,他们不是不想干,而是心彻底凉了!

年后快递员大批离职,他们不是不想干,而是心彻底凉了!

北纬的咖啡豆
2026-02-27 22:41:47
欧冠抽签:皇马曼城又双叒叕相遇,枪手上上签

欧冠抽签:皇马曼城又双叒叕相遇,枪手上上签

足球报
2026-02-28 11:28:30
青海省海东工业园区原管委会主任黄国俊被开除党籍

青海省海东工业园区原管委会主任黄国俊被开除党籍

界面新闻
2026-02-28 10:32:31
潮汕婚礼丈母娘火了,打扮娇艳比新娘还抢镜,网友:感觉有点不对

潮汕婚礼丈母娘火了,打扮娇艳比新娘还抢镜,网友:感觉有点不对

梅子的小情绪
2026-02-08 19:59:04
15万方!武汉最大高铁站终于来了!

15万方!武汉最大高铁站终于来了!

小影的娱乐
2026-02-28 00:51:44
印度公布2025年GDP:不仅未能赶超日本,还被英国反超,降至第六

印度公布2025年GDP:不仅未能赶超日本,还被英国反超,降至第六

南生今世说
2026-02-28 10:03:03
马云预言应验了?未来5年,把存款换成4个资产,或将衣食无忧?

马云预言应验了?未来5年,把存款换成4个资产,或将衣食无忧?

璀璨幻行者
2026-01-31 18:59:25
央媒怒批、坑害老百姓!臭名昭著的四大相声演员,各个难以原谅

央媒怒批、坑害老百姓!臭名昭著的四大相声演员,各个难以原谅

青橘罐头
2026-02-18 07:08:27
硅谷嘲讽,华盛顿嫌弃:为什么他们都在羞辱 Anthropic ?

硅谷嘲讽,华盛顿嫌弃:为什么他们都在羞辱 Anthropic ?

硅星人
2026-02-28 09:58:52
疑似黄晓明新恋情曝光,对方又是网红脸,难怪叶柯新年直播哭了

疑似黄晓明新恋情曝光,对方又是网红脸,难怪叶柯新年直播哭了

郭蛹包工头
2026-02-25 19:27:26
2026-02-28 12:16:49
moonfdd incentive-icons
moonfdd
福大大架构师每日一题
1137文章数 58关注度
往期回顾 全部

科技要闻

狂揽1100亿美元!OpenAI再创融资神话

头条要闻

牛弹琴:伊朗面临生死存亡关键时刻 信号已经很明显了

头条要闻

牛弹琴:伊朗面临生死存亡关键时刻 信号已经很明显了

体育要闻

球队主力全报销?顶风摆烂演都不演了

娱乐要闻

疑似王一博被爆私密聊天记录

财经要闻

沈明高提共富建议 百姓持科技股国家兜底

汽车要闻

岚图泰山黑武士版3月上市 搭载华为四激光智驾方案

态度原创

教育
时尚
手机
亲子
数码

教育要闻

忍无可忍!中国数学会发布声明,很多孩子参加的竞赛可能是白忙活

被章若楠、秦岚带火的鞋子竟然是它?春天这样穿又美又气质!

手机要闻

谷歌Pixel 11跑分遭曝 Tensor G6性能又拉了

亲子要闻

生孩子如同走一趟“鬼门关”?产床旁的一面墙,揭开生育的遮羞布

数码要闻

联想后续将推出Ultra 5 338H版ThinkBook 14+/16+笔记本电脑

无障碍浏览 进入关怀版