网易首页 > 网易号 > 正文 申请入驻

性能提升在即!吴恩达谈 LLM 新方向:优化智能体工作流

0
分享至

来源:学术头条

翻译:阮文韵

https://www.deeplearning.ai/the-batch/issue-275/

【编者按】从为用户提供优质问答体验,到如今逐渐朝着适应智能体(agent)工作流优化发展,大语言模型(LLMs)正经历着深刻的变革。

日前,美国计算机科学家、斯坦福大学计算机科学系和电子工程系副教授、DeepLearning AI 创始人吴恩达(Andrew Ng)深入剖析了这一转变趋势并分享了他关于智能体性能提升前景的见解。

在博客中,他描述了当前 LLMs 发展的新趋势,指出 LLMs 在智能体工作中的多样应用场景以及开发人员在不同应对策略下的具体实践情况,并对智能体未来发展做出了乐观展望。

学术头条在不改变原文大意的情况下,对发布内容做了简单的编译。内容如下:

亲爱的朋友们:

大语言模型(LLMs)通常是为回答人们的问题而优化的。但现在的趋势是,对模型进行优化也是为了适应智能体工作流。这将大大提高智能体性能!

继 ChatGPT 在回答问题方面取得巨大成功之后,大量 LLMs 的开发都集中在提供良好的消费者体验上。因此,LLMs 被微调为回答问题(“莎士比亚为什么写《麦克白》?”)或遵循人类提供的指令(“解释莎士比亚为什么写《麦克白》”)。大部分用于指令微调的数据集都会引导模型为人类编写的问题和指令提供更有帮助的回答,这些问题和指令就是人们可能会向面向消费者的 LLMs 提出的问题和指令,比如 ChatGPT、Claude 或 Gemini 的网络接口所提供的问题和指令。

但是,智能体工作负载需要不同的行为。人工智能软件不是直接为消费者生成响应,而是在迭代工作流中使用模型来反思自己的输出、使用工具、编写计划,并在多智能体环境中进行协作。主要的模型制造商也在不断优化模型,以便用于 AI 智能体。

以工具使用(或函数调用)为例。如果向 LLMs 询问当前的天气情况,它无法从训练数据中获得所需的信息。相反,它可能会生成一个 API 调用请求来获取该信息。甚至在 GPT-4 原生支持函数调用之前,应用程序开发人员就已经在使用 LLMs 生成函数调用了,不过是通过编写更复杂的提示(如 ReAct 提示的变体),告诉 LLMs 有哪些函数可用,然后让 LLMs 生成一个字符串,由单独的软件例程进行解析(或许使用正则表达式),以确定是否要调用某个函数。

在 GPT-4 之后,生成此类调用变得更加可靠,随后许多其他机型也原生支持函数调用。如今,LLMs 可以决定调用函数来搜索用于检索增强生成(RAG)的信息、执行代码、发送电子邮件、在线下订单等。

最近,Anthropic 发布了一个能够在计算机上使用的模型版本,它可以使用鼠标点击和击键来操作计算机(通常是虚拟机)。我很喜欢玩这个演示。虽然其他团队一直在促使 LLMs 使用计算机来构建新一代 RPA(机器人流程自动化)应用,但一家主要 LLMs 提供商对 computer use 的原生支持是向前迈出的一大步。这将对许多开发人员有所帮助!

随着智能体工作流的成熟,我看到了以下几点:

  • 首先,许多开发人员正在提示 LLMs 执行他们想要的智能体行为。这样可以进行快速、丰富的探索!

  • 在数量少得多的情况下,那些正在开发非常有价值应用的开发人员会对 LLMs 进行微调,以便更可靠地执行特定的智能体功能。例如,尽管许多 LLMs 本机支持函数调用,但它们是将可用函数的描述作为输入,然后(希望)生成输出 tokens 来请求正确的函数调用。对于关键任务应用程序来说,生成正确的函数调用非常重要,针对应用程序的特定函数调用微调模型可显著提高可靠性。(但请避免过早优化!如今,我仍然看到很多团队在进行微调时,可能应该先花更多时间进行提示,然后再采取这种做法)。

  • 最后,当工具使用或 computer use 等能力对许多开发人员来说很有价值时,主要的 LLMs 提供商就会直接在其模型中构建这些能力。尽管 OpenAI o1-preview 的高级推理功能可以帮助消费者,但我预计它对智能体推理和规划的作用会更大。

大多数 LLMs 已针对回答问题进行了优化,主要是为了提供良好的消费者体验,我们已经能够将它们“嫁接”到复杂的智能体工作流中,以构建有价值的应用。为支持智能体中的特定操作而构建 LLMs 的趋势将大大提高智能体性能。我相信,在未来几年内,智能体性能将朝着这个方向大幅提升。

继续学习!

阅读最新前沿科技研究报告,欢迎访问欧米伽研究所的“未来知识库”

未来知识库是“ 欧米伽 未来研究所”建立的在线知识库平台,收藏的资料范围包括人工智能、脑科学、互联网、超级智能,数智大脑、能源、军事、经济、人类风险等等领域的前沿进展与未来趋势。目前拥有超过8000篇重要资料。每周更新不少于100篇世界范围最新研究资料。


截止到10月25日 ”未来知识库”精选的100部前沿科技趋势报告

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
狂赢27篮板,骑士4:3淘汰猛龙!哈登9中3砍18+6,阿伦22+19立大功

狂赢27篮板,骑士4:3淘汰猛龙!哈登9中3砍18+6,阿伦22+19立大功

梅亭谈
2026-05-04 10:51:08
1978年起陈云地位迅速上升,跨越多级“台阶”,背后原因何在

1978年起陈云地位迅速上升,跨越多级“台阶”,背后原因何在

鹤羽说个事
2026-04-30 22:47:23
涉事银行已成犯罪窝点,行长及相关人员必须以巨额盗窃罪立案

涉事银行已成犯罪窝点,行长及相关人员必须以巨额盗窃罪立案

阿振观点
2026-05-02 06:01:56
美国警告赖清德当局,只要大陆决定武力统一,台湾的结局只有一个

美国警告赖清德当局,只要大陆决定武力统一,台湾的结局只有一个

猫女的小树屋
2026-05-02 10:14:06
特朗普访华行程再变,中国有言在先,中美头等大事要一锤定音?

特朗普访华行程再变,中国有言在先,中美头等大事要一锤定音?

一家说
2026-05-04 10:43:42
90岁才明白:那些精神矍铄、活过百岁的老人,都在60岁后,戒掉了这两个“坏习惯”

90岁才明白:那些精神矍铄、活过百岁的老人,都在60岁后,戒掉了这两个“坏习惯”

心理观察局
2026-05-04 08:51:08
马克艾伦前妻高度赞赏吴宜泽:他的侵略性进攻打法对墨菲非常奏效

马克艾伦前妻高度赞赏吴宜泽:他的侵略性进攻打法对墨菲非常奏效

杨华评论
2026-05-04 08:00:41
耐人寻味!川大、武大两位校领导提前离任,均未到退休年龄

耐人寻味!川大、武大两位校领导提前离任,均未到退休年龄

百家论大学
2026-05-04 07:10:06
大伯老炫耀儿子是公务员,我就说自己年薪60w,是他的10倍!结果大伯说:你深圳挣60w正常!但要论生活质量,肯定还是我儿子高!

大伯老炫耀儿子是公务员,我就说自己年薪60w,是他的10倍!结果大伯说:你深圳挣60w正常!但要论生活质量,肯定还是我儿子高!

谭老师地理大课堂
2026-05-04 00:06:09
德国外长:伊朗应立即开放霍尔木兹海峡

德国外长:伊朗应立即开放霍尔木兹海峡

国际在线
2026-05-04 00:14:03
心梗去世的人越来越多?医生再次强调:宁可打打牌,也别做这6事

心梗去世的人越来越多?医生再次强调:宁可打打牌,也别做这6事

健康之光
2026-03-26 16:00:06
赛车出现机械故障 德比斯气愤挥拳退赛 张雪:所有品牌都有这问题

赛车出现机械故障 德比斯气愤挥拳退赛 张雪:所有品牌都有这问题

风过乡
2026-05-03 21:32:50
62年毛主席约谈陈云,22天后陈云向中央请假:今后不参加任何会议

62年毛主席约谈陈云,22天后陈云向中央请假:今后不参加任何会议

历史龙元阁
2026-05-04 08:50:12
根本想不到,伊朗真正的内鬼,根本不是人!给全世界敲响警钟

根本想不到,伊朗真正的内鬼,根本不是人!给全世界敲响警钟

快乐彼岸
2026-05-04 03:42:32
我胃癌切除了三分之二,以为能活十年,结果一年后癌细胞爬满腹腔

我胃癌切除了三分之二,以为能活十年,结果一年后癌细胞爬满腹腔

坠入二次元的海洋
2026-05-04 10:02:56
太离谱!华西医院五一放假引争议,被骂想休息别当医生,网友吵翻

太离谱!华西医院五一放假引争议,被骂想休息别当医生,网友吵翻

谭谈社会
2026-05-02 14:27:21
卡里克太神了!又一个梅努横空出世,曼联天才双红会一战成名

卡里克太神了!又一个梅努横空出世,曼联天才双红会一战成名

澜归序
2026-05-04 05:36:28
浪姐7:一副好牌打得稀烂?张月、王濛的差距,被李小冉一语道破

浪姐7:一副好牌打得稀烂?张月、王濛的差距,被李小冉一语道破

小椰的奶奶
2026-05-03 20:13:52
86年退伍回家,偷偷放走邻居媳妇,一月后接到部队电话:立刻归队

86年退伍回家,偷偷放走邻居媳妇,一月后接到部队电话:立刻归队

民间精选故事汇
2025-08-12 08:34:50
基因铁证撕碎韩国纯血神话!他们真正的老祖宗曝光,竟是一路杀光半岛土著的东南亚狠人

基因铁证撕碎韩国纯血神话!他们真正的老祖宗曝光,竟是一路杀光半岛土著的东南亚狠人

寄史言志
2026-04-30 18:39:55
2026-05-04 12:35:00
人工智能学家 incentive-icons
人工智能学家
人工智能领域权威媒体
4706文章数 37459关注度
往期回顾 全部

科技要闻

OpenAI“复活”了QQ宠物,网友直接玩疯

头条要闻

美军将在霍尔木兹海峡有重大行动 由特朗普亲自指示

头条要闻

美军将在霍尔木兹海峡有重大行动 由特朗普亲自指示

体育要闻

曼联3-2双杀利物浦!提前三轮锁定欧冠资格 梅努制胜

娱乐要闻

严浩翔新歌,父母离婚17年矛盾升级

财经要闻

魔幻的韩国股市,父母给婴儿开户买股票

汽车要闻

同比大涨190% 方程豹4月销量29138台

态度原创

教育
数码
时尚
亲子
房产

教育要闻

高中双休不是放假,是“自律能力”的终极试金石

数码要闻

家用路由器市场变天,华为第一,小米第二

快看!!这个女演员近日暴瘦!!哦,知道了……

亲子要闻

健康孩子的6个特征,宝妈必看

房产要闻

五一楼市彻底明牌!塔尖人群都在重仓凯旋新世界

无障碍浏览 进入关怀版