网易首页 > 网易号 > 正文 申请入驻

Netflix、Meta和IBM专家:AI让任何人成为10倍程序员

0
分享至


AI很容易使用,但并不像对着Alexa说"给我做个电商网站"那样简单。而且,在指令循环中添加"不要产生幻觉"也于事无补。

更重要的是,根据在北卡罗来纳州达勒姆举行的全AI大会上来自IBM、Meta和Netflix等公司演讲者的观点,最佳的AI效果需要充分准备的智能体。

他们建议,你越想让AI为你服务,就需要做越多的准备工作。

许多演讲都提到了杰文斯悖论,即资源越高效,使用得越多。这个悖论常被用来解释为什么AI不会抢走所有人的工作。相反,论点是它将创造更多工作机会。

目前,AI确实为用户创造了更多工作,需要时间准备上下文和检查结果。Claude能让任何人成为10倍程序员,但他们需要清理10倍的结果。

或者用最末日的说法,在奇点能够像《黑客帝国》中那样将人类奴役为能量舱之前,它需要我们这些血肉之躯的一些协助。

魔法师的学徒

AI是如何让Netflix的员工忙碌起来的?在一次演讲中,Netflix UI架构师Ben Ilegbodu解释说,一旦你创建一个智能体来自动化某项任务,你就需要第二个智能体来评估完成的工作。

Ilegbodu有时甚至将工作分解为多个专门负责代码审查不同部分的智能体。他称这种方法为"对抗性代码审查"。

他说,你还需要第三个智能体来协调前两个智能体之间的行动。

Ilegbodu的工作日是杰文斯悖论的化身。一旦他启动一个智能体来实现某个新功能,他就会让另一个智能体为他心中的下一个任务做前期工作。实际上,他是在"并行化自己,让工作始终在进行"。

AI让Ilegbodu能够用他还不知道的语言编程,比如Python、Bash和Groovy。

但他承认,这种上下文切换会让人疲惫。"一天结束时,我实际上有点累,因为我实际上花了一整天时间和某个东西对话。"

贪婪的实习生

许多程序员把AI看作团队中一个热情但天真的初级开发人员。但与初级开发人员不同,AI不会"不知所措",Meta开发者倡导者Justin Jeffress在演讲中说。

你可以不断向AI提供更多信息,它会全盘接受(只要你能承担得起那么多Token)。

这种无底洞般的饥渴导致了Jeffress所说的"上下文腐败"。

他说:"随着时间推移,当你与AI智能体互动时,它需要计算的东西越多来提供答案,争夺其注意力的东西就越多,做正确事情的可能性就越小。"

他告诉观众,模糊的指令会导致分散的结果。清楚地思考你给智能体提供什么信息是上下文工程的工作,在智能体AI的短暂时间里,这已经成为一种艺术形式,即使还不是一门正规学科。

在上下文工程中,"你正在构建一套规则、工具、技能和其他东西,AI智能体在需要时可以参考这些来解决问题",他说。他甚至建议更进一步使用"提示链",或逐步列出它需要执行的具体任务。开始时做更多工作意味着运行时担心更少,让开发人员可以抽身去喝一杯。

开玩笑的。这给了他们时间通过并行运行多个智能体来进一步完善流程。成为你自己智能体乐团的指挥,Jeffress说。还要确保创建一个markdown文件来跟踪进度,帮助智能体不忘记其使命。

Jeffress注意到AI通常可以完成给定工作的80%,剩下的20%需要人类完成。当Jeffress处理剩余20%的工作时,他发现其中80%的工作可以由机器人完成。如此循环,就像某种永无止境清理任务的分形帕累托原理。

一厢情愿的提示

AI没有完全按照你的要求做并不是AI的问题。这是你缺乏"分解"技能的问题,IBM语言和多模态技术总监Luis Lastras在演讲中提出。

一厢情愿的提示就是输入"我必须坚持,不要产生幻觉。我的职业生涯取决于此,拜托,拜托,拜托。"这就像施法并希望它能奏效,他说。

相反,开发人员应该思考如何将工作分解为更小、更易消化的部分供智能体处理。

他说,这种"分解"实际上是工程学101。它是"将一个非常复杂的系统分解、识别关键组成部分、模块化它们,然后设计这些东西,甚至指派专家来设计这些部分的艺术。"

当你构建智能体时,不要只是随机向大语言模型抛出信息,而要定义具体的函数来帮助智能体执行任务。IBM最近发布的mellea.ai是Lastras所说关键模式的开源库——给大语言模型具体Python编码指令的函数。它们可用于向大语言模型调用添加要求、检测有害输出、在架构中结构化输出等。

蓝色巨人还在开发智能体为专门任务切换大语言模型或"切换大脑"的能力,Lastras说。在其研究中,IBM发现给予更多推理时间的较小领域特定模型将超越更大的模型。

支付准备税

"隐含假设是技术债务",Intuit高级开发人员Justin Chau进一步解释。对我们来说显而易见的事情对机器来说可能并不明显。"我们必须非常非常具体地说明我们想要什么结果。"

Chau的一个建议:给你的智能体约束,而不是指令。如果大语言模型找到它认为更好的完成任务的方法,它会忽视指令。约束是硬性拒绝,AI大脑更难忽视。如果你告诉智能体在任何情况下都不应该使用HTML,那么它会遵守这个要求。

但比约束更强的是缺乏权限。"如果我不给它访问GitHub的权限,我确信它永远不会碰GitHub,"Chau说。

《银河系漫游指南》的爱好者会记住"深度思考"的悖论,这是世界上最强大的计算机。像AI本身一样,深度思考被建造来提供生命、宇宙和一切的答案。但经过几个世纪的计算,它只给出了神秘的答案(42),然后人类需要一台更大的计算机来弄清楚真正的问题是什么。

也许,有了AI,我们发现自己身处亚当斯的世界。AI远未为我们完成所有工作,而是让我们走上了无尽准备的道路。

Q&A

Q1:什么是对抗性代码审查?

A:对抗性代码审查是Netflix UI架构师Ben Ilegbodu提出的方法,即将代码审查工作分解为多个专门负责不同部分的智能体,让它们相互配合完成代码审查任务,提高审查质量和效率。

Q2:什么是上下文腐败?如何避免?

A:上下文腐败是指随着与AI智能体互动时间延长,它需要处理的信息越来越多,导致注意力分散,做正确事情的可能性降低。可以通过上下文工程、明确指令、使用提示链等方法来避免。

Q3:mellea.ai是什么?有什么作用?

A:mellea.ai是IBM发布的开源库,包含给大语言模型具体Python编码指令的关键模式函数。它可以用于向大语言模型调用添加要求、检测有害输出、在架构中结构化输出等,帮助开发人员更好地构建和控制AI智能体。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
彭伟国:33岁退役,坐宝马开酒楼,财富自由,每天在约球和找美食

彭伟国:33岁退役,坐宝马开酒楼,财富自由,每天在约球和找美食

白面书誏
2026-04-08 13:59:47
孔德:次回合以11人应战的巴萨能在场上压制马竞,打进三个球

孔德:次回合以11人应战的巴萨能在场上压制马竞,打进三个球

懂球帝
2026-04-09 07:45:07
女子回应“汉堡自助吃太多被拒绝接待”:不接受道歉,更不要赔偿 涉事店铺去年被列为经营异常

女子回应“汉堡自助吃太多被拒绝接待”:不接受道歉,更不要赔偿 涉事店铺去年被列为经营异常

红星新闻
2026-04-08 19:52:16
《楚乔传》续集首波口碑出炉了!观众的打分评价都“一针见血”

《楚乔传》续集首波口碑出炉了!观众的打分评价都“一针见血”

星宿影视鸭
2026-04-08 14:49:27
巴黎2-0利物浦!法国球队创14年神迹,红军被打回原形?

巴黎2-0利物浦!法国球队创14年神迹,红军被打回原形?

阿晞体育
2026-04-09 07:25:01
阿不都18+10+9!新疆加时逆转天津结束4连败 齐麟25+7爆发

阿不都18+10+9!新疆加时逆转天津结束4连败 齐麟25+7爆发

醉卧浮生
2026-04-08 22:08:38
王辅一将军逝世,生前被誉为“军史活辞典”

王辅一将军逝世,生前被誉为“军史活辞典”

澎湃新闻
2026-04-08 22:32:27
特朗普是个什么样的人,这篇文章分析得很透彻

特朗普是个什么样的人,这篇文章分析得很透彻

我是健康专家
2026-04-07 08:43:05
消失9年,芙蓉姐姐近况曝光:病中探望老友,衣着朴素身价过亿

消失9年,芙蓉姐姐近况曝光:病中探望老友,衣着朴素身价过亿

可爱小菜
2026-04-08 14:47:21
恶心的一幕发生,银行卡被冻结、被执行55万元,王思聪做得好

恶心的一幕发生,银行卡被冻结、被执行55万元,王思聪做得好

观察鉴娱
2026-04-08 09:39:33
停火、谈判、通航,“最后期限”之际的伊朗战事最新进展

停火、谈判、通航,“最后期限”之际的伊朗战事最新进展

极目新闻
2026-04-08 08:36:22
里夫斯打完湖人生涯最后一战?年薪谈判区间曝光 不排除先签后换

里夫斯打完湖人生涯最后一战?年薪谈判区间曝光 不排除先签后换

罗说NBA
2026-04-09 05:11:35
美伊停火的关键斡旋者:与特朗普私交甚好的巴基斯坦陆军元帅

美伊停火的关键斡旋者:与特朗普私交甚好的巴基斯坦陆军元帅

红星新闻
2026-04-08 18:56:17
加州最高法院下令:禁止调查选票欺诈

加州最高法院下令:禁止调查选票欺诈

大洛杉矶LA
2026-04-09 06:00:21
金高银为搭戏00后小生,每月跑皮肤科还背Z世代黑话

金高银为搭戏00后小生,每月跑皮肤科还背Z世代黑话

娱圈观察员
2026-04-08 10:06:00
拿600万,罚球4中2,上场11分钟输17分,球迷:你的顶薪该广东出

拿600万,罚球4中2,上场11分钟输17分,球迷:你的顶薪该广东出

弄月公子
2026-04-08 23:54:31
陈光标又闹笑话了,火速删掉博文!

陈光标又闹笑话了,火速删掉博文!

葱哥说
2026-04-08 13:12:40
没有这种食物,你的肌肉将消失!医生:60岁后恢复肌力的7种食物

没有这种食物,你的肌肉将消失!医生:60岁后恢复肌力的7种食物

健康之光
2026-01-04 09:31:45
极有可能万斯会当上总统!对全世界都不是什么好事!因为万斯年轻

极有可能万斯会当上总统!对全世界都不是什么好事!因为万斯年轻

西楼知趣杂谈
2026-04-08 09:49:23
广东逆行堵路 "路霸" 后续,硬刚交警下场很惨,处罚结果大快人心

广东逆行堵路 "路霸" 后续,硬刚交警下场很惨,处罚结果大快人心

十九妹
2026-04-09 03:08:46
2026-04-09 08:19:00
至顶AI实验室 incentive-icons
至顶AI实验室
一个专注于探索生成式AI前沿技术及其应用的实验室。
3076文章数 169关注度
往期回顾 全部

科技要闻

吴泳铭成立阿里技术委员会 为何这四人入选

头条要闻

特朗普称"彻底胜利" 美媒:目标一个没实现还陷入困境

头条要闻

特朗普称"彻底胜利" 美媒:目标一个没实现还陷入困境

体育要闻

40岁,但实力倒退12年

娱乐要闻

侯佩岑全家悉尼度假,一家四口幸福满溢

财经要闻

谁骗了董宇辉?

汽车要闻

20万级满配华为全家桶 华境S是懂家庭的大六座

态度原创

时尚
亲子
本地
家居
数码

50岁,我妈在恋综抢男人

亲子要闻

法国家人可丽饼吃上瘾,孩子排队学着做,老大手写记配方,有心了

本地新闻

跟着歌声游安徽,听古村回响

家居要闻

自在恣意 侘寂风别墅

数码要闻

SK海力士开始供应321层QLC NAND cSSD:最高可选2TB

无障碍浏览 进入关怀版