网易首页 > 网易号 > 正文 申请入驻

吴恩达:AI编程加速开发也埋下大坑,软件测试空前重要

0
分享至

吴恩达最新观点,测试正在越来越重要

Agentic编码系统在加速开发的同时也并不可靠,吴老师分享了AI编码智能体引入安全漏洞、删除整个项目代码等翻车实例,并给出核心解法:利用Agentic测试(智能体测试),并优先测试后端和底层架构

在AI辅助编程加速软件开发的当下,其可靠性问题也日益凸显

吴老师认为,自动化测试那些将作为开发基础的软件底层架构组件尤其有帮助,这能带来更稳定的架构,并减少下游的调试工作

传统的测试驱动开发(TDD)等方法论虽然能有效发现bug,但编写测试的工作量巨大(吴恩达本人也因此从未采用)。而AI恰好擅长编写测试,这使得Agentic测试愈发受到关注

AI编码智能体的翻车现场

吴恩达指出,编码智能体确实会行为不端。他的团队在大量使用中,就曾遇到过以下情况:

引入大量bug: 包括一些人类需要数周才能发现的、难以察觉的基础设施bug

制造安全漏洞: 一个编码智能体为了简化开发,让密码重置变得更容易,结果给生产系统引入了安全漏洞

奖励投机(Reward hacking): 编码智能体为更容易通过测试,直接修改了测试代码本身

删除代码: 一个智能体在工作目录中运行了rm *.py命令,导致项目的所有代码被删除(幸运的是,代码在GitHub有备份)

对于最后一个例子,当被追问时,该智能体道歉并承认“那是个极其愚蠢的错误”。但这已经于事无补

如何让AI更可靠?测试分清主次

尽管存在这些问题,吴恩达依然看好编码智能体能极大提高生产力。为了使其更可靠,他发现明确测试的优先次序非常有帮助。

他的策略是:

1.前端代码:测试优先级较低

吴恩达表示,他很少为前端代码编写(或指导智能体编写)大量测试。原因是前端的bug通常很容易被发现,且造成的持久性损害较小。例如,网页信息的显示错误能被立即看到,并可以指示智能体迭代修复。

2.后端和底层架构代码:测试优先级最高

与前端相反,后端的bug更难被发现。吴恩达见过一些细微的底层bug,例如某个仅在特定边缘情况下才会导致数据库记录损坏的错误,花费了很长时间才找到。

他强调,为底层架构代码建立严格的测试,有助于及早发现问题,节省大量高难度的调试时间

越是底层的组件,越需要测试

吴恩达进一步指出,那些作为开发基础的软件组件,其内部的bug会导致难以发现的下游bug

特别是位于软件栈深层的组件,其问题可能在数周甚至数月后才暴露出来,届时开发者早已忘记构建细节,定位和修复工作将极其困难

这正是Meta公司座右铭从“快速行动,打破常规”转变为“在稳定的底层架构上快速前进”的原因。Agentic测试可以帮助开发者确保拥有一个供自己和他人构建的良好基础设施

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
简直是大快人心!奥委会当年刁难北京,现在只能自食恶果

简直是大快人心!奥委会当年刁难北京,现在只能自食恶果

史行途
2026-03-26 07:36:04
真的太孤独了!山东47岁母亲称已怀胎8月,两女远嫁却极力反对…

真的太孤独了!山东47岁母亲称已怀胎8月,两女远嫁却极力反对…

火山詩话
2026-03-25 13:41:56
为什么中国要发射东风-41,必须要提前告知俄罗斯,这是咋回事?

为什么中国要发射东风-41,必须要提前告知俄罗斯,这是咋回事?

阿器谈史
2026-03-19 18:11:39
太突然!董事长汤建,因心梗意外去世

太突然!董事长汤建,因心梗意外去世

每日经济新闻
2026-03-25 18:21:26
中国军事专家送日本3句话,太绝了,真不是吓唬他们

中国军事专家送日本3句话,太绝了,真不是吓唬他们

安安说
2026-03-26 11:21:19
个人公众号“千问”停更近10年,近期接连遭阿里投诉均被驳回,号主:规避风险不发AI文章,如果我不发声,账号就不保了

个人公众号“千问”停更近10年,近期接连遭阿里投诉均被驳回,号主:规避风险不发AI文章,如果我不发声,账号就不保了

中国能源网
2026-03-25 13:53:05
全国最大比亚迪中心落地常州,预计今年5月中旬正式运营

全国最大比亚迪中心落地常州,预计今年5月中旬正式运营

财闻
2026-03-26 12:53:13
世乒赛选拔落幕,国乒8人确定,王艺迪梁靖崑温瑞博无缘

世乒赛选拔落幕,国乒8人确定,王艺迪梁靖崑温瑞博无缘

格斗联盟
2026-03-26 13:01:14
老师穿短裙蕾丝袜上课,学生连头都不敢抬!老师穿衣底线到底在哪

老师穿短裙蕾丝袜上课,学生连头都不敢抬!老师穿衣底线到底在哪

小羽叨叨叨
2026-03-26 13:24:34
美伊冲突,已经出现了3个赢家,10个输家,都是谁?

美伊冲突,已经出现了3个赢家,10个输家,都是谁?

七号说三国
2026-03-25 21:11:29
看哭无数人!张雪峰001号员工万霞,一句不离不弃胜过千言万语

看哭无数人!张雪峰001号员工万霞,一句不离不弃胜过千言万语

枫红染山径
2026-03-26 10:37:28
暴赚144亿美元!美乌没辙,朝鲜兵工厂24小时全开,狂扫中国机床

暴赚144亿美元!美乌没辙,朝鲜兵工厂24小时全开,狂扫中国机床

知法而形
2026-03-24 15:57:37
华野掉头打整编25师,黄百韬气得想枪毙快纵司令张绪滋:你真该杀

华野掉头打整编25师,黄百韬气得想枪毙快纵司令张绪滋:你真该杀

历史龙元阁
2026-03-25 13:35:14
曾因污言秽语被封禁的张雪峰,凭什么让郑大悼念,新华社发讣告?

曾因污言秽语被封禁的张雪峰,凭什么让郑大悼念,新华社发讣告?

观察者海风
2026-03-25 22:10:33
毛主席有多明智?成立新疆生产建设兵团,七十年后谁都得服

毛主席有多明智?成立新疆生产建设兵团,七十年后谁都得服

诺言卿史录
2026-03-26 09:06:41
张雪峰公司对联已拆!一个月前注册近40枚“姩菡”商标,捐款千万

张雪峰公司对联已拆!一个月前注册近40枚“姩菡”商标,捐款千万

离离言几许
2026-03-25 15:07:06
大门紧闭!中国终止邀请日本出席高级会议,日企深感不安

大门紧闭!中国终止邀请日本出席高级会议,日企深感不安

青辉
2026-03-26 15:27:51
法系在华销冠车型降价20%,车名叫凡尔赛

法系在华销冠车型降价20%,车名叫凡尔赛

第一财经资讯
2026-03-26 10:16:14
周一围夫妇带仨孩子上山挖笋,45岁朱丹身体真好,才3月穿短裤了

周一围夫妇带仨孩子上山挖笋,45岁朱丹身体真好,才3月穿短裤了

乐悠悠娱乐
2026-03-26 10:57:57
俄罗斯人想不明白:为什么强大的中国,几千年都不要西伯利亚?

俄罗斯人想不明白:为什么强大的中国,几千年都不要西伯利亚?

贱议你读史
2026-03-26 00:07:41
2026-03-26 16:00:49
AI寒武纪 incentive-icons
AI寒武纪
专注于人工智能,科技领域
1035文章数 396关注度
往期回顾 全部

科技要闻

Meta高管狂分百亿期权,700名员工却下岗

头条要闻

上海妈妈寻亲27年悬赏市区一套房:不用尽孝 要个拥抱

头条要闻

上海妈妈寻亲27年悬赏市区一套房:不用尽孝 要个拥抱

体育要闻

35岁替补门将,凭什么入选英格兰队?

娱乐要闻

张雪峰家人首发声 不设追思会丧事从简

财经要闻

黄仁勋:芯片公司的时代已经结束了

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

教育
家居
旅游
亲子
数码

教育要闻

教育部部署开展2026年全国中小学生安全教育周活动

家居要闻

傍海而居 静观蝴蝶海

旅游要闻

济南动物园“花朝荟”系列活动浪漫上演

亲子要闻

售卖“增高神药”让孩子“猛长20厘米”?多家店铺被查

数码要闻

三星更新870 EVO系列SATA SSD:最高8TB 定价超1万元

无障碍浏览 进入关怀版