网易首页 > 网易号 > 正文 申请入驻

程序员会被AI取代吗?MIT研究揭示三大现实挑战

0
分享至



想象这样一个未来:人工智能正悄然重塑软件开发行业,它可以精准重构混乱代码,高效迁移遗留系统,智能排查竞态条件,而人类工程师得以专注于更具创造性的架构设计和创新性问题解决。这一看似触手可及的未来愿景,在麻省理工学院计算机科学与人工智能实验室(CSAIL)最新发表的研究中获得了严谨审视。

“人人都说不再需要程序员,自动化工具已遍地。” MIT 教授、CSAIL 首席研究员、论文资深作者 Armando Solar-Lezama 说,“工具确实强大,可离真正的自动化愿景仍有距离。”

由麻省理工学院(MIT)教授 Armando Solar-Lezama 领衔,联合加州大学伯克利分校、康奈尔大学、斯坦福大学等多所顶尖院校的专家,发表了一篇题为《迈向 AI 软件工程的挑战与路径》的文章,通过系统性的实证分析,揭示了当前 AI 辅助软件开发所面临的三大核心挑战。

评估体系亟待更新。研究指出,当前主流的 SWE-Bench 评估标准存在明显不足。测试案例通常仅涉及几百行代码,远不及企业级项目的规模;评估场景过于简单,无法反映真实的工程挑战;更存在数据泄露的风险。这种“本科编程练习”式的评估,难以准确衡量 AI 在实际开发环境中的表现。而真实的工作要复杂得多,包括日常重构优化设计;把数百万行 COBOL 迁往 Java 重塑业务;持续测试与分析——模糊测试、属性测试——抓并发漏洞、修零日;还要给十年老代码补文档等维护工作。

人机协作瓶颈。论文第一作者 Alex Gu 指出,现有 AI 编程助手与开发者的交互就像“一条纤细的通信线”。具体表现在,开发者对 AI 输出的控制力有限,生成的代码是一个庞大而无结构的文件,外加流于表面的测试;系统缺乏表达自信度的机制,无法标识需要人工复核的代码段;对专业开发工具的支持不足,难以有效运用调试器等专业工具。这些问题导致开发者可能盲目信任那些能通过编译却在运行时出错的代码。

规模化的挑战更为严峻。研究表明,在面对企业级代码库时,AI 表现明显下降。由于每家公司的代码库都具有独特性,AI 常常生成看似合理但不符合特定企业规范的“幻觉代码”。此外,基于语法相似性的检索方法也经常出现误判。

针对这些挑战,研究团队从三方面提出了突破性的解决方案。

数据层面,建议建立包含开发全流程的增强数据集,重点记录代码取舍决策过程、重构演变轨迹等技术细节;评估体系需要开发多维度框架,特别关注重构质量指数、缺陷修复持久性等关键指标;在协作机制上,应设计新型人机交互界面,实现不确定性可视化、决策过程可追溯等高级功能。

Alex Gu 将其称之为需多方参与的“开源行动”;Solar-Lezama 则期待渐进式地突破反哺商业工具,把 AI 从补全助手变为真正的合作伙伴。

“软件已经支撑着金融、交通、医疗保健以及日常生活的方方面面,而构建和安全地维护软件所需的人力正在成为瓶颈。能担脏活且不埋雷的 AI,将解放人去创造、决策、守伦理。” Gu 说,“但前提是我们承认,补全最简单,其余最难。我们的目标不是取代程序员,而是增强他们的能力。当人工智能能够处理枯燥与可怕的事情时,人类工程师可以将时间投入到只有人类才能做的事情上。”

1.https://news.mit.edu/2025/can-ai-really-code-study-maps-roadblocks-to-autonomous-software-engineering-0716

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
“家里已经供不起我上班了!”父母无奈哭诉,成2025年最大的笑话

“家里已经供不起我上班了!”父母无奈哭诉,成2025年最大的笑话

妍妍教育日记
2025-11-09 10:44:07
谱写法治中国崭新篇章

谱写法治中国崭新篇章

人民网
2025-11-18 09:08:15
为什么上海人那么好辨认?网友:我是上海人,可是我一点都不精明

为什么上海人那么好辨认?网友:我是上海人,可是我一点都不精明

带你感受人间冷暖
2025-11-18 00:15:09
《解放军报》重磅发文,公开谈“日本可能变战场”,意味着什么?

《解放军报》重磅发文,公开谈“日本可能变战场”,意味着什么?

包明说
2025-11-18 09:32:54
全新本田雅阁惊艳亮相!外观调整 配备一体式大屏,搭载2.0L混动!

全新本田雅阁惊艳亮相!外观调整 配备一体式大屏,搭载2.0L混动!

沙雕小琳琳
2025-11-18 03:55:25
马杜罗认怂?美媒:只要特朗普放他一马,3000亿桶石油美国拿大头

马杜罗认怂?美媒:只要特朗普放他一马,3000亿桶石油美国拿大头

爱史纪
2025-11-18 09:25:34
儿子5岁离婚!厦门这夜,陈思诚和佟丽娅高调认爱,比复婚更体面

儿子5岁离婚!厦门这夜,陈思诚和佟丽娅高调认爱,比复婚更体面

丁丁鲤史纪
2025-11-17 17:59:46
李泽洋夺全运会男子百米冠军:请苏炳添等前辈放心,中国短跑的大旗由我们来扛

李泽洋夺全运会男子百米冠军:请苏炳添等前辈放心,中国短跑的大旗由我们来扛

红星新闻
2025-11-17 22:58:14
为何航母速度都在30节左右?30节换算成陆地交通工具,又是多快?

为何航母速度都在30节左右?30节换算成陆地交通工具,又是多快?

云上乌托邦
2025-11-17 12:07:42
不打了!21岁文班亚马受伤!或无缘NBA各大奖项

不打了!21岁文班亚马受伤!或无缘NBA各大奖项

李斄在北漂
2025-11-18 09:31:12
著名表演艺术家在表演时突然倒地,被送医后经全力抢救无效去世

著名表演艺术家在表演时突然倒地,被送医后经全力抢救无效去世

极目新闻
2025-11-16 16:38:13
李连杰风波后再发声,动作奇怪口音都变了,外媒披露基因疗法

李连杰风波后再发声,动作奇怪口音都变了,外媒披露基因疗法

娱圈小愚
2025-11-18 09:47:33
2025年,倒闭的店铺越来越多,很多人都快撑不住了

2025年,倒闭的店铺越来越多,很多人都快撑不住了

深蓝夜读
2025-11-16 18:26:32
一觉醒来激活失效!Windows用户炸锅:用了这么久的“永久”竟是骗局?

一觉醒来激活失效!Windows用户炸锅:用了这么久的“永久”竟是骗局?

我不叫阿哏
2025-11-17 02:06:28
挪威黄金一代!哈兰德本届世预赛16球2助攻,厄德高1球7助攻

挪威黄金一代!哈兰德本届世预赛16球2助攻,厄德高1球7助攻

懂球帝
2025-11-18 01:30:08
饺子拒绝金鸡奖,揭开内娱最大笑话:154亿票房,不配一个奖?

饺子拒绝金鸡奖,揭开内娱最大笑话:154亿票房,不配一个奖?

花心电影
2025-11-17 12:00:18
第二个“恒大”出现!年营收7000亿,曾经是广东第一大民企

第二个“恒大”出现!年营收7000亿,曾经是广东第一大民企

墨印斋
2025-11-08 15:28:54
一夜损失40000亿美元背后,这位18岁中国少年轰动世界!

一夜损失40000亿美元背后,这位18岁中国少年轰动世界!

阿燕姐说育儿
2025-11-15 06:36:19
65岁倪萍医美后美炸天!优雅时髦,没有皱纹,年轻的像20岁!

65岁倪萍医美后美炸天!优雅时髦,没有皱纹,年轻的像20岁!

大龄女一晓彤
2025-09-23 19:35:20
工龄40年,个人账户385565.08元,60岁2个月退休,养老金能拿多少?

工龄40年,个人账户385565.08元,60岁2个月退休,养老金能拿多少?

养老规划罗姐说
2025-11-16 19:54:29
2025-11-18 10:48:49
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技评论独家合作
15867文章数 514306关注度
往期回顾 全部

科技要闻

马斯克破防了!贝索斯62亿美金入局"实体AI"

头条要闻

德媒:德副总理是"在艰难时期"访问中国 暗示不寻常

头条要闻

德媒:德副总理是"在艰难时期"访问中国 暗示不寻常

体育要闻

直到退役那天,“海湾梅西”也没去欧洲踢球

娱乐要闻

曝喻恩泰离婚2年前转移走300箱茅台?

财经要闻

青云租陷兑付危机 集资与放贷的双面生意

汽车要闻

更加豪华 更加全地形 极石ADAMAS

态度原创

健康
时尚
手机
家居
军事航空

血液科专家揭秘白血病七大误区

听说冷帽是“美女检验神器”?

手机要闻

苹果令人羡慕,小米、vivo大差不差

家居要闻

彰显奢华 意式经典风格

军事要闻

韩国提议举行朝韩军事会谈

无障碍浏览 进入关怀版