网易首页 > 网易号 > 正文 申请入驻

程序员会被AI取代吗?MIT研究揭示三大现实挑战

0
分享至

想象这样一个未来:人工智能正悄然重塑软件开发行业,它可以精准重构混乱代码,高效迁移遗留系统,智能排查竞态条件,而人类工程师得以专注于更具创造性的架构设计和创新性问题解决。这一看似触手可及的未来愿景,在麻省理工学院计算机科学与人工智能实验室(CSAIL)最新发表的研究中获得了严谨审视。

“人人都说不再需要程序员,自动化工具已遍地。” MIT 教授、CSAIL 首席研究员、论文资深作者 Armando Solar-Lezama 说,“工具确实强大,可离真正的自动化愿景仍有距离。”

由麻省理工学院(MIT)教授 Armando Solar-Lezama 领衔,联合加州大学伯克利分校、康奈尔大学、斯坦福大学等多所顶尖院校的专家,发表了一篇题为《迈向 AI 软件工程的挑战与路径》的文章,通过系统性的实证分析,揭示了当前 AI 辅助软件开发所面临的三大核心挑战。

评估体系亟待更新。研究指出,当前主流的 SWE-Bench 评估标准存在明显不足。测试案例通常仅涉及几百行代码,远不及企业级项目的规模;评估场景过于简单,无法反映真实的工程挑战;更存在数据泄露的风险。这种“本科编程练习”式的评估,难以准确衡量 AI 在实际开发环境中的表现。而真实的工作要复杂得多,包括日常重构优化设计;把数百万行 COBOL 迁往 Java 重塑业务;持续测试与分析——模糊测试、属性测试——抓并发漏洞、修零日;还要给十年老代码补文档等维护工作。

人机协作瓶颈。论文第一作者 Alex Gu 指出,现有 AI 编程助手与开发者的交互就像“一条纤细的通信线”。具体表现在,开发者对 AI 输出的控制力有限,生成的代码是一个庞大而无结构的文件,外加流于表面的测试;系统缺乏表达自信度的机制,无法标识需要人工复核的代码段;对专业开发工具的支持不足,难以有效运用调试器等专业工具。这些问题导致开发者可能盲目信任那些能通过编译却在运行时出错的代码。

规模化的挑战更为严峻。研究表明,在面对企业级代码库时,AI 表现明显下降。由于每家公司的代码库都具有独特性,AI 常常生成看似合理但不符合特定企业规范的“幻觉代码”。此外,基于语法相似性的检索方法也经常出现误判。

针对这些挑战,研究团队从三方面提出了突破性的解决方案。

数据层面,建议建立包含开发全流程的增强数据集,重点记录代码取舍决策过程、重构演变轨迹等技术细节;评估体系需要开发多维度框架,特别关注重构质量指数、缺陷修复持久性等关键指标;在协作机制上,应设计新型人机交互界面,实现不确定性可视化、决策过程可追溯等高级功能。

Alex Gu 将其称之为需多方参与的“开源行动”;Solar-Lezama 则期待渐进式地突破反哺商业工具,把 AI 从补全助手变为真正的合作伙伴。

“软件已经支撑着金融、交通、医疗保健以及日常生活的方方面面,而构建和安全地维护软件所需的人力正在成为瓶颈。能担脏活且不埋雷的 AI,将解放人去创造、决策、守伦理。” Gu 说,“但前提是我们承认,补全最简单,其余最难。我们的目标不是取代程序员,而是增强他们的能力。当人工智能能够处理枯燥与可怕的事情时,人类工程师可以将时间投入到只有人类才能做的事情上。”

1.https://news.mit.edu/2025/can-ai-really-code-study-maps-roadblocks-to-autonomous-software-engineering-0716

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
我想过Sora会死,但没想到这么快。

我想过Sora会死,但没想到这么快。

差评XPIN
2026-03-26 00:04:51
网友分享细思恐极事件,呼吁大家相信直觉!

网友分享细思恐极事件,呼吁大家相信直觉!

特约前排观众
2026-03-23 00:10:06
闹大了!美军东太平洋再开火!打爆44艘运输船,150人被打死!

闹大了!美军东太平洋再开火!打爆44艘运输船,150人被打死!

爱吃醋的猫咪
2026-03-25 20:19:15
终于有了结果,曾医生能保住医院的工作,最应该感谢的三位贵人!

终于有了结果,曾医生能保住医院的工作,最应该感谢的三位贵人!

凌风的世界观
2025-11-14 08:38:31
加时1胜7负+被逆转13分!火箭吞耻辱被喷上热搜 休媒坐等首轮出局

加时1胜7负+被逆转13分!火箭吞耻辱被喷上热搜 休媒坐等首轮出局

颜小白的篮球梦
2026-03-26 13:20:36
散户不想再做韭菜,就得学会参悟时间的奥秘

散户不想再做韭菜,就得学会参悟时间的奥秘

记忆承载
2026-03-26 07:38:41
不装了摊牌了!白宫承认伊朗拒绝谈判,特朗普准备“释放地狱”!

不装了摊牌了!白宫承认伊朗拒绝谈判,特朗普准备“释放地狱”!

阿芒娱乐说
2026-03-26 14:19:21
释永信“开光”真相大白,过程不堪入目,易中天也有牵扯

释永信“开光”真相大白,过程不堪入目,易中天也有牵扯

秋姐居
2026-03-25 10:22:58
四川一车主送孩子上学违规停车,孩子“开门杀”将骑电动车母女绊倒,车主直接开车驶离,当地交警:排除酒驾、毒驾嫌疑,司机赔偿了医药费

四川一车主送孩子上学违规停车,孩子“开门杀”将骑电动车母女绊倒,车主直接开车驶离,当地交警:排除酒驾、毒驾嫌疑,司机赔偿了医药费

潇湘晨报
2026-03-26 14:17:08
心跳成为“胜负手”:从张雪峰猝然离世看网球运动员的心脏之殇

心跳成为“胜负手”:从张雪峰猝然离世看网球运动员的心脏之殇

网球之家
2026-03-25 23:38:54
男子干活时摔成高位截瘫,妻子一看男子不能赚钱养家了,丢下男子和6岁的女儿跑了

男子干活时摔成高位截瘫,妻子一看男子不能赚钱养家了,丢下男子和6岁的女儿跑了

张晓磊
2026-03-26 11:22:06
真撑不住了!特朗普,要做重大让步了!

真撑不住了!特朗普,要做重大让步了!

大嘴说天下
2026-03-25 19:16:47
戏都没演明白还当评委,自己都没拿过奖,坐在评审团位置不心虚吗

戏都没演明白还当评委,自己都没拿过奖,坐在评审团位置不心虚吗

娱乐圈笔娱君
2026-03-25 10:46:06
不吹不黑!iOS 26.4正式版体验,老iPhone直接封神

不吹不黑!iOS 26.4正式版体验,老iPhone直接封神

叮当当科技
2026-03-26 01:51:54
出狱后的雷政富沧桑感袭面而来,前后对比引人唏嘘

出狱后的雷政富沧桑感袭面而来,前后对比引人唏嘘

霹雳炮
2026-03-14 22:49:47
6-2血洗欧冠德比!巴萨狂轰6球,皇马孤将双响难挡崩盘

6-2血洗欧冠德比!巴萨狂轰6球,皇马孤将双响难挡崩盘

林子说事
2026-03-26 09:42:20
我们看印度人是奇葩,印度人看我们也一样?真相是我们想象的百倍

我们看印度人是奇葩,印度人看我们也一样?真相是我们想象的百倍

番外行
2026-03-24 13:04:28
回顾“91女神”琪琪:五官出众,却因天真让自己“受伤”

回顾“91女神”琪琪:五官出众,却因天真让自己“受伤”

就一点
2025-11-22 10:36:39
连续14年胜率50+%!小卡战旧主27分6板,加兰24分6助,马瑟林23分

连续14年胜率50+%!小卡战旧主27分6板,加兰24分6助,马瑟林23分

无术不学
2026-03-26 14:05:40
太猛了!字节漫剧日消耗破7000万元,超过真人短剧

太猛了!字节漫剧日消耗破7000万元,超过真人短剧

新腕儿
2026-03-25 16:48:29
2026-03-26 15:40:49
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技评论独家合作
16487文章数 514797关注度
往期回顾 全部

科技要闻

Meta高管狂分百亿期权,700名员工却下岗

头条要闻

上海妈妈寻亲27年悬赏市区一套房:不用尽孝 要个拥抱

头条要闻

上海妈妈寻亲27年悬赏市区一套房:不用尽孝 要个拥抱

体育要闻

35岁替补门将,凭什么入选英格兰队?

娱乐要闻

张雪峰家人首发声 不设追思会丧事从简

财经要闻

黄仁勋:芯片公司的时代已经结束了

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

亲子
房产
教育
艺术
军事航空

亲子要闻

售卖“增高神药”让孩子“猛长20厘米”?多家店铺被查

房产要闻

质价比标杆!三亚首创浮岛全景舱亮相,还得是万科!

教育要闻

教育部部署开展2026年全国中小学生安全教育周活动

艺术要闻

哪一座桥不是风景?

军事要闻

担心特朗普突然停战 以总理下令48小时尽力摧毁伊设施

无障碍浏览 进入关怀版