网易首页 > 网易号 > 正文 申请入驻

程序员会被AI取代吗?MIT研究揭示三大现实挑战

0
分享至



想象这样一个未来:人工智能正悄然重塑软件开发行业,它可以精准重构混乱代码,高效迁移遗留系统,智能排查竞态条件,而人类工程师得以专注于更具创造性的架构设计和创新性问题解决。这一看似触手可及的未来愿景,在麻省理工学院计算机科学与人工智能实验室(CSAIL)最新发表的研究中获得了严谨审视。

“人人都说不再需要程序员,自动化工具已遍地。” MIT 教授、CSAIL 首席研究员、论文资深作者 Armando Solar-Lezama 说,“工具确实强大,可离真正的自动化愿景仍有距离。”

由麻省理工学院(MIT)教授 Armando Solar-Lezama 领衔,联合加州大学伯克利分校、康奈尔大学、斯坦福大学等多所顶尖院校的专家,发表了一篇题为《迈向 AI 软件工程的挑战与路径》的文章,通过系统性的实证分析,揭示了当前 AI 辅助软件开发所面临的三大核心挑战。

评估体系亟待更新。研究指出,当前主流的 SWE-Bench 评估标准存在明显不足。测试案例通常仅涉及几百行代码,远不及企业级项目的规模;评估场景过于简单,无法反映真实的工程挑战;更存在数据泄露的风险。这种“本科编程练习”式的评估,难以准确衡量 AI 在实际开发环境中的表现。而真实的工作要复杂得多,包括日常重构优化设计;把数百万行 COBOL 迁往 Java 重塑业务;持续测试与分析——模糊测试、属性测试——抓并发漏洞、修零日;还要给十年老代码补文档等维护工作。

人机协作瓶颈。论文第一作者 Alex Gu 指出,现有 AI 编程助手与开发者的交互就像“一条纤细的通信线”。具体表现在,开发者对 AI 输出的控制力有限,生成的代码是一个庞大而无结构的文件,外加流于表面的测试;系统缺乏表达自信度的机制,无法标识需要人工复核的代码段;对专业开发工具的支持不足,难以有效运用调试器等专业工具。这些问题导致开发者可能盲目信任那些能通过编译却在运行时出错的代码。

规模化的挑战更为严峻。研究表明,在面对企业级代码库时,AI 表现明显下降。由于每家公司的代码库都具有独特性,AI 常常生成看似合理但不符合特定企业规范的“幻觉代码”。此外,基于语法相似性的检索方法也经常出现误判。

针对这些挑战,研究团队从三方面提出了突破性的解决方案。

数据层面,建议建立包含开发全流程的增强数据集,重点记录代码取舍决策过程、重构演变轨迹等技术细节;评估体系需要开发多维度框架,特别关注重构质量指数、缺陷修复持久性等关键指标;在协作机制上,应设计新型人机交互界面,实现不确定性可视化、决策过程可追溯等高级功能。

Alex Gu 将其称之为需多方参与的“开源行动”;Solar-Lezama 则期待渐进式地突破反哺商业工具,把 AI 从补全助手变为真正的合作伙伴。

“软件已经支撑着金融、交通、医疗保健以及日常生活的方方面面,而构建和安全地维护软件所需的人力正在成为瓶颈。能担脏活且不埋雷的 AI,将解放人去创造、决策、守伦理。” Gu 说,“但前提是我们承认,补全最简单,其余最难。我们的目标不是取代程序员,而是增强他们的能力。当人工智能能够处理枯燥与可怕的事情时,人类工程师可以将时间投入到只有人类才能做的事情上。”

1.https://news.mit.edu/2025/can-ai-really-code-study-maps-roadblocks-to-autonomous-software-engineering-0716

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
重庆巫山一男子散步被毒蛇咬伤,冷静女友拍蛇照、洗伤口、打120传照片,半小时送医获救

重庆巫山一男子散步被毒蛇咬伤,冷静女友拍蛇照、洗伤口、打120传照片,半小时送医获救

红星新闻
2025-09-15 17:43:07
湖南18岁女生和父亲西藏自驾游,母亲发现纸篓脏东西,崩溃了

湖南18岁女生和父亲西藏自驾游,母亲发现纸篓脏东西,崩溃了

纸鸢奇谭
2024-10-02 19:27:38
北京两个大型医院决定关闭!

北京两个大型医院决定关闭!

美丽大北京
2025-09-15 14:57:16
河南一邪教头目自封“玉皇大帝”:奸淫妇女10人,敛财超500万元

河南一邪教头目自封“玉皇大帝”:奸淫妇女10人,敛财超500万元

界面新闻
2025-09-15 08:37:27
冯唐:去趟重症病房,你就会明白,很多纠缠根本不值得

冯唐:去趟重症病房,你就会明白,很多纠缠根本不值得

清风拂心
2025-09-14 16:15:04
iOS 26 正式版发布:9大亮点,全新界面大改

iOS 26 正式版发布:9大亮点,全新界面大改

辉哥说动漫
2025-09-16 02:10:57
南沙二手房跌 48.3%,增城跌 55.2%,广州外围区房价还没触底?

南沙二手房跌 48.3%,增城跌 55.2%,广州外围区房价还没触底?

爱看剧的阿峰
2025-09-15 17:04:45
枫花恋、桃乃木香奈、石川澪、香水纯、妃光莉 日本娱乐圈明星动态

枫花恋、桃乃木香奈、石川澪、香水纯、妃光莉 日本娱乐圈明星动态

素然追光
2025-09-16 00:23:15
416米!南京第二高楼正式命名:紫金金融大厦

416米!南京第二高楼正式命名:紫金金融大厦

GA环球建筑
2025-09-15 23:08:59
于朦胧坠楼第4天,宋伊人评论区沦陷,被扒是极光光邻居经常聚会

于朦胧坠楼第4天,宋伊人评论区沦陷,被扒是极光光邻居经常聚会

眼光决定境界
2025-09-16 03:02:46
倒闭1.2万家!80后集体记忆轰然崩塌,50台电脑年入千万神话破灭

倒闭1.2万家!80后集体记忆轰然崩塌,50台电脑年入千万神话破灭

财经八卦
2025-07-17 23:34:18
浙经贸的三分钟战士大二弟弟火了

浙经贸的三分钟战士大二弟弟火了

杭城村叔
2025-09-11 12:54:47
“人家都生二胎”婆婆提醒儿媳,被6岁孙女打了脸:人家都有奶奶

“人家都生二胎”婆婆提醒儿媳,被6岁孙女打了脸:人家都有奶奶

清水家庭故事
2025-09-15 06:04:49
“80后”王文娟,当选县长

“80后”王文娟,当选县长

鲁中晨报
2025-09-15 08:35:17
第一批上海国际高中毕业生:高昂学费只是入场券,精英人生比想象中困难

第一批上海国际高中毕业生:高昂学费只是入场券,精英人生比想象中困难

今日美食分享
2025-09-16 02:02:31
直降3100元!华为官宣:9月15日,全面降价!

直降3100元!华为官宣:9月15日,全面降价!

科技堡垒
2025-09-15 11:26:08
“哥,妈病了,和嫂子取消各管各妈”哥哥:离了,让她自生自灭吧

“哥,妈病了,和嫂子取消各管各妈”哥哥:离了,让她自生自灭吧

广西秦胖胖
2025-09-15 06:11:44
英伟达确定违法,恐面临最高超600亿元罚款!黄仁勋再也笑不出来

英伟达确定违法,恐面临最高超600亿元罚款!黄仁勋再也笑不出来

王五说说看
2025-09-15 17:50:26
红军城进入决战,俄巨弹专炸煤矿通风井:大批乌军被永远埋在地下

红军城进入决战,俄巨弹专炸煤矿通风井:大批乌军被永远埋在地下

南宗历史
2025-09-13 09:24:39
给多少钱也不卖!阿森纳明确思路,18岁小将会是“下个萨卡”么

给多少钱也不卖!阿森纳明确思路,18岁小将会是“下个萨卡”么

里芃芃体育
2025-09-16 05:00:03
2025-09-16 08:23:00
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技评论独家合作
15628文章数 514081关注度
往期回顾 全部

科技要闻

中国将依法依规开展TikTok技术出口审批

头条要闻

7分钟上齐3道菜 太二酸菜鱼"活鱼现做"遭质疑

头条要闻

7分钟上齐3道菜 太二酸菜鱼"活鱼现做"遭质疑

体育要闻

诺维茨基退役十年后,德国篮球走向巅峰

娱乐要闻

60岁张曼玉定居法国:瘦成皮包骨?

财经要闻

华与华秒怂 罗永浩称已接到对方道歉

汽车要闻

后轮转向和5C 2026款梦想家把想到的都给了

态度原创

游戏
健康
时尚
手机
亲子

TES输得可惜!赛后官博沦陷,粉丝怒喷369:最大短板!越打越菜

内分泌科专家破解身高八大谣言

日常穿衣其实一点都不难,看看这些气质女性,穿得大方高级

手机要闻

苹果发布包含全新液态玻璃设计的iOS 26和iPadOS 26

亲子要闻

我该怎么办呢?

无障碍浏览 进入关怀版