网易首页 > 网易号 > 正文 申请入驻

程序员会被AI取代吗?MIT研究揭示三大现实挑战

0
分享至

想象这样一个未来:人工智能正悄然重塑软件开发行业,它可以精准重构混乱代码,高效迁移遗留系统,智能排查竞态条件,而人类工程师得以专注于更具创造性的架构设计和创新性问题解决。这一看似触手可及的未来愿景,在麻省理工学院计算机科学与人工智能实验室(CSAIL)最新发表的研究中获得了严谨审视。

“人人都说不再需要程序员,自动化工具已遍地。” MIT 教授、CSAIL 首席研究员、论文资深作者 Armando Solar-Lezama 说,“工具确实强大,可离真正的自动化愿景仍有距离。”

由麻省理工学院(MIT)教授 Armando Solar-Lezama 领衔,联合加州大学伯克利分校、康奈尔大学、斯坦福大学等多所顶尖院校的专家,发表了一篇题为《迈向 AI 软件工程的挑战与路径》的文章,通过系统性的实证分析,揭示了当前 AI 辅助软件开发所面临的三大核心挑战。

评估体系亟待更新。研究指出,当前主流的 SWE-Bench 评估标准存在明显不足。测试案例通常仅涉及几百行代码,远不及企业级项目的规模;评估场景过于简单,无法反映真实的工程挑战;更存在数据泄露的风险。这种“本科编程练习”式的评估,难以准确衡量 AI 在实际开发环境中的表现。而真实的工作要复杂得多,包括日常重构优化设计;把数百万行 COBOL 迁往 Java 重塑业务;持续测试与分析——模糊测试、属性测试——抓并发漏洞、修零日;还要给十年老代码补文档等维护工作。

人机协作瓶颈。论文第一作者 Alex Gu 指出,现有 AI 编程助手与开发者的交互就像“一条纤细的通信线”。具体表现在,开发者对 AI 输出的控制力有限,生成的代码是一个庞大而无结构的文件,外加流于表面的测试;系统缺乏表达自信度的机制,无法标识需要人工复核的代码段;对专业开发工具的支持不足,难以有效运用调试器等专业工具。这些问题导致开发者可能盲目信任那些能通过编译却在运行时出错的代码。

规模化的挑战更为严峻。研究表明,在面对企业级代码库时,AI 表现明显下降。由于每家公司的代码库都具有独特性,AI 常常生成看似合理但不符合特定企业规范的“幻觉代码”。此外,基于语法相似性的检索方法也经常出现误判。

针对这些挑战,研究团队从三方面提出了突破性的解决方案。

数据层面,建议建立包含开发全流程的增强数据集,重点记录代码取舍决策过程、重构演变轨迹等技术细节;评估体系需要开发多维度框架,特别关注重构质量指数、缺陷修复持久性等关键指标;在协作机制上,应设计新型人机交互界面,实现不确定性可视化、决策过程可追溯等高级功能。

Alex Gu 将其称之为需多方参与的“开源行动”;Solar-Lezama 则期待渐进式地突破反哺商业工具,把 AI 从补全助手变为真正的合作伙伴。

“软件已经支撑着金融、交通、医疗保健以及日常生活的方方面面,而构建和安全地维护软件所需的人力正在成为瓶颈。能担脏活且不埋雷的 AI,将解放人去创造、决策、守伦理。” Gu 说,“但前提是我们承认,补全最简单,其余最难。我们的目标不是取代程序员,而是增强他们的能力。当人工智能能够处理枯燥与可怕的事情时,人类工程师可以将时间投入到只有人类才能做的事情上。”

1.https://news.mit.edu/2025/can-ai-really-code-study-maps-roadblocks-to-autonomous-software-engineering-0716

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
认输了?俄罗斯做出危险决定:重返美元结算体系!

认输了?俄罗斯做出危险决定:重返美元结算体系!

华语智库
2026-02-15 08:04:46
一场4-0,让阿尔特塔创造历史,四线狂飙,目标直指四冠王

一场4-0,让阿尔特塔创造历史,四线狂飙,目标直指四冠王

足球狗说
2026-02-16 05:19:38
大年初一拜年,别只说“新年快乐”,送您几句祝福语,马年走鸿运

大年初一拜年,别只说“新年快乐”,送您几句祝福语,马年走鸿运

神牛
2026-02-16 09:00:22
活久见!网传奥迪A8悬挂一年猪上高速,网友:二师兄会不会吐一路

活久见!网传奥迪A8悬挂一年猪上高速,网友:二师兄会不会吐一路

火山詩话
2026-02-15 18:17:31
73岁普京突然消失一周未露面,泽连斯基:他时日不多了,我还年轻

73岁普京突然消失一周未露面,泽连斯基:他时日不多了,我还年轻

东极妙严
2026-02-15 15:16:25
听说闫学晶炫富导致中央戏剧学院的管理层都被团灭了!

听说闫学晶炫富导致中央戏剧学院的管理层都被团灭了!

达文西看世界
2026-02-15 20:25:40
外交部:中方决定自2月17日起,对加拿大英国持普通护照人员免签

外交部:中方决定自2月17日起,对加拿大英国持普通护照人员免签

每日经济新闻
2026-02-15 21:41:12
编造谎言的“牢A”:到底是在揭露美国,还是在愚弄国人?

编造谎言的“牢A”:到底是在揭露美国,还是在愚弄国人?

涛哥锐评
2026-02-15 21:34:08
斐济群岛发生6.0级地震 震源深度530千米

斐济群岛发生6.0级地震 震源深度530千米

每日经济新闻
2026-02-11 05:50:05
高金素梅被查!港媒:或是一个危险的起点,台湾政治正站在十字路口

高金素梅被查!港媒:或是一个危险的起点,台湾政治正站在十字路口

海峡导报社
2026-02-16 07:42:19
seedance2.0太恐怖了,随手生成电影级别短片,业内人士惊呼:我们完蛋了

seedance2.0太恐怖了,随手生成电影级别短片,业内人士惊呼:我们完蛋了

风向观察
2026-02-15 22:35:48
美国大使馆给中国人拜年,唱中文歌,老美咋不抵制中国节呢?

美国大使馆给中国人拜年,唱中文歌,老美咋不抵制中国节呢?

廖保平
2026-02-15 10:05:25
“一号难求”,全球爆火!大量外国人求这个中国产品的使用教程,美国导演:这能搞垮好莱坞

“一号难求”,全球爆火!大量外国人求这个中国产品的使用教程,美国导演:这能搞垮好莱坞

新民晚报
2026-02-15 15:18:34
我方开启全面索赔,巴拿马43个港口或保住,李嘉诚险遭“0元购”

我方开启全面索赔,巴拿马43个港口或保住,李嘉诚险遭“0元购”

白梦日记
2026-02-15 18:45:30
震惊!985大学也无法拯救的专业,毕业生面临失业!

震惊!985大学也无法拯救的专业,毕业生面临失业!

特约前排观众
2026-02-16 00:10:04
俄15架苏-57隐身战机全调远东,距中国不到400公里,释放何信号?

俄15架苏-57隐身战机全调远东,距中国不到400公里,释放何信号?

策前论
2026-02-14 17:57:15
住建部已查清全国房子数量,过剩问题有多严重?楼市或迎来新变局

住建部已查清全国房子数量,过剩问题有多严重?楼市或迎来新变局

猫叔东山再起
2026-02-15 11:30:03
8岁女孩拿到6张奖状在母亲坟前哭诉“没有意义你看不到”,40岁姑姑安慰“我奖励你”,涡阳县民政:正核实跟进

8岁女孩拿到6张奖状在母亲坟前哭诉“没有意义你看不到”,40岁姑姑安慰“我奖励你”,涡阳县民政:正核实跟进

极目新闻
2026-02-15 21:02:32
李玮锋:踢日本恨不得把鞋钉换成刀!我们比赛没赢过 场上没怂过

李玮锋:踢日本恨不得把鞋钉换成刀!我们比赛没赢过 场上没怂过

念洲
2026-02-15 17:07:32
国产电车暴跌,或因外资车与产业链和经销商联合围剿,自食其果

国产电车暴跌,或因外资车与产业链和经销商联合围剿,自食其果

柏铭锐谈
2026-02-13 23:37:09
2026-02-16 12:16:49
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技评论独家合作
16272文章数 514615关注度
往期回顾 全部

科技要闻

OpenAI拿下OpenClaw之父 承诺开源绝不动摇

头条要闻

媒体:王毅当着欧美同事的面 直接点名日本现职首相

头条要闻

媒体:王毅当着欧美同事的面 直接点名日本现职首相

体育要闻

遭针对?谷爱凌炮轰国际雪联安排

娱乐要闻

好甜蜜!郭富城随方媛回安徽过年

财经要闻

2025,中国商业十大意外,黄金只排第九

汽车要闻

叫停纯屏操作 工信部拟推车内实体操作件强制国标

态度原创

房产
健康
旅游
教育
时尚

房产要闻

三亚新机场,又传出新消息!

转头就晕的耳石症,能开车上班吗?

旅游要闻

天下第一泉迎春花灯会《赏灯地图》首发,一图看懂超全点位

教育要闻

湖南工大分数高难进?揭秘三大核心优势!

今年春天的裙子,裙摆越大越好看!

无障碍浏览 进入关怀版