网易首页 > 网易号 > 正文 申请入驻

黄仁勋预言成真!AI智能体成GitHub主力,一天顶人类一年

0
分享至

新智元报道

编辑:LRST

【新智元导读】「软件正在吞噬世界,但AI将吞噬软件。」—英伟达CEO黄仁勋的预言正加速照进现实。

最近,来自加拿大女王大学的一项最新研究,首次揭示了AI编程智能体如何大规模渗透开源社区。

论文地址:https://arxiv.org/abs/2507.15003

数据集地址:https://huggingface.co/datasets/hao-li/AIDev

代码地址:https://github.com/SAILResearch/AI_Teammates_in_SE3

研究团队通过分析45.6万条GitHub Pull Request(PR,代码修改请求)发现,OpenAI Codex、GitHub Copilot和Claude Code等AI编程智能体已超越简单的代码补全角色,正作为真正的「AI程序员」活跃在开源一线:

它们能独立发起PR、参与评审,甚至与人类开发者就修改方案展开「讨论」。

这标志着软件工程正式迈入知名AI科学家Andrej Karpathy所预言的3.0时代—AI从工具升级为协作伙伴,全球已有超过6.1万个开源项目开始接纳AI编程智能体作为「同事」。

这些项目涵盖各种规模,使用者包括4.7万名人类开发者。

其中,OpenAI Codex表现最为活跃,提交PR达41万次(截止发文已达到80万次),堪称「卷王」;Devin和GitHub Copilot分别以2.4万和1.6万次提交紧随其后。

效率爆炸:3天干完3年的活

AI编程智能体带来的效率提升令人咋舌。数据显示,GitHub Copilot平均仅需13分钟就能完成一个代码修改请求的核心工作,远快于人类开发者通常所需的数小时甚至数天。

更极端的案例显示,一位开发者借助OpenAI Codex在短短3天内提交了164次代码修改,几乎相当于他过去3年(提交176次)的工作总量

这如同为每位程序员配备了100个不知疲倦的实习生,他们可以24小时不间断地产出代码。

质量困境:快不等于好

研究揭示了一个关键矛盾:AI代码的接受率普遍低于人类

OpenAI Codex的代码合并率为65%,GitHub Copilot仅为38%,而人类开发者平均达到76%。

这种差距在核心功能开发中尤为明显:在核心功能开发(feat)和缺陷修复(fix)任务中,差距尤为显著(低15-40个百分点)。

不过,AI在文档编写(docs)方面展现出独特优势。OpenAI Codex的文档类修改接受率高达88.6%,显著超过人类的76.5%。研究推测,文档生成更依赖语言能力而非复杂逻辑推理,这正契合当前大语言模型的核心优势。

更具启发性的现象是,高达37%的GitHub Copilot PR经历了「人机联合评审」——AI工具进行初步筛查后,再由人类把关。

然而,新模式也引发担忧:研究发现,Copilot提交的代码通常由其「同门」AI 智能体(copilot-swe-agent[bot])初审,存在「自己人审自己人」的潜在审查盲点。研究团队建议,未来应探索建立更独立的评审机制以保障公正性。

未来已来:GitHub进化为AI训练场

研究预言,开源平台将进化为AI智能体的「训练健身房」。每一次成功的代码合并将成为强化学习的「正反馈」,每一次测试失败或PR被拒则是宝贵的「负反馈」。

其终极目标是培育出能独立、可靠完成软件迭代的成熟AI程序员。

基于海量实证数据,研究团队为AI编程智能体时代勾勒出关键发展方向:

1. 动态评测体系:摒弃传统的静态测试,直接在真实项目环境中评估AI表现

2. 失败模式解析:深入分析被拒PR,建立AI常见错误库,驱动改进

3. 延迟优化:重点解决部分任务响应超时(>1小时)的长尾问题。

4. 评审减负:让AI生成的代码更清晰、更易审查,降低人类负担

5. 专业评审AI:开发专门用于代码审查的智能体

6. 智能评审分流: 根据代码复杂度与风险自动分配评审资源

7. 全周期质量追踪:监控AI生成代码的长期维护成本和缺陷率

8. 需求理解:提升AI对不明确任务意图的理解与规划能力

9. 编程语言优化:针对TypeScrip等AI擅长语言进行深度适配,或开发出AI专用新语言

「这并非取代人类开发者,而是重新定义开发者的核心角色,未来的程序员将更像交响乐团的指挥家,专注于战略目标设定、协调多个‘AI乐手’的协作,而非亲自演奏每一个音符。」

随着AI编程智能体数量和能力呈指数级增长,软件工程行业正站在深刻变革的临界点。这场革命将如何重塑开发流程、团队协作乃至行业生态,值得我们持续关注与思考。

参考资料:

https://arxiv.org/abs/2507.15003

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
凌晨2点45!意大利决战波黑,赢球=时隔12年出线,世界杯分组确定

凌晨2点45!意大利决战波黑,赢球=时隔12年出线,世界杯分组确定

球场没跑道
2026-03-31 10:45:59
多少小学生因不准玩手机,把视频打印下来自制了一本抖音?

多少小学生因不准玩手机,把视频打印下来自制了一本抖音?

BB姬
2026-03-30 22:23:02
接连两天 两个大三甲医院党委书记猝死

接连两天 两个大三甲医院党委书记猝死

医脉圈
2026-03-27 20:36:17
山西大同一30米围墙突然倒塌!现场6辆汽车被砸,砖块埋压车身,原因正在调查

山西大同一30米围墙突然倒塌!现场6辆汽车被砸,砖块埋压车身,原因正在调查

台州交通广播
2026-03-30 22:30:15
4月见!华为多款新品爆料,真的猛啊!

4月见!华为多款新品爆料,真的猛啊!

科技堡垒
2026-03-29 11:35:26
中国一架都没有!全球都放弃的A380,为何阿联酋却死守不放?

中国一架都没有!全球都放弃的A380,为何阿联酋却死守不放?

丁丁鲤史纪
2026-03-30 17:39:24
只有医生才敢说的,糖尿病4大谣言,很多人被坑了,快看你...

只有医生才敢说的,糖尿病4大谣言,很多人被坑了,快看你...

袁医生课堂
2026-03-30 20:04:14
一路走好!仅1天又传出3位名人去世,有2位不到50岁,令人唏嘘

一路走好!仅1天又传出3位名人去世,有2位不到50岁,令人唏嘘

秋姐居
2026-03-30 14:42:06
一百二十年没人敢动它,中国这次不喊冤了,直接甩出一沓证据

一百二十年没人敢动它,中国这次不喊冤了,直接甩出一沓证据

潋滟晴方DAY
2026-03-30 08:06:51
这是巩俐吗?这身材这状态,真的无法让人想象!

这是巩俐吗?这身材这状态,真的无法让人想象!

情感大头说说
2026-03-31 12:04:06
《危险关系》今晚首播!孙俪领衔,3大卫视力推,有爆款潜质

《危险关系》今晚首播!孙俪领衔,3大卫视力推,有爆款潜质

阿尢说历史
2026-03-31 11:38:04
澳门世界杯:公园大妈打法,64岁选手吓袁嘉楠一跳,球拍异形

澳门世界杯:公园大妈打法,64岁选手吓袁嘉楠一跳,球拍异形

真理是我亲戚
2026-03-30 21:16:21
特朗普威胁:若谈不成,就炸毁并彻底抹平伊朗所有发电站、油井及哈尔克岛!美军集结超5万,共和党议员:地面行动须经国会批准

特朗普威胁:若谈不成,就炸毁并彻底抹平伊朗所有发电站、油井及哈尔克岛!美军集结超5万,共和党议员:地面行动须经国会批准

每日经济新闻
2026-03-30 21:21:10
抵达浙江!体育局官宣,陈梦正式上任,亮相新岗位,与张继科竞争

抵达浙江!体育局官宣,陈梦正式上任,亮相新岗位,与张继科竞争

越岭寻踪
2026-03-31 01:51:17
有没有人敢爆自己的瓜?网友:确定玩这么大吗?

有没有人敢爆自己的瓜?网友:确定玩这么大吗?

夜深爱杂谈
2026-02-18 20:55:58
抱孙子仅1个月,张兰再迎噩耗,扣押2亿资产不算啥,汪小菲被牵连

抱孙子仅1个月,张兰再迎噩耗,扣押2亿资产不算啥,汪小菲被牵连

阿纂看事
2026-03-31 12:16:55
头七承诺:账号留到张姩菡长大,公司等她成年接手

头七承诺:账号留到张姩菡长大,公司等她成年接手

花小猫的美食日常
2026-03-31 11:12:57
几乎全是假货!利润高达2400%,为何有些消费者前赴后继争相购买

几乎全是假货!利润高达2400%,为何有些消费者前赴后继争相购买

米果说识
2026-03-30 14:32:41
国足VS喀麦隆前瞻:实力悬殊差距大,避免大比分失利是底线!

国足VS喀麦隆前瞻:实力悬殊差距大,避免大比分失利是底线!

田先生篮球
2026-03-30 22:25:34
错用中国照片,苏格兰撤除宣传材料

错用中国照片,苏格兰撤除宣传材料

观察者网
2026-03-31 13:06:13
2026-03-31 14:11:00
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
14857文章数 66728关注度
往期回顾 全部

科技要闻

尚未正式宣发,国行苹果AI半夜"意外闪现"

头条要闻

从俄乌冲突到伊朗战争:4年间AI从"打辅助"到"做决策"

头条要闻

从俄乌冲突到伊朗战争:4年间AI从"打辅助"到"做决策"

体育要闻

县城修车工,用20年成为世界冠军

娱乐要闻

丝芭传媒举报鞠婧祎:瞒报收入竟达85%

财经要闻

高薪内推藏陷阱!"招转培"骗局盯上求职者

汽车要闻

16万级最强2.0T 全新一代瑞虎9来了

态度原创

亲子
时尚
健康
本地
军事航空

亲子要闻

胡图图早上发现自己有一只乌龟不见了,所以不太开心 杨雪呀

妈妈们的人生,不该只有一个选项

干细胞抗衰4大误区,90%的人都中招

本地新闻

用Color Walk的方式解锁城市春日

军事要闻

第三艘航母出动数千名士兵抵达 美军大举增兵中东战场

无障碍浏览 进入关怀版