我们正处在一个被AI重构的工作时代。
几乎所有人都听过这样的说法:AI是普通人的“逆袭神器”,它能抹平新手和老手的技能差距,让刚入行的年轻人快速追上行业前辈,实现生产力的普惠平权。
但本周发表在国际顶刊《Science》上的两篇文章,彻底颠覆了这个大众认知。通过分析全球6个国家、16万程序员6年间3100万次代码提交的海量数据,科学家们得出了一个完全相反的结论:AI非但没有缩小技能差距,反而让强者越强、弱者越弱;它非但没有降低入行的门槛,反而把生产力的准入标准抬到了前所未有的高度。
![]()
AI席卷了全球编程圈,但受益者只有1%的老手
在揭晓反常识的结论之前,我们先搞懂这项研究的权威性:它不是小范围的实验室对照实验,也不是靠问卷统计的主观报告,而是实打实的全量行为数据分析。
为了搞清楚“谁在用AI写代码,用了之后到底有没有用”,研究团队先做了一件事:训练了一个准确率高达96%的AI代码“验钞机”。 这个神经网络分类器,能精准分辨出一段代码到底是人类写的,还是AI生成的。研究团队用它扫描了2019-2024年,美国、中国、法国、德国、印度、俄罗斯6个国家,160097名开发者在GitHub(全球最大的开源代码平台)上提交的3100万次代码修改、500万个代码函数,最终得出了两组颠覆认知的结论。
第一组数据:AI编程的普及,比所有人想象的都快
短短5年间,AI生成的代码占比,从几乎为0一路飙升。截至2024年底:
- 美国领跑全球,29%的Python函数代码,是在AI的显著辅助下完成的;
- 德国、法国紧随其后,AI代码占比分别达到24%和23%,和美国的差距已经极小;
- 印度后发猛冲,从初期的大幅滞后,快速追到了20%的占比;
- 中国、俄罗斯的AI代码普及率,暂时落后于其他四个国家。研究也补充说明,中国开发者大量使用本土代码平台Gitee,海外主流大模型也存在访问限制,一定程度上影响了数据结果。
更有意思的是,AI普及率的每一次暴涨,都精准踩中了AI行业的里程碑事件:GitHub Copilot测试版发布、ChatGPT正式上线、GPT4等第二代大模型集中推出,每一次技术升级,都让开发者用AI写代码的比例立刻跳涨。
第二组数据:最依赖AI的新人,没拿到任何好处
谁最爱用AI?答案是刚入行的初级开发者。 数据显示,刚加入平台的编程新人,37%的代码都是靠AI生成的;而在平台活跃6年以上的资深开发者,只有27%的代码会借助AI辅助。新人对AI的依赖度,远高于行业老手。
但用得越多,不代表收益越大。 研究团队通过对比同一个开发者用AI前后的工作表现,排除了所有干扰因素后发现:达到美国平均29%的AI使用率时,资深开发者的代码提交率(衡量程序员工作效率的核心指标)提升了6.2%,同时他们会更多地尝试全新的技术工具包,快速涉足自己不熟悉的开发领域,能力边界被大幅拓宽。
而那些最依赖AI的初级开发者,没有获得任何统计学上可量化的收益。 简单说:AI给资深开发者开了“双倍效率挂”,却给新人开了个“无效外挂”——哪怕你天天用AI写代码,你的效率、能力、产出,和不用AI的时候没有任何区别。
为什么新人越用越亏?AI藏着一个看不见的生产力阈值
为什么会出现这种完全反常识的结果?在本周《Science》的评论文章,给出了一个足以重构我们对AI认知的模型:人机协作的生产力阈值模型。
所有的分歧,都源于我们对“生产力”的误解。 很多人以为,生产力就是“生成更多内容”:写更多行代码、出更多页PPT、写更多字的文案。按这个标准,AI确实是新手的福音,它能把内容生成的成本降到几乎为0,让新手一秒钟就能生成老手要花几小时做的内容。
但在真实的商业世界里,有市场价值的生产力,从来不是“生成内容”,而是“把零散的内容,整合进复杂系统,创造可持续的价值”。
而要把AI的产出转化成真正的生产力,你的专业能力必须跨过一个最低门槛。
- 门槛之下:AI给你的内容越多,你的工作反而越低效,越没有成长。AI生成的代码、文案、方案,你需要花大量时间去阅读、修改、排查问题,甚至要为AI埋下的坑付出几倍的修复成本,最终不仅没提升效率,反而占用了所有的工作时间;
- 门槛之上:你能精准驾驭AI的产出,用它省掉所有重复的执行工作,把精力放在核心的决策和设计上,AI会成为你的效率放大器,让你的能力和产出翻倍。
这个看不见的门槛,就是AI时代最核心的竞争力:人类的判断力。它分为两种核心能力,也是新手和老手最本质的差距。
1)评估判断力:知道AI的产出能不能用、为什么能用
我们用程序员最真实的工作场景,就能看懂这个差距。 初级开发者拿到AI生成的代码,第一反应是跑一下试试:能运行,就直接塞进项目里用;只有程序崩了,才会回头看哪里出了问题。 但他们不知道,AI生成的代码,大多是“单独看完美无缺,放进复杂系统里处处是坑”。它可能在简单场景下能正常运行,但面对海量用户的高并发场景就会直接崩溃;也可能留下了大量的安全漏洞,未来会被黑客攻击;更会积累大量的“技术债务”——当下图省事写的不规范代码,未来要花几倍的时间和成本去修复、优化,就像借了高利贷,越滚越多。
而资深开发者,凭借多年积累的系统设计知识、对代码故障模式的认知,一眼就能预判这段代码在真实场景里的表现,精准筛掉脆弱、有隐患的AI内容,只留下真正可用的部分。
这就像新手拿着AI给的菜谱,照着做出来的菜能吃,但开餐馆就一定会倒闭;而大厨能一眼看出菜谱里的食材搭配问题、火候偏差,根据食客的口味、餐厅的定位调整优化,最终做出能卖钱的菜品。
在AI把内容生成成本降到0的时代,“生成”再也不是瓶颈,“评估”才是。你只有懂底层逻辑,才能判断AI的产出好不好、能不能用,这是把AI转化为生产力的第一道门槛。
2)任务委派判断力:知道该让AI做什么,不该让它做什么
很多人以为,用好AI的关键是“写提示词”,但本质上,提示词的背后,是任务委派的能力。 资深开发者大多有多年的团队管理和系统设计经验,他们日常的核心工作之一,就是决定什么任务该分给谁、给多大的自主权限、要拿到什么结果、怎么监督过程。这种能力,会完美迁移到和AI的交互中。
他们不会让AI替自己做所有事,而是精准地把重复、低价值的执行环节委派给AI,自己专注于核心的系统架构、技术选型、业务逻辑设计。他们知道该给AI下达什么指令,能精准定义需求的边界和目标,最终拿到自己真正需要的结果。
而初级开发者,在工作中大多是“被分配任务的人”,从来没有主导过项目、委派过任务。他们根本不知道该让AI做什么,只能零散地让AI写几行代码、改几个bug,没法用AI解决系统性的复杂问题,自然也没法从AI身上拿到真正的收益。
随着AI从“代码补全”向“自主执行任务”升级,未来生产力的核心,会从“评估AI的产出”,进一步转向“决定给AI委派什么任务”。而这种能力,恰恰是新手最缺乏的。
不止是程序员:AI正在抬高所有知识工作的门槛
这个“生产力阈值模型”,绝不仅仅适用于编程行业。它正在席卷所有的知识工作领域,重塑每一个行业的价值体系。
- 创意写作领域:AI能生成流畅优美的句子,甚至能一秒钟写出一篇完整的短篇小说。但要写出真正打动人心的作品,需要你判断什么角色有魅力、什么情节能引发共鸣、什么内容该留该删,这种持续的叙事判断力,只有跨过创作门槛的写作者才具备。AI能帮你省掉码字的时间,但没法替你创作。
- 科研领域:AI能帮你跑数据分析、写论文初稿、梳理参考文献,甚至能帮你设计实验。但只有资深的科研人员,能判断AI的分析结果是否严谨、研究问题是否有价值、实验设计是否有漏洞,能把AI的零散产出,整合成有学术价值的研究成果。而科研新人,只会用AI生成一堆看似规范、实则毫无创新的学术垃圾。
- 法律、金融、咨询行业:AI能快速检索法条、案例、行业数据,生成基础的合同、分析报告。但只有资深的从业者,能根据客户的真实需求,判断哪些信息有用、怎么设计解决方案、怎么规避风险,把AI的产出转化为客户愿意付费的专业服务。
AI的本质,从来不是“替代人类的工作”,而是“重构工作的价值分配”。 它把所有标准化、重复性的执行环节,成本降到了几乎为0,让这些工作彻底失去了市场价值;同时,它把上游的判断力、决策力、问题界定能力、系统整合能力,抬到了前所未有的价值高度。
而最残酷的地方在于:这些高价值的核心能力,恰恰需要在日复一日的基础执行工作中,慢慢积累、打磨出来。 以前,刚入行的新人可以从写基础代码、整理基础数据、写初稿文案做起,在执行中理解行业的底层逻辑,慢慢成长为资深从业者。但现在,AI直接抽走了新人成长的阶梯——基础执行工作AI都做了,你连亲手做一遍的机会都没有,永远没法理解底层逻辑,永远跨不过那个生产力阈值,最终陷入“越用AI,越没能力,越没能力,越依赖AI”的死循环。
这也是为什么,当下的劳动力市场已经出现了明显的变化:软件开发行业里,资深开发者的招聘需求持续上涨,而初级岗位的招聘规模大幅收缩。这不是因为新人离职率高,也不是因为晋升速度变快,而是企业的用人标准变了——以前企业招新人,是让他做基础执行工作,慢慢培养;现在基础执行工作AI都能做,企业需要的是一上来就能跨过阈值、能把AI产出转化为商业价值的人,新人没有这个能力,自然就失去了入行的机会。
写给所有人的启示:别让AI,废掉你最核心的能力
看到这里,你可能会觉得焦虑:难道普通人、新人,就没法用好AI了吗? 当然不是。这项研究真正想告诉我们的,从来不是“不要用AI”,而是“不要用错AI”。
我们必须纠正一个致命的误区:不要把AI当成“替你干活的工具”,而要把它当成“放大你核心能力的放大器”。
很多人用AI的逻辑是错的:他们用AI写代码,是为了自己不用学代码;用AI写文案,是为了自己不用想文案;用AI做数据分析,是为了自己不用懂统计学。最终的结果,就是自己永远练不出核心的判断力,永远停留在生产力阈值之下,AI越发达,自己越容易被替代。
而真正能从AI身上拿到红利的人,用AI的逻辑完全相反:他们已经掌握了底层的专业逻辑,跨过了生产力阈值,用AI替自己完成重复、低价值的执行工作,把省下来的时间和精力,全部放在打磨更高阶的判断力、决策力、系统设计能力上,让自己的核心竞争力越来越强。
对于刚入行的新人、还在读书的大学生,我们给你三个最落地的建议:
- 永远不要跳过基础的执行环节。哪怕AI能帮你完成,你也要亲手做一遍。学编程,就先亲手写好每一行基础代码,搞懂它的运行逻辑,再用AI去优化;学写作,就先亲手搭好框架、写好核心内容,再用AI去润色。只有亲手做过,你才能真正理解底层逻辑,才有能力判断AI产出的好坏。
- 把AI当成学习辅助工具,而不是偷懒工具。遇到不懂的问题,不要让AI直接给你答案,而是让AI给你讲解知识点、给你解题思路,最终的答案,一定要自己亲手推导出来。用AI降低学习的门槛,而不是跳过学习的过程。
- 越早锻炼决策和委派能力,你就越早能跨过生产力阈值。哪怕你只是一个新人,也要试着站在更高的视角看问题:做一个项目,先想清楚核心目标是什么、核心环节有哪些、该怎么拆解任务,再把执行环节交给AI,而不是一上来就让AI替你干活。
最后,我们回到最核心的问题:AI到底给我们带来了什么? 我们曾经无数次幻想,AI会把人类从重复的劳动中解放出来,让每个人都能平等地发挥创造力。但现实告诉我们,技术从来不会自动带来平权。它只会放大人类本身的能力,让有准备的人如虎添翼,让想走捷径的人无路可走。
AI从来没有降低生产力的门槛,它只是把门槛,从会不会执行,换成了会不会判断、会不会决策、会不会整合。 未来的竞争,从来不是人和AI的竞争,而是“会用AI的人”和“被AI废掉的人”的竞争。
![]()
【附】论文中图表通俗解读
论文中的四张图表是整篇研究的核心可视化内容,从「研究方法→全球普及现状→人群差异→收益分化」层层递进。
首页总览图:全文核心结论的浓缩版![]()
这张图是整篇论文的「一句话总结」,直接抛出了研究最核心的两个发现,分为左右两个部分:
- 左半部分:AI写代码的占比全球暴涨,但各国普及速度天差地别横轴是2019-2024年的时间线,纵轴是AI生成的Python代码占比。你能看到一条从左下角直冲右上角的曲线,说明这5年间,AI辅助写代码的比例几乎从0一路飙升到接近30%,普及速度极快;但不同国家的曲线高低差异明显,代表各国对AI编程工具的接纳和使用进度,拉开了明显差距。
- 右半部分:AI只给资深开发者「开挂」,新人用了等于白用横轴是开发者的3个核心能力指标:代码提交量(干活效率)、库使用广度(技能覆盖范围)、新库引入(探索陌生技术领域的能力);纵轴是用了AI之后,这些指标的涨跌幅度,0以上代表提升,0以下代表下降。 图中清晰分成两组:高经验的资深开发者,柱子全在0以上,且数值很高,说明用了AI之后,他们干活更快、会的技能更多、也敢涉足全新的技术领域;而低经验的初级开发者,柱子基本贴在0线上,统计学上等于「用了AI之后,没有获得任何可量化的实质性好处」。
这张图是整篇研究的「地基」,讲清了最核心的问题:我们到底怎么精准判断一段代码,是人写的还是AI写的?整个过程就像打造一台专门识别AI代码的「验钞机」,分为4个核心步骤:
- 图1A:制作「验钞机」的训练素材要分辨「人工代码」和「AI代码」,首先得有标注好的标准样本。 第一步,先找100%确定是人工写的代码:2018年的Python函数代码(当时还没有能写代码的成熟AI,绝对纯人工),再补充2022、2024年官方的纯人工代码数据集,避免编程风格随时间变化的干扰。 第二步,制作对应的AI代码样本:用两个大模型接力生成,先让第一个模型把人工代码翻译成纯自然语言,说清「这段代码是干嘛的、输入输出是什么」,再让第二个模型只看这段文字描述,重新写一段功能完全一致的代码。这样既保证了AI和人工代码的功能完全匹配,也避免了模型直接抄作业,保证样本的真实性。
- 图1B:把代码变成机器能看懂的「特征指纹」代码是人能看懂的文字,机器没法直接分辨差异,所以我们用专门为代码设计的GraphCodeBert模型,把每一段代码转换成一串数字向量。简单说,就是把代码里的关键词、注释、变量之间的逻辑关系,全拆解开,提炼出独有的「特征指纹」——人写的和AI写的代码,会留下完全不同的指纹特征。
- 图1C:训练「验钞机」本身把前面标好「人工/AI」标签的代码指纹,喂给神经网络分类器,让它反复学习两种代码的特征差异,练到能精准区分二者为止,最终就得到了能识别AI代码的分类器。
- 图1D:验证准确率,正式上岗使用我们用没参与训练的新样本测试,这台「验钞机」的准确率达到了96%,100段代码里能正确识别96段,几乎不会出错。验证通过后,我们就把它用在了6个国家、16万开发者的3100万次代码提交、500万个代码函数上,算出了论文里所有的统计数据。
这张图讲清了2019-2024年,AI编程工具在全球6个核心国家的普及进程,分为左右两个部分:
- 图2A:美国的AI普及进程,是全球的风向标横轴是2020-2025年的时间线,纵轴是美国开发者的AI生成代码占比。这条线不是平稳上涨的,而是有三次明显的「暴涨节点」,每一次都精准对应AI圈的里程碑事件:第一次是GitHub Copilot测试版发布,第二次是ChatGPT正式上线,第三次是GPT4等第二代大模型集中发布。 每出一款更强大的AI工具,开发者用AI写代码的比例就会立刻飙升,到2024年底,美国约29%的Python函数代码,都是在AI的显著辅助下完成的。
- 图2B:6国普及进度,分出了清晰的梯队这张图对比了美国、法国、德国、印度、中国、俄罗斯6个国家的AI代码占比变化,能清晰看到四个梯队:
- 领头羊:美国,从一开始就领跑,始终保持第一,但领先优势在持续缩小;
- 紧追不舍的欧洲:德国、法国,2024年底AI代码占比分别达到24%、23%,和美国的差距已经非常小;
- 后发猛冲的印度:初期和中俄一样滞后,但2023年开始快速追赶,2024年底追到了20%,即将追上欧洲;
- 相对滞后的中国、俄罗斯:2024年底的AI代码占比,仍明显低于其他四个国家。论文也补充说明,中国开发者很多使用国内的Gitee平台,而非GitHub,可能导致数据偏低;同时海外主流大模型在中俄有访问限制,也影响了普及速度。
这张图是整篇论文最颠覆认知的部分,完整回答了「AI编程的使用者和受益者,到底是不是同一批人」,四个小图层层递进,拆解了AI使用和效果的人群差异:
- 图3A:男女开发者,用AI的热情没有差异这张图按性别拆分了AI使用强度,能看到男女的柱子高度几乎完全一致。说明在美国的开发者群体中,男程序员和女程序员,使用AI写代码的频率、比例,没有统计学上的差异,打破了「新技术男性接受度更高」的刻板印象。
- 图3B:入行越浅的新人,越依赖AI横轴是开发者在GitHub的活跃年限(代表入行资历),纵轴是AI使用强度。图中是一条明显向下的曲线:刚入行的新人,37%的代码都是用AI写的;而经验最丰富的资深开发者,只有27%的代码靠AI辅助。简单说,编程新人比资深老程序员,更频繁、更依赖AI工具。
- 图3C:整体来看,用AI确实能提升效率和能力边界横轴是开发者的核心工作指标,纵轴是用AI之后的指标提升幅度,所有柱子都在0以上,说明从整体数据看,AI确实有正向作用:
- 代码提交量(干活效率):整体提升3.6%;
- 多文件修改(处理复杂项目的能力):显著提升,这类操作需要理清不同代码之间的依赖关系,门槛很高;
- 库使用、新库探索(技能边界与创新能力):用了AI之后,开发者尝试的新软件库组合增加了2.7%。软件库就像编程里的现成工具包,每个库对应一个全新的技术领域,说明AI确实能帮开发者快速上手陌生领域,拓展能力边界。
- 图3D:AI的全部红利,都被资深开发者拿走了,新人用了个寂寞这是整篇论文最核心的结论,和首页总览图形成呼应。这张图把开发者分成了高经验的资深群体和低经验的初级群体,对比二者用AI后的收益差异。 能清晰看到:资深开发者的柱子全在0以上,且数值很高——达到美国平均29%的AI使用率时,他们的代码提交量能提升6.2%,处理复杂项目、拓展新领域的能力也全面上涨;而初级开发者的柱子,全部贴在0线上,上下波动的范围极小,统计学上意味着「使用AI后,没有获得任何显著的收益提升」。 一句话总结:新人用AI最勤、依赖度最高,却没拿到任何实质性好处;资深开发者用得更克制,却把AI的红利全部吃满,AI非但没有抹平技能差距,反而让强者越强、差距越拉越大。
![]()
解读文献:
- https://doi.org/10.1126/science.adz9311
- https://doi.org/10.1126/science.aef5239
也欢迎大家关注我的B站账号。
![]()
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.