全球AI编程热潮席卷，初学者为何频频遭遇困境？|代码|程序员|分类器|ai编程|python

分享至

我们正处在一个被AI重构的工作时代。

几乎所有人都听过这样的说法：AI是普通人的“逆袭神器”，它能抹平新手和老手的技能差距，让刚入行的年轻人快速追上行业前辈，实现生产力的普惠平权。

但本周发表在国际顶刊《Science》上的两篇文章，彻底颠覆了这个大众认知。通过分析全球6个国家、16万程序员6年间3100万次代码提交的海量数据，科学家们得出了一个完全相反的结论：AI非但没有缩小技能差距，反而让强者越强、弱者越弱；它非但没有降低入行的门槛，反而把生产力的准入标准抬到了前所未有的高度。

AI席卷了全球编程圈，但受益者只有1%的老手

在揭晓反常识的结论之前，我们先搞懂这项研究的权威性：它不是小范围的实验室对照实验，也不是靠问卷统计的主观报告，而是实打实的全量行为数据分析。

为了搞清楚“谁在用AI写代码，用了之后到底有没有用”，研究团队先做了一件事：训练了一个准确率高达96%的AI代码“验钞机”。这个神经网络分类器，能精准分辨出一段代码到底是人类写的，还是AI生成的。研究团队用它扫描了2019-2024年，美国、中国、法国、德国、印度、俄罗斯6个国家，160097名开发者在GitHub（全球最大的开源代码平台）上提交的3100万次代码修改、500万个代码函数，最终得出了两组颠覆认知的结论。

第一组数据：AI编程的普及，比所有人想象的都快

短短5年间，AI生成的代码占比，从几乎为0一路飙升。截至2024年底：

美国领跑全球，29%的Python函数代码，是在AI的显著辅助下完成的；
德国、法国紧随其后，AI代码占比分别达到24%和23%，和美国的差距已经极小；
印度后发猛冲，从初期的大幅滞后，快速追到了20%的占比；
中国、俄罗斯的AI代码普及率，暂时落后于其他四个国家。研究也补充说明，中国开发者大量使用本土代码平台Gitee，海外主流大模型也存在访问限制，一定程度上影响了数据结果。

更有意思的是，AI普及率的每一次暴涨，都精准踩中了AI行业的里程碑事件：GitHub Copilot测试版发布、ChatGPT正式上线、GPT4等第二代大模型集中推出，每一次技术升级，都让开发者用AI写代码的比例立刻跳涨。

第二组数据：最依赖AI的新人，没拿到任何好处

谁最爱用AI？答案是刚入行的初级开发者。数据显示，刚加入平台的编程新人，37%的代码都是靠AI生成的；而在平台活跃6年以上的资深开发者，只有27%的代码会借助AI辅助。新人对AI的依赖度，远高于行业老手。

但用得越多，不代表收益越大。研究团队通过对比同一个开发者用AI前后的工作表现，排除了所有干扰因素后发现：达到美国平均29%的AI使用率时，资深开发者的代码提交率（衡量程序员工作效率的核心指标）提升了6.2%，同时他们会更多地尝试全新的技术工具包，快速涉足自己不熟悉的开发领域，能力边界被大幅拓宽。

而那些最依赖AI的初级开发者，没有获得任何统计学上可量化的收益。简单说：AI给资深开发者开了“双倍效率挂”，却给新人开了个“无效外挂”——哪怕你天天用AI写代码，你的效率、能力、产出，和不用AI的时候没有任何区别。

为什么新人越用越亏？AI藏着一个看不见的生产力阈值

为什么会出现这种完全反常识的结果？在本周《Science》的评论文章，给出了一个足以重构我们对AI认知的模型：人机协作的生产力阈值模型。

所有的分歧，都源于我们对“生产力”的误解。很多人以为，生产力就是“生成更多内容”：写更多行代码、出更多页PPT、写更多字的文案。按这个标准，AI确实是新手的福音，它能把内容生成的成本降到几乎为0，让新手一秒钟就能生成老手要花几小时做的内容。

但在真实的商业世界里，有市场价值的生产力，从来不是“生成内容”，而是“把零散的内容，整合进复杂系统，创造可持续的价值”。

而要把AI的产出转化成真正的生产力，你的专业能力必须跨过一个最低门槛。

门槛之下：AI给你的内容越多，你的工作反而越低效，越没有成长。AI生成的代码、文案、方案，你需要花大量时间去阅读、修改、排查问题，甚至要为AI埋下的坑付出几倍的修复成本，最终不仅没提升效率，反而占用了所有的工作时间；
门槛之上：你能精准驾驭AI的产出，用它省掉所有重复的执行工作，把精力放在核心的决策和设计上，AI会成为你的效率放大器，让你的能力和产出翻倍。

这个看不见的门槛，就是AI时代最核心的竞争力：人类的判断力。它分为两种核心能力，也是新手和老手最本质的差距。

1）评估判断力：知道AI的产出能不能用、为什么能用

我们用程序员最真实的工作场景，就能看懂这个差距。初级开发者拿到AI生成的代码，第一反应是跑一下试试：能运行，就直接塞进项目里用；只有程序崩了，才会回头看哪里出了问题。但他们不知道，AI生成的代码，大多是“单独看完美无缺，放进复杂系统里处处是坑”。它可能在简单场景下能正常运行，但面对海量用户的高并发场景就会直接崩溃；也可能留下了大量的安全漏洞，未来会被黑客攻击；更会积累大量的“技术债务”——当下图省事写的不规范代码，未来要花几倍的时间和成本去修复、优化，就像借了高利贷，越滚越多。

而资深开发者，凭借多年积累的系统设计知识、对代码故障模式的认知，一眼就能预判这段代码在真实场景里的表现，精准筛掉脆弱、有隐患的AI内容，只留下真正可用的部分。

这就像新手拿着AI给的菜谱，照着做出来的菜能吃，但开餐馆就一定会倒闭；而大厨能一眼看出菜谱里的食材搭配问题、火候偏差，根据食客的口味、餐厅的定位调整优化，最终做出能卖钱的菜品。

在AI把内容生成成本降到0的时代，“生成”再也不是瓶颈，“评估”才是。你只有懂底层逻辑，才能判断AI的产出好不好、能不能用，这是把AI转化为生产力的第一道门槛。

2）任务委派判断力：知道该让AI做什么，不该让它做什么

很多人以为，用好AI的关键是“写提示词”，但本质上，提示词的背后，是任务委派的能力。资深开发者大多有多年的团队管理和系统设计经验，他们日常的核心工作之一，就是决定什么任务该分给谁、给多大的自主权限、要拿到什么结果、怎么监督过程。这种能力，会完美迁移到和AI的交互中。

他们不会让AI替自己做所有事，而是精准地把重复、低价值的执行环节委派给AI，自己专注于核心的系统架构、技术选型、业务逻辑设计。他们知道该给AI下达什么指令，能精准定义需求的边界和目标，最终拿到自己真正需要的结果。

而初级开发者，在工作中大多是“被分配任务的人”，从来没有主导过项目、委派过任务。他们根本不知道该让AI做什么，只能零散地让AI写几行代码、改几个bug，没法用AI解决系统性的复杂问题，自然也没法从AI身上拿到真正的收益。

随着AI从“代码补全”向“自主执行任务”升级，未来生产力的核心，会从“评估AI的产出”，进一步转向“决定给AI委派什么任务”。而这种能力，恰恰是新手最缺乏的。

不止是程序员：AI正在抬高所有知识工作的门槛

这个“生产力阈值模型”，绝不仅仅适用于编程行业。它正在席卷所有的知识工作领域，重塑每一个行业的价值体系。

创意写作领域：AI能生成流畅优美的句子，甚至能一秒钟写出一篇完整的短篇小说。但要写出真正打动人心的作品，需要你判断什么角色有魅力、什么情节能引发共鸣、什么内容该留该删，这种持续的叙事判断力，只有跨过创作门槛的写作者才具备。AI能帮你省掉码字的时间，但没法替你创作。
科研领域：AI能帮你跑数据分析、写论文初稿、梳理参考文献，甚至能帮你设计实验。但只有资深的科研人员，能判断AI的分析结果是否严谨、研究问题是否有价值、实验设计是否有漏洞，能把AI的零散产出，整合成有学术价值的研究成果。而科研新人，只会用AI生成一堆看似规范、实则毫无创新的学术垃圾。
法律、金融、咨询行业：AI能快速检索法条、案例、行业数据，生成基础的合同、分析报告。但只有资深的从业者，能根据客户的真实需求，判断哪些信息有用、怎么设计解决方案、怎么规避风险，把AI的产出转化为客户愿意付费的专业服务。

AI的本质，从来不是“替代人类的工作”，而是“重构工作的价值分配”。它把所有标准化、重复性的执行环节，成本降到了几乎为0，让这些工作彻底失去了市场价值；同时，它把上游的判断力、决策力、问题界定能力、系统整合能力，抬到了前所未有的价值高度。

而最残酷的地方在于：这些高价值的核心能力，恰恰需要在日复一日的基础执行工作中，慢慢积累、打磨出来。以前，刚入行的新人可以从写基础代码、整理基础数据、写初稿文案做起，在执行中理解行业的底层逻辑，慢慢成长为资深从业者。但现在，AI直接抽走了新人成长的阶梯——基础执行工作AI都做了，你连亲手做一遍的机会都没有，永远没法理解底层逻辑，永远跨不过那个生产力阈值，最终陷入“越用AI，越没能力，越没能力，越依赖AI”的死循环。

这也是为什么，当下的劳动力市场已经出现了明显的变化：软件开发行业里，资深开发者的招聘需求持续上涨，而初级岗位的招聘规模大幅收缩。这不是因为新人离职率高，也不是因为晋升速度变快，而是企业的用人标准变了——以前企业招新人，是让他做基础执行工作，慢慢培养；现在基础执行工作AI都能做，企业需要的是一上来就能跨过阈值、能把AI产出转化为商业价值的人，新人没有这个能力，自然就失去了入行的机会。

写给所有人的启示：别让AI，废掉你最核心的能力

看到这里，你可能会觉得焦虑：难道普通人、新人，就没法用好AI了吗？当然不是。这项研究真正想告诉我们的，从来不是“不要用AI”，而是“不要用错AI”。

我们必须纠正一个致命的误区：不要把AI当成“替你干活的工具”，而要把它当成“放大你核心能力的放大器”。

很多人用AI的逻辑是错的：他们用AI写代码，是为了自己不用学代码；用AI写文案，是为了自己不用想文案；用AI做数据分析，是为了自己不用懂统计学。最终的结果，就是自己永远练不出核心的判断力，永远停留在生产力阈值之下，AI越发达，自己越容易被替代。

而真正能从AI身上拿到红利的人，用AI的逻辑完全相反：他们已经掌握了底层的专业逻辑，跨过了生产力阈值，用AI替自己完成重复、低价值的执行工作，把省下来的时间和精力，全部放在打磨更高阶的判断力、决策力、系统设计能力上，让自己的核心竞争力越来越强。

对于刚入行的新人、还在读书的大学生，我们给你三个最落地的建议：

永远不要跳过基础的执行环节。哪怕AI能帮你完成，你也要亲手做一遍。学编程，就先亲手写好每一行基础代码，搞懂它的运行逻辑，再用AI去优化；学写作，就先亲手搭好框架、写好核心内容，再用AI去润色。只有亲手做过，你才能真正理解底层逻辑，才有能力判断AI产出的好坏。
把AI当成学习辅助工具，而不是偷懒工具。遇到不懂的问题，不要让AI直接给你答案，而是让AI给你讲解知识点、给你解题思路，最终的答案，一定要自己亲手推导出来。用AI降低学习的门槛，而不是跳过学习的过程。
越早锻炼决策和委派能力，你就越早能跨过生产力阈值。哪怕你只是一个新人，也要试着站在更高的视角看问题：做一个项目，先想清楚核心目标是什么、核心环节有哪些、该怎么拆解任务，再把执行环节交给AI，而不是一上来就让AI替你干活。

最后，我们回到最核心的问题：AI到底给我们带来了什么？我们曾经无数次幻想，AI会把人类从重复的劳动中解放出来，让每个人都能平等地发挥创造力。但现实告诉我们，技术从来不会自动带来平权。它只会放大人类本身的能力，让有准备的人如虎添翼，让想走捷径的人无路可走。

AI从来没有降低生产力的门槛，它只是把门槛，从会不会执行，换成了会不会判断、会不会决策、会不会整合。未来的竞争，从来不是人和AI的竞争，而是“会用AI的人”和“被AI废掉的人”的竞争。

【附】论文中图表通俗解读

论文中的四张图表是整篇研究的核心可视化内容，从「研究方法→全球普及现状→人群差异→收益分化」层层递进。

首页总览图：全文核心结论的浓缩版

这张图是整篇论文的「一句话总结」，直接抛出了研究最核心的两个发现，分为左右两个部分：

左半部分：AI写代码的占比全球暴涨，但各国普及速度天差地别横轴是2019-2024年的时间线，纵轴是AI生成的Python代码占比。你能看到一条从左下角直冲右上角的曲线，说明这5年间，AI辅助写代码的比例几乎从0一路飙升到接近30%，普及速度极快；但不同国家的曲线高低差异明显，代表各国对AI编程工具的接纳和使用进度，拉开了明显差距。
右半部分：AI只给资深开发者「开挂」，新人用了等于白用横轴是开发者的3个核心能力指标：代码提交量（干活效率）、库使用广度（技能覆盖范围）、新库引入（探索陌生技术领域的能力）；纵轴是用了AI之后，这些指标的涨跌幅度，0以上代表提升，0以下代表下降。图中清晰分成两组：高经验的资深开发者，柱子全在0以上，且数值很高，说明用了AI之后，他们干活更快、会的技能更多、也敢涉足全新的技术领域；而低经验的初级开发者，柱子基本贴在0线上，统计学上等于「用了AI之后，没有获得任何可量化的实质性好处」。

图1：AI代码「验钞机」的诞生与验证

这张图是整篇研究的「地基」，讲清了最核心的问题：我们到底怎么精准判断一段代码，是人写的还是AI写的？整个过程就像打造一台专门识别AI代码的「验钞机」，分为4个核心步骤：

图1A：制作「验钞机」的训练素材要分辨「人工代码」和「AI代码」，首先得有标注好的标准样本。第一步，先找100%确定是人工写的代码：2018年的Python函数代码（当时还没有能写代码的成熟AI，绝对纯人工），再补充2022、2024年官方的纯人工代码数据集，避免编程风格随时间变化的干扰。第二步，制作对应的AI代码样本：用两个大模型接力生成，先让第一个模型把人工代码翻译成纯自然语言，说清「这段代码是干嘛的、输入输出是什么」，再让第二个模型只看这段文字描述，重新写一段功能完全一致的代码。这样既保证了AI和人工代码的功能完全匹配，也避免了模型直接抄作业，保证样本的真实性。
图1B：把代码变成机器能看懂的「特征指纹」代码是人能看懂的文字，机器没法直接分辨差异，所以我们用专门为代码设计的GraphCodeBert模型，把每一段代码转换成一串数字向量。简单说，就是把代码里的关键词、注释、变量之间的逻辑关系，全拆解开，提炼出独有的「特征指纹」——人写的和AI写的代码，会留下完全不同的指纹特征。
图1C：训练「验钞机」本身把前面标好「人工/AI」标签的代码指纹，喂给神经网络分类器，让它反复学习两种代码的特征差异，练到能精准区分二者为止，最终就得到了能识别AI代码的分类器。
图1D：验证准确率，正式上岗使用我们用没参与训练的新样本测试，这台「验钞机」的准确率达到了96%，100段代码里能正确识别96段，几乎不会出错。验证通过后，我们就把它用在了6个国家、16万开发者的3100万次代码提交、500万个代码函数上，算出了论文里所有的统计数据。

图2：AI编程工具的全球普及速度大比拼

这张图讲清了2019-2024年，AI编程工具在全球6个核心国家的普及进程，分为左右两个部分：

图2A：美国的AI普及进程，是全球的风向标横轴是2020-2025年的时间线，纵轴是美国开发者的AI生成代码占比。这条线不是平稳上涨的，而是有三次明显的「暴涨节点」，每一次都精准对应AI圈的里程碑事件：第一次是GitHub Copilot测试版发布，第二次是ChatGPT正式上线，第三次是GPT4等第二代大模型集中发布。每出一款更强大的AI工具，开发者用AI写代码的比例就会立刻飙升，到2024年底，美国约29%的Python函数代码，都是在AI的显著辅助下完成的。
图2B：6国普及进度，分出了清晰的梯队这张图对比了美国、法国、德国、印度、中国、俄罗斯6个国家的AI代码占比变化，能清晰看到四个梯队：

领头羊：美国，从一开始就领跑，始终保持第一，但领先优势在持续缩小；
紧追不舍的欧洲：德国、法国，2024年底AI代码占比分别达到24%、23%，和美国的差距已经非常小；
后发猛冲的印度：初期和中俄一样滞后，但2023年开始快速追赶，2024年底追到了20%，即将追上欧洲；
相对滞后的中国、俄罗斯：2024年底的AI代码占比，仍明显低于其他四个国家。论文也补充说明，中国开发者很多使用国内的Gitee平台，而非GitHub，可能导致数据偏低；同时海外主流大模型在中俄有访问限制，也影响了普及速度。

图3：谁最爱用AI？谁真正吃到了AI的红利？

这张图是整篇论文最颠覆认知的部分，完整回答了「AI编程的使用者和受益者，到底是不是同一批人」，四个小图层层递进，拆解了AI使用和效果的人群差异：

图3A：男女开发者，用AI的热情没有差异这张图按性别拆分了AI使用强度，能看到男女的柱子高度几乎完全一致。说明在美国的开发者群体中，男程序员和女程序员，使用AI写代码的频率、比例，没有统计学上的差异，打破了「新技术男性接受度更高」的刻板印象。
图3B：入行越浅的新人，越依赖AI横轴是开发者在GitHub的活跃年限（代表入行资历），纵轴是AI使用强度。图中是一条明显向下的曲线：刚入行的新人，37%的代码都是用AI写的；而经验最丰富的资深开发者，只有27%的代码靠AI辅助。简单说，编程新人比资深老程序员，更频繁、更依赖AI工具。
图3C：整体来看，用AI确实能提升效率和能力边界横轴是开发者的核心工作指标，纵轴是用AI之后的指标提升幅度，所有柱子都在0以上，说明从整体数据看，AI确实有正向作用：
- 代码提交量（干活效率）：整体提升3.6%；
- 多文件修改（处理复杂项目的能力）：显著提升，这类操作需要理清不同代码之间的依赖关系，门槛很高；
- 库使用、新库探索（技能边界与创新能力）：用了AI之后，开发者尝试的新软件库组合增加了2.7%。软件库就像编程里的现成工具包，每个库对应一个全新的技术领域，说明AI确实能帮开发者快速上手陌生领域，拓展能力边界。
图3D：AI的全部红利，都被资深开发者拿走了，新人用了个寂寞这是整篇论文最核心的结论，和首页总览图形成呼应。这张图把开发者分成了高经验的资深群体和低经验的初级群体，对比二者用AI后的收益差异。能清晰看到：资深开发者的柱子全在0以上，且数值很高——达到美国平均29%的AI使用率时，他们的代码提交量能提升6.2%，处理复杂项目、拓展新领域的能力也全面上涨；而初级开发者的柱子，全部贴在0线上，上下波动的范围极小，统计学上意味着「使用AI后，没有获得任何显著的收益提升」。一句话总结：新人用AI最勤、依赖度最高，却没拿到任何实质性好处；资深开发者用得更克制，却把AI的红利全部吃满，AI非但没有抹平技能差距，反而让强者越强、差距越拉越大。

解读文献：

https://doi.org/10.1126/science.adz9311
https://doi.org/10.1126/science.aef5239

也欢迎大家关注我的B站账号。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.