网易首页 > 网易号 > 正文 申请入驻

别再一键贴代码!Anthropic点名3种「用AI不退化」真方法

0
分享至


新智元报道

编辑:peter东

【新智元导读】在AI编程时代,效率飙升却隐藏危机:Anthropic最新研究揭示,使用AI助手虽能快速生成代码,但开发者在概念理解、代码阅读和调试能力上显著落后。独立解决问题才是技能之钥,AI若不当用,将成「懒惰陷阱」。

2026年初,Anthropic研究揭开了AI辅助编程对技能学习的潜在风险,使用AI助手完成编程任务的开发者,在概念理解、代码阅读和调试能力上显著落后于独立解决问题的同行。


技能退化

AI编程让人难以锻炼调试能力

在AI编程助手日益普及的今天,软件工程领域生产力显著提升。然而,代价是什么?

假设你是一个程序员,现在要用一个新的库来进行开发。

之前你遇到问题,只能接入网络搜索引擎和文档;现在能访问基于GPT-4o的AI编程助手。你会觉得哪一种更有利于你掌握这个库?

在这项研究中,被试者需要学会一个小众的Python异步编程库Trio,每个受试者都是初次使用该库进行编程。

被试者被随机分为两组。一组只用搜索学习,一组只通过大模型问答学习。


图1:实验设计方案

任务完成后,被试者接受了一项精心设计的技能评估测验,涵盖概念理解、代码阅读和调试能力三个方面,以衡量他们对Trio库的掌握程度。

与普遍认知相反,AI辅助并未显著缩短任务完成时间(图2左边)。尽管AI助手能够直接生成完整正确的代码解决方案,但实验组的平均完成时间并未显著优于对照组。


图2:人们使用AI与否与编程速度和技能评估得分

为何会这样?细分后发现,这源于参与者使用AI方式的巨大差异:

  • 一部分参与者完全委托AI生成代码,确实大幅提高了效率;

  • 另一部分参与者花费大量时间与AI交互,甚至有人单次查询就耗时6分钟,抵消了效率优势。

更值得关注的是技能评估结果:AI使用组在测验中的表现明显较差,得分平均低4.15分,而满分为27分。

AI使用组的调试能力与不使用AI组的差距最为明显,代码阅读能力的差距相对较小。这表明,独立解决问题的过程中遇到的错误和调试经历,对技能形成至关重要。

为何调试能力差距最大?那是因为没有使用AI的参与者平均遇到3个错误,而使用AI的平均仅遇到1个错误。

这些错误,尤其是与Trio库直接相关的错误,迫使开发者深入理解库的工作原理,从而促进了学习。

三种学习路径:

用了AI仍保有高技能

通过对使用AI组的行为进行细致分析,从中识别出六种不同的AI交互模式,宛如六条截然不同的学习路径。

其中三条路径通向技能退化,而另外三条则成功保持了技能形成水平。

四名参与者将任务一股脑地委托给AI,他们完成任务最快,但技能得分最低。就像把整个学习过程外包给了机器,自己成了旁观者。

另外四名参与者开始时还算谨慎,只问一两个问题,但很快陷入了渐进式依赖的陷阱。随着任务难度增加,他们最终完全放弃了独立思考,将所有代码生成交给AI。

最令人惋惜的是那些迭代式调试者。他们频繁向AI求助,每次遇到问题就粘贴错误信息,依赖AI提供解决方案。表面上看起来很努力,实际上却错过了最重要的学习机会——独立解决问题的过程。


图3:不同类型的AI使用方式

然而,故事还有另一面。研究人员发现了三种成功的交互模式,这些参与者在AI辅助下不仅完成了任务,还真正掌握了新技能。

两名称为「生成后理解型的参与者先让AI生成代码,但不会简单复制粘贴。相反,他们会停下来,通过AI询问代码的工作原理,就像有个私人导师在旁解释。

三名「混合代码解释型参与者更加聪明。他们在请求代码生成的同时,主动要求AI提供解释。「请生成代码,并解释为什么这样实现」,这样的提问方式让他们在获得解决方案的同时,也理解了背后的逻辑。

最成功的是七名「概念查询型参与者。他们只向AI询问概念性问题,然后依靠自己的理解编写代码。这种方法虽然会遇到更多错误,但正是这些错误成为了最好的老师。


图4:6种不同类型使用AI的方式的完成时间和技能得分

高技能形成模式的共同特点是参与者保持了认知参与度,而不是将思维过程完全外包给AI。概念查询型参与者尤其成功,他们平均成绩达到86%,同时完成任务的速度也较快。

而对照组参与者由于没有AI辅助,在任务过程中遇到了更多错误,包括与Trio库核心概念直接相关的错误。解决这些错误的过程迫使开发者深入理解库的工作原理。而学习中遇到的困难尤其是错误,对技能形成具有不可替代的价值

相比之下,AI组参与者往往一键修复错误,错过了从错误中学习的机会。一位参与者在反馈中坦言:「使用AI助手让我变得懒惰,没有像平时那样仔细阅读Trio库的介绍和代码示例。」

用好AI

AI是解释工具而非代码生成器

随着企业和开发者越来越多地采用AI代码生成与人工监督相结合的工作流程,确保人类监督者具备必要的技能来验证和调试AI编写的代码至关重要。开发者必须寻找维持深度学习与技能精进的平衡点,避免陷入“快而不精”的职业陷阱。

使用AI后,编程技能下降最大的是调试能力,这意味着如果开发者最初使用AI时技能形成受到抑制,他们可能缺乏验证和调试AI编写代码的必要技能。这里是只测试了一个库的学习,如果是对于那些从学编程开始,就只是依赖AI而不自我锻炼能力的,不当使用AI带来的影响只会更加深远。

在时间约束和组织压力下,初级开发者可能会过度依赖AI以最快速度完成任务,牺牲真实的技能发展。这种趋势从长期来看可能削弱行业的技术能力。

然而,研究也指出了解决方案。有三种与AI的交互模式能促进技能形成,这意味着AI可以成为学习的有力辅助工具,关键在于如何使用。保持认知参与度,将AI视为解释工具而非代码生成器,可以兼顾效率和学习效果。

而这不仅需要个人主动更改自己的习惯,还需要专门设计用于教育的AI进行系统提示词,让使用者不只是复制AI生成的代码。

而除了编程能力,像写作、数值分析、估算等实用技能,是不是也会因为使用了AI,导致缺少从犯错中学习的经历,而难以培养起对应能力了,这是一个更值得研究与关注的问题。

参考资料:

https://arxiv.org/abs/2601.20245

https://www.anthropic.com/research/AI-assistance-coding-skills


特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
4月惊雷!医院耗材回扣连环爆:1200人退费8000万,追责才刚开始

4月惊雷!医院耗材回扣连环爆:1200人退费8000万,追责才刚开始

观星赏月
2026-04-19 22:02:10
放假通知!2026中小学暑假时间确定了,家长却表示难以接受

放假通知!2026中小学暑假时间确定了,家长却表示难以接受

凯旋学长
2026-04-19 15:04:39
真相大白!王宝强儿子近照,一眼认出亲爹是谁,宋喆是该哭还是该笑

真相大白!王宝强儿子近照,一眼认出亲爹是谁,宋喆是该哭还是该笑

八卦王者
2026-04-19 11:17:46
哈兰德本赛季平均每99分钟造一球英超球员第1,谢尔基第2

哈兰德本赛季平均每99分钟造一球英超球员第1,谢尔基第2

懂球帝
2026-04-20 03:34:11
白酒帝国的黄昏:珍酒李渡和华致酒行全面“塌房”

白酒帝国的黄昏:珍酒李渡和华致酒行全面“塌房”

深水财经社
2026-04-19 22:00:06
佟丽娅真人被偶遇!网友:陈思诚你眼酸不?

佟丽娅真人被偶遇!网友:陈思诚你眼酸不?

民宿体验志
2026-04-17 13:39:04
最新!美国10名顶尖科学家接连消失,特朗普紧急回应,原因被曝光

最新!美国10名顶尖科学家接连消失,特朗普紧急回应,原因被曝光

影像温度
2026-04-19 17:27:22
游戏已结束,中方断供钨原料,禁止日本人登岛,中国舰艇带炮上场

游戏已结束,中方断供钨原料,禁止日本人登岛,中国舰艇带炮上场

老籣说体育
2026-04-20 00:26:25
A股:刚刚,大消息传来,美方突抵巴基斯坦,周一将迎新关键节点

A股:刚刚,大消息传来,美方突抵巴基斯坦,周一将迎新关键节点

云鹏叙事
2026-04-20 00:00:09
伊朗未证实伊美复谈消息

伊朗未证实伊美复谈消息

界面新闻
2026-04-19 20:45:22
我在伊拉克开工厂,娶了4个老婆,虽然年入千万,如今却很焦虑!

我在伊拉克开工厂,娶了4个老婆,虽然年入千万,如今却很焦虑!

千秋文化
2026-04-16 20:12:45
随着63岁穆帅率队2-1掀翻争冠劲敌,葡超最新积分榜出炉

随着63岁穆帅率队2-1掀翻争冠劲敌,葡超最新积分榜出炉

侧身凌空斩
2026-04-20 03:24:02
40岁演员周瑞自曝:近五个月未进组拍戏,蜗居10平小屋,无车无房

40岁演员周瑞自曝:近五个月未进组拍戏,蜗居10平小屋,无车无房

韩小娱
2026-04-19 18:29:27
性需求是人的活力来源,性需求是成年人最强大的生命力

性需求是人的活力来源,性需求是成年人最强大的生命力

加油丁小文
2026-04-03 11:30:07
伊万卡大秀秃噜了皮的膝盖。她的膝盖怎么会秃噜了皮呢?

伊万卡大秀秃噜了皮的膝盖。她的膝盖怎么会秃噜了皮呢?

一口娱乐
2026-04-18 13:00:29
网上都说他死了,他也没法证明自己还活着

网上都说他死了,他也没法证明自己还活着

万物杂志
2026-04-18 06:06:03
我国摧毁特大假酒网络:查获近2万箱、涉案2.6亿元,多在直播间销售

我国摧毁特大假酒网络:查获近2万箱、涉案2.6亿元,多在直播间销售

金融界
2026-04-19 14:16:10
快检查自家阳台!有人家里已大量出现,官方提醒:千万别摸

快检查自家阳台!有人家里已大量出现,官方提醒:千万别摸

环球网资讯
2026-04-18 16:23:18
法国情侣在泰国海滩“啪啪啪”,被捕后遮脸!当地人怒了!

法国情侣在泰国海滩“啪啪啪”,被捕后遮脸!当地人怒了!

新欧洲
2026-04-18 17:15:30
伊朗方面称只要存在海上封锁就不会谈判

伊朗方面称只要存在海上封锁就不会谈判

极目新闻
2026-04-19 22:27:17
2026-04-20 04:23:00
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
15012文章数 66787关注度
往期回顾 全部

科技要闻

50分26秒破人类纪录!300台机器人狂飙半马

头条要闻

半年下沉22厘米 女子家中坐拥价值上亿别墅却没法住人

头条要闻

半年下沉22厘米 女子家中坐拥价值上亿别墅却没法住人

体育要闻

湖人1比0火箭:老詹比乌度卡像教练

娱乐要闻

何润东涨粉百万!内娱隔空掀桌第一人

财经要闻

华谊兄弟,8年亏光85亿

汽车要闻

29分钟大定破万 极氪8X为什么这么多人买?

态度原创

亲子
艺术
手机
家居
公开课

亲子要闻

孩子总打喷嚏、起疹子,时过敏吗?

艺术要闻

超模施特洛耶克写真曝光,简直美到窒息,别错过!

手机要闻

8.8英寸小钢炮!REDMI K Pad 2核心配置揭晓

家居要闻

法式线条 时光静淌

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版