网易首页 > 网易号 > 正文 申请入驻

"AI让我快了20%"——计时器说:你慢了19%

0
分享至

「AI工具让开发者感觉快了20%。然后研究者测出他们慢了19%。」

这段话来自METR团队的研究,值得每个用Copilot、Cursor的人读两遍。不是四舍五入的误差,是感知与现实的39个百分点鸿沟。而整个行业都在回避这场对话。


一场"感觉很快"的集体幻觉

METR的研究设计很硬:随机对照实验,不是厂商赞助的测评,不是开发者自填问卷。他们找的是有经验的开源贡献者,在自己的代码库里干活——自己熟悉的项目,自己写的代码,没有学习成本干扰。

一半任务用AI编程助手,一半不用。实验前开发者预测AI能让自己快24%,做完仍相信快了约20%。

秒表说:慢了19%。

这个数据刺破了一个行业默契。如果你现在问开发者AI工具是否提升效率,大多数人——包括我自己——会说"是"。这就是陷阱所在:工具确实"感觉"高效。自动补全触发,代码蹦出来,手指在动。

但"在动"和"在推进"是两件事。

METR的研究没细拆时间流向,但作者列了几个被忽略的成本项:

→ 审查和修复AI生成代码的时间,算进去了吗?
→ 输出错误时反复提示重试的时间,算进去了吗?
→ 调试那些不是你写的、隐蔽bug的时间,算进去了吗?
→ 评估每条建议的上下文切换税,算进去了吗?

这些在当下都不注册为"变慢"。它们被体验为"协作感"。数据说不。

数十亿美元建立在什么基础上?

这里有个更吓人的事实。AI编程工具领域的数十亿美元投资, justification(正当性依据)是——开发者情绪调查。

「87%的游戏开发者在工作流中使用AI智能体」,「87%的开发者每天使用AI编程工具」。听着耳熟吗?开发者也会在老板在场时说"会议很有用"。自报生产力比占星术强不了多少。

METR的研究是少数真正去测量"人人都声称已知道"的尝试。结果与叙事相反。

我不是说AI编程工具没用。我用。但我已经停止假设"生成文本快=省时间"。

这不是反AI的论点,是亲诚实的论点。

怎么验证AI真的帮到了你?

如果AI工具确实对你有用,很好。但验证依据要比" gut feeling(直觉)"更硬。作者的建议很具体:

追踪相似任务的实际完成时间。注意那种"花了30分钟和生成的代码搏斗,本来10分钟能手写"的时刻。

不舒服的真相是:速度和速度感是完全不同的东西。一个生成代码很快但生成错误代码也很快的工具,不是生产力工具,是一个非常有说服力的干扰项。

比"AI有没有用"更危险的问题

研究作者的真正担忧,不是AI工具效率不高。而是:

「我们将基于'它们很高效'的错误假设,对工程组织做出根本性改变,而且永远不会停下来质疑这一点。」

我们正在基于生产力增长的假设来招聘、规划 headcount(人头数)、制定 sprint(冲刺)承诺。而这些假设可能根本站不住脚。

想想看:如果AI工具实际上让资深开发者慢了19%,但整个行业都在按"快了20%"来做资源规划,会发生什么?

压缩的排期、膨胀的预期、 burnout(过劳)的团队——而这一切的源头,是一个没人愿意验证的"感觉"。

METR的研究不是终点,是起点。它打开了一个被"87%开发者都在用"这类数据封住的话题。真正的问题不是AI编程工具好不好,而是我们有没有诚实的机制去判断它们好不好。

在砸下下一个亿之前,也许先找个秒表。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
生育大局已定:如不出意外,2026年起中国人口将迎来3大变化

生育大局已定:如不出意外,2026年起中国人口将迎来3大变化

蜉蝣说
2026-03-17 15:58:31
中方对荷光刻机优待全部取消,450亿芯片不做了!

中方对荷光刻机优待全部取消,450亿芯片不做了!

福建睿平
2026-04-22 11:22:01
陈妍希申请强制执行

陈妍希申请强制执行

鲁中晨报
2026-04-22 16:24:02
足协认定漏判海牛点球 叶博亚禁区内倒地应判点

足协认定漏判海牛点球 叶博亚禁区内倒地应判点

体坛周报
2026-04-22 21:48:16
东莞重点发展的5大区域,未来可能让你“高攀不起”!

东莞重点发展的5大区域,未来可能让你“高攀不起”!

次元君情感
2026-04-22 13:29:13
日本人怎么也想不通:上万元的电饭煲,中国是怎么做到卖几十的?

日本人怎么也想不通:上万元的电饭煲,中国是怎么做到卖几十的?

李砍柴
2026-04-22 17:21:23
5月1日起!巨额财产来源不明罪,立案标准从30万大幅提高到300万

5月1日起!巨额财产来源不明罪,立案标准从30万大幅提高到300万

今朝牛马
2026-04-22 21:09:48
17年前,他把黄家驹念成黄家“狗”,自以为幽默,没想到断送前程

17年前,他把黄家驹念成黄家“狗”,自以为幽默,没想到断送前程

老吴教育课堂
2026-04-21 11:35:25
场均20+命中率60%联盟居然只有两人啊!

场均20+命中率60%联盟居然只有两人啊!

柚子说球
2026-04-22 20:42:25
2200万美元成本,《木乃伊》夺得季军,温子仁和华纳兄弟小赚一笔

2200万美元成本,《木乃伊》夺得季军,温子仁和华纳兄弟小赚一笔

电影票房预告片
2026-04-21 23:32:00
深圳福田灯光秀将暂停5个月,预计国庆回归

深圳福田灯光秀将暂停5个月,预计国庆回归

南方都市报
2026-04-22 11:17:53
“保姆纵火案”8年后,再婚得子的林生斌现状曝光,反噬终于来了

“保姆纵火案”8年后,再婚得子的林生斌现状曝光,反噬终于来了

姩姩有娱
2025-10-10 19:01:25
朝鲜5枚导弹齐射,金正恩亲自督战,日本找上中国,发出强烈抗议

朝鲜5枚导弹齐射,金正恩亲自督战,日本找上中国,发出强烈抗议

小涛叨叨
2026-04-21 18:52:37
前两场季后赛三分17中4,凯尔特人后场大将的手感真是惨不忍睹?

前两场季后赛三分17中4,凯尔特人后场大将的手感真是惨不忍睹?

稻谷与小麦
2026-04-23 00:07:47
伤得很深!男子打赏女主播近300万,想结婚时才知对方女儿都20岁了:我只顾为爱冲锋,结果她全是假话

伤得很深!男子打赏女主播近300万,想结婚时才知对方女儿都20岁了:我只顾为爱冲锋,结果她全是假话

台州交通广播
2026-04-10 16:23:25
阿尔特塔长子上演阿森纳U18首秀,恩瓦内里的弟弟在比赛中破门

阿尔特塔长子上演阿森纳U18首秀,恩瓦内里的弟弟在比赛中破门

懂球帝
2026-04-22 22:51:09
展示各队状态!中超非罚积分榜:蓉城19分,申花铜梁龙17分

展示各队状态!中超非罚积分榜:蓉城19分,申花铜梁龙17分

懂球帝
2026-04-22 22:21:01
曼联否决纳格尔斯曼,卡里克转正又近一步!双红会定欧冠资格归属

曼联否决纳格尔斯曼,卡里克转正又近一步!双红会定欧冠资格归属

罗米的曼联博客
2026-04-22 11:31:13
阎鹤祥女儿百天亮相!3个月大体重超18斤 白白胖胖戴金镯子好贵气

阎鹤祥女儿百天亮相!3个月大体重超18斤 白白胖胖戴金镯子好贵气

离离言几许
2026-04-22 23:18:06
深度 | 80多年来首次,放开杀伤性武器出口,日本为何此时迈出危险一步?

深度 | 80多年来首次,放开杀伤性武器出口,日本为何此时迈出危险一步?

上观新闻
2026-04-21 21:18:03
2026-04-23 00:32:49
摸鱼算法
摸鱼算法
致力于用最前沿的AI技术,换取更多发呆时间的三十岁青年。
1608文章数 16关注度
往期回顾 全部

科技要闻

对话梅涛:没有视频底座,具身智能走不远

头条要闻

医院主任"巨额财产来源不明" 被指向女儿转账超800万

头条要闻

医院主任"巨额财产来源不明" 被指向女儿转账超800万

体育要闻

网易传媒再度签约法国队和阿根廷队

娱乐要闻

蜜雪冰城泰国代言人 被扒出辱华黑历史

财经要闻

医院专家号"秒空"!警方牵出黑色产业链

汽车要闻

纯电续航301km+激光雷达 宋Pro DM-i飞驰版9.99万起

态度原创

教育
时尚
手机
艺术
军事航空

教育要闻

初中物理怎么学?树德名师提到学生要有三种思维

用了8年还心动,这笔钱是花得真值啊

手机要闻

爆料称苹果制定“四步走”iPhone相机升级路线图

艺术要闻

无花不风景

军事要闻

特朗普宣布延长停火 伊朗表态

无障碍浏览 进入关怀版