网易首页 > 网易号 > 正文 申请入驻

开发者自认提速24%,实测却慢19%:AI效率神话的裂缝

0
分享至

有个数据挺反直觉的。一群经验丰富的程序员,用AI辅助写代码,心里觉得自己快了24%。结果实验室一测,实际慢了19%。

这不是哪家公司的公关翻车,是METR(Model Evaluation and Threat Research)2024年的研究。测试条件很硬:真实开源项目、对照组、计时。开发者们确实花了更多时间——不是写代码,是检查AI给的答案对不对。


这种现象有个名字:"验证开销"。AI生成的代码看起来能跑,甚至写得挺漂亮,但藏着坑。你得读一遍、测一遍、改一遍。这些步骤原本不存在,现在成了新负担。


但故事还有另一面。波士顿咨询2023年做过一个经典实验:让顾问用GPT-4做市场分析、想产品创意。结果速度提升25%,输出质量高了40%。麦肯锡同年的估算更激进:生成式AI在全球知识工作里的潜在价值,每年2.6到4.4万亿美元。

GitHub Copilot的用户调研显示,55%的开发者自认效率提升。注意是"自认"——自我报告和实测之间,永远有 gap。

斯坦福另一个研究把矛盾说得更细。AI客服工具帮新手员工大忙,老手用起来反而没差别,甚至拖后腿。原因很直白:新人不知道标准答案长什么样,AI给啥都新鲜;老手一眼能看出AI的瑕疵,纠正它比重写还累。

所以AI到底能不能提效?答案是:看任务,看人,看阶段。

结构化、边界清晰的活儿——写周报、做摘要、填模板——AI确实省时间。你能一眼判断对错,错了改起来也快。但开放式问题、需要深度推理的环节,AI容易自信满满地胡说。你信它,后面擦屁股的时间翻倍;不信它,等于白用。

更隐蔽的陷阱是"学习曲线幻觉"。刚开始用AI,速度一定下降。你得熟悉它的脾气,知道什么提示词管用,学会快速验货。很多人在这个阶段就放弃,或者得出结论"AI没用"。


真正尝到甜头的人,往往是熬过了这个阶段,而且选对了战场。他们不是把AI当万能助手,而是当特定环节的加速器。写函数注释?扔给AI。设计系统架构?自己来。

企业层面的误判更贵。采购AI工具时,老板算的是"每人每天省两小时"。实际上线后发现,有人省了三小时,有人多花了一小时,还有人用AI写出了需要全组返工的代码。净效果可能是零,甚至是负的。

研究里还有个细节容易被忽略:开发者"相信"自己快了24%。这种信念本身会影响行为——更敢接复杂任务,更少做保守估算。但如果实际交付变慢,项目计划就会系统性崩盘。

所以怎么测AI的真实价值?不是问"快了多少",是问"同样时间,产出质量变了吗"。也不是看平均数,是看分布——哪些人、哪些场景、哪些任务类型真的受益。

目前最靠谱的结论大概是:AI不是魔法,是杠杆。支点放对了,省力;放错了,砸脚。而大多数人还在找支点的过程中。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
3.1.39亿砸下去,陕西这条路要迎来大升级

3.1.39亿砸下去,陕西这条路要迎来大升级

奇思妙想生活家
2026-05-12 12:25:44
研究表明:男性嫖娼率6.4%,女性出轨率15%,且越有钱越开放!

研究表明:男性嫖娼率6.4%,女性出轨率15%,且越有钱越开放!

黯泉
2026-04-01 17:28:39
黄一鸣新男友正式露脸!直播掰脸硬亲撒狗粮,闪闪和他非常像

黄一鸣新男友正式露脸!直播掰脸硬亲撒狗粮,闪闪和他非常像

橙星文娱
2026-05-12 15:42:58
路虎揽胜运动版SV印度上市,起售价2050万卢比

路虎揽胜运动版SV印度上市,起售价2050万卢比

篮坛第一线
2026-05-13 07:08:57
罗湖一小区使用近30年内部路或将收回?部门:超出红线范围

罗湖一小区使用近30年内部路或将收回?部门:超出红线范围

南方都市报
2026-05-12 11:51:22
伊油轮强闯失败,保莫斯科全俄挨炸

伊油轮强闯失败,保莫斯科全俄挨炸

海子侃生活
2026-05-08 09:09:58
他转走6000美金那天,你才发现信任有多脆

他转走6000美金那天,你才发现信任有多脆

时光慢邮啊
2026-05-12 06:46:57
这张脸,不知道让多少人,在欣赏中欣赏,并赞不绝口。

这张脸,不知道让多少人,在欣赏中欣赏,并赞不绝口。

观星赏月
2026-05-12 16:02:43
4只皮皮虾1035元,官方回应是否“带客吃回扣”

4只皮皮虾1035元,官方回应是否“带客吃回扣”

中国新闻周刊
2026-05-09 19:38:06
英国成伊斯兰国家了?斯塔默宣布:穆斯林是现代英国的标志性面孔

英国成伊斯兰国家了?斯塔默宣布:穆斯林是现代英国的标志性面孔

番外行
2026-05-11 08:50:52
出大事了!美国两大行强行冻结中企4000万,中企硬核反击,太解气

出大事了!美国两大行强行冻结中企4000万,中企硬核反击,太解气

霁寒飘雪
2026-05-12 16:48:12
女乒谁天赋最好?不是王楠、邓亚萍,而是烟酒不离身却拿59金的她

女乒谁天赋最好?不是王楠、邓亚萍,而是烟酒不离身却拿59金的她

傲傲讲历史
2026-04-30 05:05:38
央视与国际足联谈判破裂,越南1500万购中国8000万嫌贵

央视与国际足联谈判破裂,越南1500万购中国8000万嫌贵

无意争春
2026-05-12 12:24:43
山东25岁女子征婚被网友群嘲,奇葩要求让人无语至极

山东25岁女子征婚被网友群嘲,奇葩要求让人无语至极

映射生活的身影
2026-05-12 10:44:30
2026亚洲内容大赏:宋威龙田曦薇入围视帝视后,张凌赫赵今麦最尴尬

2026亚洲内容大赏:宋威龙田曦薇入围视帝视后,张凌赫赵今麦最尴尬

手工制作阿歼
2026-05-13 00:58:29
央视两届世界杯赚100亿!国际足联开条件:下届扩军 国足有望出线

央视两届世界杯赚100亿!国际足联开条件:下届扩军 国足有望出线

念洲
2026-05-12 21:18:42
Model Y高速跑最短,达成率却最高,这事儿到底哪不对劲

Model Y高速跑最短,达成率却最高,这事儿到底哪不对劲

蓝色海边
2026-05-12 11:03:55
瞒不住了!林诗栋背后姐姐大有来头,难怪实力封神,日本输得不冤

瞒不住了!林诗栋背后姐姐大有来头,难怪实力封神,日本输得不冤

勇敢的人享受生活
2026-05-13 06:02:23
U17亚洲杯8强已定6席!1/4决赛对阵:国足将战沙特,16日1点打响

U17亚洲杯8强已定6席!1/4决赛对阵:国足将战沙特,16日1点打响

我爱英超
2026-05-13 03:14:15
14亿中国人有希望看世界杯了!国际足联愿向央视五折出售转播权

14亿中国人有希望看世界杯了!国际足联愿向央视五折出售转播权

林子说事
2026-05-13 01:07:45
2026-05-13 07:36:49
像素与芯片
像素与芯片
有态度网友ytd
3728文章数 24关注度
往期回顾 全部

科技要闻

宇树发布载人变形机甲,定价390万元起

头条要闻

特朗普称将同中方讨论对台军售和黎智英案 外交部回应

头条要闻

特朗普称将同中方讨论对台军售和黎智英案 外交部回应

体育要闻

骑士终于玩明白了?

娱乐要闻

白鹿风波升级!掉粉20万评论区沦陷

财经要闻

利润再腰斩 京东干外卖后就没过过好日子

汽车要闻

吉利银河“TT”申报图曝光 电动尾翼+激光雷达

态度原创

房产
艺术
亲子
本地
公开课

房产要闻

穗八条引爆楼市!万博宝藏红盘,五一劲销出圈

艺术要闻

这位女摄影师的航拍风景照片,简直太美了!

亲子要闻

夏天建议:把孩子的空调服换成它!

本地新闻

用苏绣的方式,打开江西婺源

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版