网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

AI16小时不干预独立研发成功，码农吃惊不已

2026-05-13 00:49:12　来源: 随梦而飞起

四川举报

0

分享至

老清最近关注到全球科技圈一则重磅动态，确实颠覆了以往对 AI 的固有认知。

过去我们一直觉得，人工智能只是高级问答工具，被动应答、偶尔还会生成不实内容。

但近期 Anthropic 推出的 Claude 全新模型，在国际权威 AI 长周期能力评测机构 METR 的测试中，直接触及了现有评测体系的上限。

打个通俗比方：普通 AI 像刻苦刷题的学生，只能完成限定范围内的任务；而这款新模型，是现有人类设计的测试任务，已经跟不上它的能力边界。

这不是简单的分数高低，而是 AI 自主工作能力实现了跨维度跃升。

这种可以长时间自主运行、无需人工频繁干预的智能模型，究竟是行业噱头，还是真的会重塑程序员职场生态？

今天老清就跟大家理性拆解，这场悄悄来临的 AI 职场变革，到底释放了哪些真实信号。

想看懂这次突破的含金量，先得搞懂评测机构 METR 的核心价值。

过往行业测试 AI，大多是应试模式：做数学题、写简短代码、完成阅读理解，考核的是 AI单点答题能力。

而 METR 作为专注 AI 长时序自主能力评估的专业机构，跳出了传统应试逻辑，核心考核指标是任务时间跨度。

简单说：就是测试 AI 能不能像全职程序员一样，独立承接复杂工程项目，长时间连贯工作、中途无需人工指令介入，完整走完一套开发流程。

早几年，AI 只能按秒级执行单条指令；后来进阶到分钟级，独立编写完整函数；再往后能小时级搭建简易功能模块，当时业内普遍认为这已经接近能力天花板。

直到新版 Claude 模型参与 METR 测评，直接刷新了行业认知。

测评设置了一套需要资深程序员连续工作 16 小时才能完成的复杂软件工程任务：自主研读海量历史源码、理解系统底层架构、制定代码修改方案、自主调试报错漏洞，闭环完成全流程开发。

真实情况是：该模型在 METR 标准化测评中，达到了 16 小时级自主任务完成阈值。

并不是说 AI 极限只有 16 小时，而是 METR 目前收录的最高难度、最长周期的实测任务，人类工时上限就设定在 16 小时。

这也印证了一个现实：不是 AI 能力有上限，而是当下人类设计的评测标准，已经不足以衡量它的真实水平。METR 官方也坦言，现有评测框架已难以覆盖这类大模型的长期自主工作能力。

这彻底打破了大家 “AI 只能当辅助工具” 的固有认知，如今 AI 已经具备独立承接完整研发链路的基础能力。

而当这类技术真正落地产业，最先受到冲击的，必然是依赖脑力逻辑的互联网高薪岗位。

过去二三十年，互联网的普及本质是信息传播自动化，打破了时空限制，提升了信息流转效率。

而以 Claude 为代表的长周期自主大模型问世，标志着行业正式迈入认知劳动自动化新阶段。

这一趋势最核心的影响是：单纯依靠基础脑力、逻辑编码的岗位，不再拥有不可替代的壁垒。

首当其冲的，就是程序员和网络安全从业者。

此前 GitHub Copilot 这类编程工具，定位一直是程序员副驾驶：人类主导思路架构，AI 辅助补写代码、优化语法，始终是辅助配角。

但如今具备长周期自主工作能力的大模型，已经可以独立承接完整开发任务，角色从辅助变成了协作主力。

行业趋势肉眼可见：未来基础编码、标准化功能开发、简单模块迭代这类工作，会大量被 AI 承接。

企业无需维持大规模基础开发团队，只需要少量懂业务逻辑、懂架构设计的技术负责人，搭配 AI 工具就能完成常规研发任务，行业人才结构会迎来明显优化调整。

网络安全领域也迎来深刻变革。当前 AI 早已不局限于排查基础代码漏洞，能够智能梳理漏洞逻辑、关联多维度风险点，辅助安全人员梳理攻击路径。

以往企业开展深度网络渗透测试，需要专业白帽团队耗时数周摸排隐患；现在借助 AI 安全工具，能够大幅缩短检测周期、拓宽风险排查范围，极大提升安全防护效率。

站在国内科技战略角度，这是必须重视的技术赛道。

我国拥有全球最大的互联网应用市场，政务、金融、交通等核心基础设施都依托网络运行。海外大模型在自主工程、智能攻防领域的能力突破，倒逼我们必须构建AI 对抗 AI的安全防御体系。

如果海外依靠智能 AI 实现自动化安全攻防，我们仍依赖传统人工排查，会形成明显的效率代差。

正因如此，国内通义千问、DeepSeek、Kimi 等国产大模型，都在重点攻坚长周期自主任务、工程级落地、安全智能防护核心能力。

这早已不是单纯的商业竞争，而是关乎未来科技产业话语权的核心博弈。

我们理性看待：当前顶尖大模型依然存在AI 幻觉、逻辑跑偏、常识缺失等问题，无法真正理解现实物理世界，距离拥有自主意识、通用认知的完全体 AGI，还有很长的技术距离。

但我们真正要警惕的，不是 AI 立刻变得无所不能，而是它的角色定位已经发生质变。

过去 AI 是增强版搜索引擎、高效办公工具；现在的 AI，正在进化为可独立思考、连续作业、自主解决工程问题的数字协作员工。

更值得深思的一点：随着 AI 编程能力持续强化，未来完全可以实现AI 辅助迭代下一代 AI 模型。

一旦形成技术闭环，AI 进化将不再单纯依赖人类研发节奏，会大幅加速算法、模型、算力的迭代速度。

但这并不存在所谓 “指数的指数级失控增长”，只是技术演进效率会显著提升。

METR 此次测评结果，真正的意义在于：它是 AI 从 “工具属性” 转向 “自主智能属性” 的标志性事件。

全球科技巨头都在加码大模型算力、算法、数据布局，加速模型迭代进化。

面对这股浪潮，中国科技圈无需焦虑，更不能被动观望。

我们在高端算力芯片领域虽面临外部限制，但在算法优化、海量应用场景、高质量行业数据层面，具备得天独厚的优势。

我们不必抵制技术进步，反而要主动拥抱变革。

职场里，淘汰人的从来不是 AI，而是会熟练驾驭 AI、适配新工作模式的同行；产业里，只有牢牢掌握国产自主大模型核心技术，才能在全球科技格局重构中守住自身优势。

通用人工智能 AGI 的落地，早已不是科幻概念，而是真切走进编程、研发、安全等领域的现实趋势。

在老清看来，AI 引爆的这场编程革命，是人类科技从制造工具向赋能智力的重大跨越。

它确实会重塑传统职场分工，给固守旧模式的从业者带来压力，但同时也倒逼中国科技产业加速自主创新、完成产业涅槃。

未来，当 AI 不仅能写代码，还能自主搭建系统、辅助科研攻关，全球产业格局、职业体系都会迎来重新洗牌。

但可以确定的是，只要我们保持战略定力，持续做强国产大模型、算力生态、应用落地，中国科技一定能在 AI 狂飙的浪潮中站稳脚跟、抢占先机。

与其焦虑 AI 会不会取代自己，不如静下心来思考：

在自主进化的智能数字时代，你有没有准备好，从单纯 “埋头干活”，升级为驾驭工具、把控逻辑、主导业务的核心角色？

声明：个人原创，仅供参考

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

一个框架，重塑具身研发流程：Dexbotic走向具身PyTorch

机器之心Pro 2026-05-12 09:27:08
0 跟贴 0
OpenAI前CTO创业的模型首秀，与面壁智能「撞车」了

智东西 2026-05-12 20:09:32
0 跟贴 0

大神程序员蒸馏自己，用16个skill给AI注入软件工程之魂

量子位 2026-05-12 03:08:58
0 跟贴 0

OpenAI杀疯了！40亿美元成立新公司、还祭出网络防御利器Daybreak

机器之心Pro 2026-05-12 09:24:12
0 跟贴 0
智元APC香港观察：具身智能的终极角色是先进生产力单元

华尔街见闻官方 2026-05-12 21:49:18
0 跟贴 0

光轮智能与谷歌、英伟达共同定义物理AI仿真标准

机器之心Pro 2026-05-12 20:21:07
0 跟贴 0

安心养虾！从OpenClaw 看云上AI安全落地路径

量子位 2026-04-18 19:55:39
0 跟贴 0
ICML 2026 | 大模型内部也会长出「情绪树」，规模越大越懂人心

机器之心Pro 2026-05-12 12:53:18
0 跟贴 0

亦庄机器人马拉松现场名场面合集

量子位 2026-04-20 00:34:54
0 跟贴 0
智元杀进香港！2026成为部署态元年，机器人不再只会跳舞了

雷科技 2026-05-12 21:59:45
0 跟贴 0
00后小哥复刻Claude最强神话模型OpenMythos

量子位 2026-04-23 11:44:18
0 跟贴 0
支持远程操控和通用GUI操作3

机器之心Pro 2026-03-02 13:36:13
0 跟贴 0
Anthropic的AI读心术，让人类读懂大模型在想啥

量子位 2026-05-10 23:00:57
1 跟贴 1
大模型的魅力在于突发涌现的能力

量子位 2025-12-11 03:38:02
0 跟贴 0
OpenAI又吃官司！佛州枪击案凶手问哪种武器和弹药最适合，何时何地能造成最大伤亡，ChatGPT均给出回答

每日经济新闻 2026-05-12 21:13:07
2 跟贴 2
荒野求生（机器狗全自主版），2025ATEC挑战真实户外无遥操

量子位 2025-12-08 19:24:34
0 跟贴 0
让你的龙虾秒变电影《Her》里的Samantha

量子位 2026-03-23 20:37:07
0 跟贴 0
海外研选 | 大摩：2030年服务器CPU市场规模或达2830亿美元

财联社 2026-05-12 20:07:11
0 跟贴 0
MIT研究生用NotebookLM两天学完一学期课程

量子位 2026-03-22 10:50:49
0 跟贴 0
博士生如何用龙虾做知识管理？欢迎围观！

量子位 2026-03-26 23:23:30
0 跟贴 0
对谈楼天城：Harness会成为AI时代最关键的能力之一

量子位 2026-05-06 15:41:08
0 跟贴 0
如何点亮小龙虾的牛马技能包?

量子位 2026-03-18 12:51:26
0 跟贴 0
百度沈抖自曝：老忘吃药，用AI做了个小程序

量子位 2026-03-27 11:25:23
0 跟贴 0
这个时代必须以Agent为中心：三个趋势回顾

量子位 2026-04-05 02:14:15
0 跟贴 0
LLM数据量大管饱，机器人数据却连1%的起跑线都没够到？

量子位 2026-04-13 20:54:19
0 跟贴 0
AI Agent是科技革命中的一次真正的范式转移

量子位 2026-04-03 22:52:35
0 跟贴 0
陶哲轩：AI不能全用，深度思考不行

量子位 2026-03-19 01:35:49
0 跟贴 0
AI组织坍缩效应：中层管理者正在失去的，不是职位，是“信息税”

虎嗅APP 2026-05-12 23:50:21
0 跟贴 0
2025程序员面试剧变：AI协作成必考题，不会"氛围编程"直接挂

赛博兰博 2026-05-11 11:54:37
1 跟贴 1
盘点那些猝不及防的意外瞬间，这程序员用脑过度，头发都冒青烟

动物科普君 2026-05-08 08:58:44
0 跟贴 0
公司斥巨资挖来的程序员，老板都不敢惹她，直到有幸看到她的技术

陌陌说时尚 2026-05-09 09:48:18
0 跟贴 0
国外技术就是强悍，瑞士自动迫击炮系统，中国目前很难达到

松离搞笑家 2026-05-12 16:30:44
3 跟贴 3
一只太空螃蟹教孩子学Rust：20章故事书有了双语交互版

硅屿手记 2026-05-12 06:56:22
0 跟贴 0
形势这么严峻？网传程序员也失业严重

慧翔百科 2026-05-11 11:42:56
855 跟贴 855
南京28岁码农，女方父母要彩礼21.1万，还要与他们同住，要结婚吗

那年月似故乡明 2026-05-08 10:50:52
40 跟贴 40
姚来英已任中国烟草总公司总经理

界面新闻 2026-05-12 11:12:28
7939 跟贴 7939
Claude Code终于长出调度台：一个屏幕盯住所有AI会话，无需多开

新智元 2026-05-12 12:35:45
0 跟贴 0
这司机技术也不行

大哥搞笑配音 2026-05-12 16:03:47
4 跟贴 4
妻子记录程序员老公失业后，白天画面，晚上滴滴

笑影速递 2026-05-11 09:46:46
6 跟贴 6
聪明的战士驾驶智能鱼雷，炸毁鬼子的军舰

影中见影 2026-05-12 19:05:11
2 跟贴 2

不断挑拨离间！小玥儿忍无可忍，一个动作揭开了与马筱梅的关系

不断挑拨离间！小玥儿忍无可忍，一个动作揭开了与马筱梅的关系

可乐谈情感

2026-05-13 00:17:36

溥仪的贴身侍卫，不仅睡过皇后婉容，还无恶不作，后来被毙于刑场

溥仪的贴身侍卫，不仅睡过皇后婉容，还无恶不作，后来被毙于刑场

宅家伍菇凉

2026-05-07 16:58:56

周迅王骁关系曝光，陈坤领证传闻真相大白

周迅王骁关系曝光，陈坤领证传闻真相大白

汉字笔迹心理分析

2026-05-12 19:21:53

老人不死，子孙遭罪？如果家有八九十岁双亲还在，要牢记这两条准则

老人不死，子孙遭罪？如果家有八九十岁双亲还在，要牢记这两条准则

心理观察局

2026-05-05 09:24:14

奔驰撞人2死6伤后续：女司机正脸曝光，职业反差太大路人曝猛料

奔驰撞人2死6伤后续：女司机正脸曝光，职业反差太大路人曝猛料

大鱼简科

2026-05-11 16:56:45

4月汽车销量前十只剩一款燃油车了

4月汽车销量前十只剩一款燃油车了

金融界

2026-05-12 18:21:50

俄媒曝出惊天内幕：莫斯科故意“养着”泽连斯基，只为一件事

俄媒曝出惊天内幕：莫斯科故意“养着”泽连斯基，只为一件事

无情有思ss

2026-05-13 03:04:19

在名为“统治东方”的地方，让东方人去庆贺？海参崴阅兵未免过了

在名为“统治东方”的地方，让东方人去庆贺？海参崴阅兵未免过了

历史摆渡

2026-05-10 18:55:03

意甲加冕，国米不只赢了一个赛季！橡树加大投资，未来可期！

意甲加冕，国米不只赢了一个赛季！橡树加大投资，未来可期！

肥强侃球

2026-05-12 23:12:44

访华团落地不到7天，巴外长便公开质问中国：嘴上尊重，骨头很硬

访华团落地不到7天，巴外长便公开质问中国：嘴上尊重，骨头很硬

素衣读史

2026-05-11 21:54:32

004数据解读——沙特联：利雅得胜利vs利雅得新月

004数据解读——沙特联：利雅得胜利vs利雅得新月

懂球帝

2026-05-12 15:42:19

难兄难弟，维拉和热刺是本赛季英超仅有的2支还没获得点球的球队

难兄难弟，维拉和热刺是本赛季英超仅有的2支还没获得点球的球队

懂球帝

2026-05-13 03:46:11

散步再次被关注！医生发现：走得越多，高血压患者血管或越干净？

散步再次被关注！医生发现：走得越多，高血压患者血管或越干净？

健康科普365

2026-05-12 20:30:06

辣眼睛！徐州女子出轨求原谅被拒，不断扇自己耳光，现场照片流出

辣眼睛！徐州女子出轨求原谅被拒，不断扇自己耳光，现场照片流出

火山詩话

2026-05-12 06:31:04

卡西利亚斯点燃皇马球迷情绪：“我不想要穆里尼奥”

卡西利亚斯点燃皇马球迷情绪：“我不想要穆里尼奥”

绿茵情报局

2026-05-13 00:48:17

从今日起，中国不再需要日本道歉！这觉醒，来自3500万亡魂的重量

从今日起，中国不再需要日本道歉！这觉醒，来自3500万亡魂的重量

呼呼历史论

2026-05-13 00:53:16

老佛爷：现在不是聊穆帅的时候；有人想让我离开皇马但我不会走

老佛爷：现在不是聊穆帅的时候；有人想让我离开皇马但我不会走

懂球帝

2026-05-13 02:02:28

卫健委已将左氧氟沙星列为重点监控药！医生：服用千万注意7点

卫健委已将左氧氟沙星列为重点监控药！医生：服用千万注意7点

健康科普365

2026-05-10 18:45:06

中足联连开2张罚单：申花、上港外援均遭追加禁赛3场

中足联连开2张罚单：申花、上港外援均遭追加禁赛3场

中超伪球迷

2026-05-12 23:22:57

奶奶刚死3天，瞎子上门讨饭，临走时说：明天你们家要多一口棺材

奶奶刚死3天，瞎子上门讨饭，临走时说：明天你们家要多一口棺材

千秋文化

2026-04-27 20:12:24

随梦而飞起

随梦而飞起

646文章数 51关注度

往期回顾全部

科技要闻

宇树发布载人变形机甲，定价390万元起

头条要闻

特朗普称将同中方讨论对台军售和黎智英案外交部回应

头条要闻

特朗普称将同中方讨论对台军售和黎智英案外交部回应

体育要闻

骑士终于玩明白了？

娱乐要闻

白鹿风波升级！掉粉20万评论区沦陷

财经要闻

利润再腰斩京东干外卖后就没过过好日子

汽车要闻

吉利银河“TT”申报图曝光电动尾翼+激光雷达

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

艺术

教育

房产

健康

军事航空

艺术要闻

震惊！他竟用镜头看透了所有女人的秘密！

教育要闻

求求你试试「5+1+1」学习法!!!

房产要闻

穗八条引爆楼市！万博宝藏红盘，五一劲销出圈

干细胞能让人“返老还童”吗

军事要闻

知情人士披露：美国或考虑恢复对伊朗军事行动

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版