网易首页 > 网易号 > 正文 申请入驻

AI16小时不干预独立研发成功,码农吃惊不已

0
分享至



老清最近关注到全球科技圈一则重磅动态,确实颠覆了以往对 AI 的固有认知。

过去我们一直觉得,人工智能只是高级问答工具,被动应答、偶尔还会生成不实内容。

但近期 Anthropic 推出的 Claude 全新模型,在国际权威 AI 长周期能力评测机构 METR 的测试中,直接触及了现有评测体系的上限。



打个通俗比方:普通 AI 像刻苦刷题的学生,只能完成限定范围内的任务;而这款新模型,是现有人类设计的测试任务,已经跟不上它的能力边界。

这不是简单的分数高低,而是 AI 自主工作能力实现了跨维度跃升。

这种可以长时间自主运行、无需人工频繁干预的智能模型,究竟是行业噱头,还是真的会重塑程序员职场生态?



今天老清就跟大家理性拆解,这场悄悄来临的 AI 职场变革,到底释放了哪些真实信号。



想看懂这次突破的含金量,先得搞懂评测机构 METR 的核心价值。

过往行业测试 AI,大多是应试模式:做数学题、写简短代码、完成阅读理解,考核的是 AI单点答题能力。



而 METR 作为专注 AI 长时序自主能力评估的专业机构,跳出了传统应试逻辑,核心考核指标是任务时间跨度。

简单说:就是测试 AI 能不能像全职程序员一样,独立承接复杂工程项目,长时间连贯工作、中途无需人工指令介入,完整走完一套开发流程。



早几年,AI 只能按秒级执行单条指令;后来进阶到分钟级,独立编写完整函数;再往后能小时级搭建简易功能模块,当时业内普遍认为这已经接近能力天花板。

直到新版 Claude 模型参与 METR 测评,直接刷新了行业认知。



测评设置了一套需要资深程序员连续工作 16 小时才能完成的复杂软件工程任务:自主研读海量历史源码、理解系统底层架构、制定代码修改方案、自主调试报错漏洞,闭环完成全流程开发。

真实情况是:该模型在 METR 标准化测评中,达到了 16 小时级自主任务完成阈值。



并不是说 AI 极限只有 16 小时,而是 METR 目前收录的最高难度、最长周期的实测任务,人类工时上限就设定在 16 小时。

这也印证了一个现实:不是 AI 能力有上限,而是当下人类设计的评测标准,已经不足以衡量它的真实水平。METR 官方也坦言,现有评测框架已难以覆盖这类大模型的长期自主工作能力。



这彻底打破了大家 “AI 只能当辅助工具” 的固有认知,如今 AI 已经具备独立承接完整研发链路的基础能力。

而当这类技术真正落地产业,最先受到冲击的,必然是依赖脑力逻辑的互联网高薪岗位。





过去二三十年,互联网的普及本质是信息传播自动化,打破了时空限制,提升了信息流转效率。

而以 Claude 为代表的长周期自主大模型问世,标志着行业正式迈入认知劳动自动化新阶段。



这一趋势最核心的影响是:单纯依靠基础脑力、逻辑编码的岗位,不再拥有不可替代的壁垒。

首当其冲的,就是程序员和网络安全从业者。



此前 GitHub Copilot 这类编程工具,定位一直是程序员副驾驶:人类主导思路架构,AI 辅助补写代码、优化语法,始终是辅助配角。

但如今具备长周期自主工作能力的大模型,已经可以独立承接完整开发任务,角色从辅助变成了协作主力。



行业趋势肉眼可见:未来基础编码、标准化功能开发、简单模块迭代这类工作,会大量被 AI 承接。

企业无需维持大规模基础开发团队,只需要少量懂业务逻辑、懂架构设计的技术负责人,搭配 AI 工具就能完成常规研发任务,行业人才结构会迎来明显优化调整。



网络安全领域也迎来深刻变革。当前 AI 早已不局限于排查基础代码漏洞,能够智能梳理漏洞逻辑、关联多维度风险点,辅助安全人员梳理攻击路径。

以往企业开展深度网络渗透测试,需要专业白帽团队耗时数周摸排隐患;现在借助 AI 安全工具,能够大幅缩短检测周期、拓宽风险排查范围,极大提升安全防护效率。



站在国内科技战略角度,这是必须重视的技术赛道。

我国拥有全球最大的互联网应用市场,政务、金融、交通等核心基础设施都依托网络运行。海外大模型在自主工程、智能攻防领域的能力突破,倒逼我们必须构建AI 对抗 AI的安全防御体系。



如果海外依靠智能 AI 实现自动化安全攻防,我们仍依赖传统人工排查,会形成明显的效率代差。

正因如此,国内通义千问、DeepSeek、Kimi 等国产大模型,都在重点攻坚长周期自主任务、工程级落地、安全智能防护核心能力。

这早已不是单纯的商业竞争,而是关乎未来科技产业话语权的核心博弈。





我们理性看待:当前顶尖大模型依然存在AI 幻觉、逻辑跑偏、常识缺失等问题,无法真正理解现实物理世界,距离拥有自主意识、通用认知的完全体 AGI,还有很长的技术距离。



但我们真正要警惕的,不是 AI 立刻变得无所不能,而是它的角色定位已经发生质变。

过去 AI 是增强版搜索引擎、高效办公工具;现在的 AI,正在进化为可独立思考、连续作业、自主解决工程问题的数字协作员工。



更值得深思的一点:随着 AI 编程能力持续强化,未来完全可以实现AI 辅助迭代下一代 AI 模型。

一旦形成技术闭环,AI 进化将不再单纯依赖人类研发节奏,会大幅加速算法、模型、算力的迭代速度。



但这并不存在所谓 “指数的指数级失控增长”,只是技术演进效率会显著提升。

METR 此次测评结果,真正的意义在于:它是 AI 从 “工具属性” 转向 “自主智能属性” 的标志性事件。



全球科技巨头都在加码大模型算力、算法、数据布局,加速模型迭代进化。

面对这股浪潮,中国科技圈无需焦虑,更不能被动观望。

我们在高端算力芯片领域虽面临外部限制,但在算法优化、海量应用场景、高质量行业数据层面,具备得天独厚的优势。



我们不必抵制技术进步,反而要主动拥抱变革。

职场里,淘汰人的从来不是 AI,而是会熟练驾驭 AI、适配新工作模式的同行;产业里,只有牢牢掌握国产自主大模型核心技术,才能在全球科技格局重构中守住自身优势。



通用人工智能 AGI 的落地,早已不是科幻概念,而是真切走进编程、研发、安全等领域的现实趋势。

在老清看来,AI 引爆的这场编程革命,是人类科技从制造工具向赋能智力的重大跨越。

它确实会重塑传统职场分工,给固守旧模式的从业者带来压力,但同时也倒逼中国科技产业加速自主创新、完成产业涅槃。



未来,当 AI 不仅能写代码,还能自主搭建系统、辅助科研攻关,全球产业格局、职业体系都会迎来重新洗牌。

但可以确定的是,只要我们保持战略定力,持续做强国产大模型、算力生态、应用落地,中国科技一定能在 AI 狂飙的浪潮中站稳脚跟、抢占先机。



与其焦虑 AI 会不会取代自己,不如静下心来思考:

在自主进化的智能数字时代,你有没有准备好,从单纯 “埋头干活”,升级为驾驭工具、把控逻辑、主导业务的核心角色?

声明:个人原创,仅供参考

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
不断挑拨离间!小玥儿忍无可忍,一个动作揭开了与马筱梅的关系

不断挑拨离间!小玥儿忍无可忍,一个动作揭开了与马筱梅的关系

可乐谈情感
2026-05-13 00:17:36
溥仪的贴身侍卫,不仅睡过皇后婉容,还无恶不作,后来被毙于刑场

溥仪的贴身侍卫,不仅睡过皇后婉容,还无恶不作,后来被毙于刑场

宅家伍菇凉
2026-05-07 16:58:56
周迅王骁关系曝光,陈坤领证传闻真相大白

周迅王骁关系曝光,陈坤领证传闻真相大白

汉字笔迹心理分析
2026-05-12 19:21:53
老人不死,子孙遭罪?如果家有八九十岁双亲还在,要牢记这两条准则

老人不死,子孙遭罪?如果家有八九十岁双亲还在,要牢记这两条准则

心理观察局
2026-05-05 09:24:14
奔驰撞人2死6伤后续:女司机正脸曝光,职业反差太大路人曝猛料

奔驰撞人2死6伤后续:女司机正脸曝光,职业反差太大路人曝猛料

大鱼简科
2026-05-11 16:56:45
4月汽车销量前十只剩一款燃油车了

4月汽车销量前十只剩一款燃油车了

金融界
2026-05-12 18:21:50
俄媒曝出惊天内幕:莫斯科故意“养着”泽连斯基,只为一件事

俄媒曝出惊天内幕:莫斯科故意“养着”泽连斯基,只为一件事

无情有思ss
2026-05-13 03:04:19
在名为“统治东方”的地方,让东方人去庆贺?海参崴阅兵未免过了

在名为“统治东方”的地方,让东方人去庆贺?海参崴阅兵未免过了

历史摆渡
2026-05-10 18:55:03
意甲加冕,国米不只赢了一个赛季!橡树加大投资,未来可期!

意甲加冕,国米不只赢了一个赛季!橡树加大投资,未来可期!

肥强侃球
2026-05-12 23:12:44
访华团落地不到7天,巴外长便公开质问中国:嘴上尊重,骨头很硬

访华团落地不到7天,巴外长便公开质问中国:嘴上尊重,骨头很硬

素衣读史
2026-05-11 21:54:32
004数据解读——沙特联:利雅得胜利vs利雅得新月

004数据解读——沙特联:利雅得胜利vs利雅得新月

懂球帝
2026-05-12 15:42:19
难兄难弟,维拉和热刺是本赛季英超仅有的2支还没获得点球的球队

难兄难弟,维拉和热刺是本赛季英超仅有的2支还没获得点球的球队

懂球帝
2026-05-13 03:46:11
散步再次被关注!医生发现:走得越多,高血压患者血管或越干净?

散步再次被关注!医生发现:走得越多,高血压患者血管或越干净?

健康科普365
2026-05-12 20:30:06
辣眼睛!徐州女子出轨求原谅被拒,不断扇自己耳光,现场照片流出

辣眼睛!徐州女子出轨求原谅被拒,不断扇自己耳光,现场照片流出

火山詩话
2026-05-12 06:31:04
卡西利亚斯点燃皇马球迷情绪:“我不想要穆里尼奥”

卡西利亚斯点燃皇马球迷情绪:“我不想要穆里尼奥”

绿茵情报局
2026-05-13 00:48:17
从今日起,中国不再需要日本道歉!这觉醒,来自3500万亡魂的重量

从今日起,中国不再需要日本道歉!这觉醒,来自3500万亡魂的重量

呼呼历史论
2026-05-13 00:53:16
老佛爷:现在不是聊穆帅的时候;有人想让我离开皇马但我不会走

老佛爷:现在不是聊穆帅的时候;有人想让我离开皇马但我不会走

懂球帝
2026-05-13 02:02:28
卫健委已将左氧氟沙星列为重点监控药!医生:服用千万注意7点

卫健委已将左氧氟沙星列为重点监控药!医生:服用千万注意7点

健康科普365
2026-05-10 18:45:06
中足联连开2张罚单:申花、上港外援均遭追加禁赛3场

中足联连开2张罚单:申花、上港外援均遭追加禁赛3场

中超伪球迷
2026-05-12 23:22:57
奶奶刚死3天,瞎子上门讨饭,临走时说:明天你们家要多一口棺材

奶奶刚死3天,瞎子上门讨饭,临走时说:明天你们家要多一口棺材

千秋文化
2026-04-27 20:12:24
2026-05-13 04:08:49
随梦而飞起
随梦而飞起
随梦而飞起
646文章数 51关注度
往期回顾 全部

科技要闻

宇树发布载人变形机甲,定价390万元起

头条要闻

特朗普称将同中方讨论对台军售和黎智英案 外交部回应

头条要闻

特朗普称将同中方讨论对台军售和黎智英案 外交部回应

体育要闻

骑士终于玩明白了?

娱乐要闻

白鹿风波升级!掉粉20万评论区沦陷

财经要闻

利润再腰斩 京东干外卖后就没过过好日子

汽车要闻

吉利银河“TT”申报图曝光 电动尾翼+激光雷达

态度原创

艺术
教育
房产
健康
军事航空

艺术要闻

震惊!他竟用镜头看透了所有女人的秘密!

教育要闻

求求你试试「5+1+1」学习法!!!

房产要闻

穗八条引爆楼市!万博宝藏红盘,五一劲销出圈

干细胞能让人“返老还童”吗

军事要闻

知情人士披露:美国或考虑恢复对伊朗军事行动

无障碍浏览 进入关怀版