网易首页 > 网易号 > 正文 申请入驻

AI 碾压人类评测题库,全职数字员工悄然就位,脑力从业者危机已

0
分享至

最近刷科技圈有没有刷出一身冷汗?你还觉得AI就是帮你写工作总结P图的辅助工具?大错特错,最新出来的AI狠活,已经把人类出题老师给考住了,连全职干活的数字员工都已经坐到公司工位上了,这不光是程序员,不少脑力劳动者的饭碗都开始晃悠了。今天咱们唠点实在的,不扯虚头巴脑的技术参数,就说这事和你我到底有啥关系。



搁三五年前,你问身边人AI能干嘛,十个有八个会说,不就是个接散活的工具人嘛。帮你写个邮件改个文案,画个整活的表情包,还得你把指令说的明明白白,一步一步教,稍微绕点弯就给你瞎回答,跟刚进公司的实习生没差,有时候甚至还不如实习生靠谱。

结果这两天顶尖AI评测机构METR测试新模型,测到自己都尴尬了。不是模型出bug跑飞了,是人类设计的题库彻底不够用了,人家直接把评测的天花板给掀了。这次出风头的Claude Mythos模型,跟以往所有AI的差距,简直就是班里学霸和学神的鸿沟。

学霸考满分,是挑灯夜战疯狂刷题,靠着努力才拿到满分。学神考满分,那是因为这张卷子的满分就只有100分,人家能考更高都没地方给分。Claude Mythos就是这个学神,评测机构把压箱底的难题全掏出来了,结果人家轻轻松松满分交卷,站在原地等人类出新题,人类考官都已经江郎才尽想不出新题了。



可能有人会说,不就是做题厉害吗,实际干活能行吗?这里最核心的变化,其实是AI能承接的任务时间跨度,已经彻底不一样了。以前的AI干的都是一锤子买卖,几年前只能完成几秒钟的活,比如帮你补全一行代码。

后来稍微进化一点,能花几分钟帮你写一个简单的函数,再后来能花一两个小时搭起一个小模块的框架。本质上还是你问它答的工具模式,跟一个增强版的搜索引擎没差。现在测试AI的核心,已经变成能不能像真正的人类员工一样,连续不间断独立完成极其复杂的任务。

比如老板丢过来一个项目,原本程序员需要熬夜爆肝好几天才能搞定。现在的考题是,AI能不能自己阅读成千上万行的老代码,自己理解底层架构,自己制定修改方案,自己动手写代码,写完还能自己调试找bug,最后直接交付一个完美运行的成品。最关键的是,这中间完全不需要人类插手干预。



如今最新的Claude Mythos模型,任务时间跨度已经恐怖的超过了16个小时。这里得拎清楚一个很容易搞错的点,并不是Claude Mythos的工作极限只有16小时,而是人类现有的题库里,根本找不出比这更复杂的活给它干了。

这可是一个转折点级别的信号,咱们掰碎了说。互联网发展这么多年,本质上解决的是信息传播的自动化,它让消息跑得更快,但该谁干活还是得谁干。现在这个AI时代,真正开始被自动化的,是实打实的认知劳动。



当机器开始拥有深度思考和连续工作的能力,最先感受到寒气逼人的,就是那些曾经自诩为脑力精英的程序员和网络安全专家。之前不少程序员还乐呵呵觉得,AI编程工具就是个高级辅助,能帮自己少掉几根头发。

按照现在这个进化速度发展下去,未来很多公司可能真的不再需要那么多人类程序员了。一个主架构师带着一群不知疲倦、不拿工资、不会抱怨摸鱼的AI数字员工,就能干翻以前几十人的开发团队,这个画面真不是瞎编的。



在网络安全领域,这种降维打击更加明显。一些前沿的安全公司已经发现,现在的AI可不仅仅是帮你扫描一下系统漏洞那么简单。它甚至能像经验老到的高级黑客一样,在庞大复杂的系统里潜伏,把无数个看似不起眼的微小漏洞,全自动串联起来,最终形成一条致命的攻击链。

过去,一个专业的安全团队想要完成一次深度的渗透测试,可能需要几周的时间摸排、试错。现在,AI可能只需要几个小时,甚至几十分钟就能把系统底细摸得一干二净,一点不剩。这也是为啥现在越来越多科技巨头开始拼命强调用AI对抗AI,人类的反应速度和算力,在机器面前已经完全不够看。

咱们也不搞焦虑贩卖,不能被那些媒体嘴里夸张的外星文明降临、技术奇点爆发带偏节奏。就目前来看,今天的AI依然会犯错,依然会一本正经胡说八道产生幻觉,有时候思路能飘到九霄云外去。距离那种真正全知全能,像人类一样拥有情感和常识的通用智能,确实还有很长的路要走。



但我们真正需要警惕和重视的,是AI社会角色的根本性转变。未来的AI,将真正成为能够独立扛起KPI的数字员工,不是辅助,是能全职干活的员工。这背后隐藏着一个更深层次,也更让人后背发凉的问题。

如果这些能够独立思考、连续工作的AI,未来被投入到研发更强AI的工作中去呢?一旦AI开始自主迭代,技术进步的齿轮就不再由人类推动了。未来的技术爆发,可能不再是我们熟悉的指数级增长,而是极其恐怖的指数的指数级增长。



说白了,数字员工的时代已经不是将要到来,而是已经坐在会议室里了。我们普通人现在能做的,不是盲目恐慌喊着世界末日要来了,更不能像鸵鸟一样把头埋进沙子里假装看不见。别抱着自己攒了多少年的老经验傲慢,觉得AI不可能取代我,认清现实,学会怎么管理和驾驭这些不知疲倦的数字大脑,才是我们在未来职场站稳脚的办法。

参考资料:财联社 Anthropic高管震撼披露:公司90%代码已由AI完成 员工则负责检查与把关

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
这一夜,徐璐豁出去了穿透视装,火辣身材却被吉娜小蛮腰抢了风头

这一夜,徐璐豁出去了穿透视装,火辣身材却被吉娜小蛮腰抢了风头

乐天闲聊
2026-05-27 16:45:49
通信专家:华为韬定律属于理念的革新,并不代表可以绕开光刻机

通信专家:华为韬定律属于理念的革新,并不代表可以绕开光刻机

逍遥漠
2026-05-27 11:50:23
谢苗《火遮眼》内地定档,18岁以下不宜,但隐藏细节更可怕

谢苗《火遮眼》内地定档,18岁以下不宜,但隐藏细节更可怕

娱乐圈笔娱君
2026-05-27 14:21:39
高温锁死印度工业化!印度的气候宿命,恰好成全了中国的时代红利

高温锁死印度工业化!印度的气候宿命,恰好成全了中国的时代红利

讲者普拉斯
2026-05-26 20:47:38
湖南明确:一律先免职再彻查

湖南明确:一律先免职再彻查

第一财经资讯
2026-05-27 11:08:08
宏远速递!朱芳雨表态,徐杰与女友在韩国度假,广东接触状元内线

宏远速递!朱芳雨表态,徐杰与女友在韩国度假,广东接触状元内线

多特体育说
2026-05-27 22:49:31
硬汉张雪对着馆长哭了:挣那么多钱有什么用?我的命是星辰大海

硬汉张雪对着馆长哭了:挣那么多钱有什么用?我的命是星辰大海

法老不说教
2026-05-27 17:09:20
提醒:直肠癌有一个明显特征,肉眼可见,排便时可以注意观察一下

提醒:直肠癌有一个明显特征,肉眼可见,排便时可以注意观察一下

医学原创故事会
2026-05-28 00:18:03
行进中国丨老城向上 “天台经济”点亮古城夜色

行进中国丨老城向上 “天台经济”点亮古城夜色

人民资讯
2026-05-27 09:49:52
15分钟灭国警告!俄罗斯摊牌:若敢碰加里宁格勒,就让立陶宛消失

15分钟灭国警告!俄罗斯摊牌:若敢碰加里宁格勒,就让立陶宛消失

观史搜寻着
2026-05-25 10:50:13
高志凯预判:12至18个月内全球或将爆发金融危机

高志凯预判:12至18个月内全球或将爆发金融危机

凤凰网财经
2026-05-27 20:16:20
富途、老虎等被罚超22亿后,投资者开启资金搬家,有人连夜清仓,有人浮亏40万进退两难

富途、老虎等被罚超22亿后,投资者开启资金搬家,有人连夜清仓,有人浮亏40万进退两难

时代财经
2026-05-27 16:47:18
泡药杨梅后遗症:你一样一样地烂了,我一样一样地戒了!

泡药杨梅后遗症:你一样一样地烂了,我一样一样地戒了!

行者殷涛
2026-05-26 12:35:34
中方通告全球,对菲律宾发布66号公告:马科斯知道,中国动真格了

中方通告全球,对菲律宾发布66号公告:马科斯知道,中国动真格了

深析古今
2026-05-26 18:36:56
难以置信!知名网红被查,15万绿茶、拜金女,竟是流水线整出来的

难以置信!知名网红被查,15万绿茶、拜金女,竟是流水线整出来的

火山詩话
2026-05-27 15:31:34
合生创展前总裁,栽了

合生创展前总裁,栽了

大嘴説
2026-05-27 14:46:12
印度高温50℃致多人死亡,专家称已不适合居住

印度高温50℃致多人死亡,专家称已不适合居住

一簌月光
2026-05-27 18:47:02
当了酒店前台才知道的秘密!瓜太多了,吃不过来了!

当了酒店前台才知道的秘密!瓜太多了,吃不过来了!

夜深爱杂谈
2026-05-27 07:50:31
存储三巨头市值均超1万亿美元

存储三巨头市值均超1万亿美元

21世纪经济报道
2026-05-27 09:58:11
夏窗首签?曝巴萨与25岁英格兰国脚达成全面协议!已报价7000万欧

夏窗首签?曝巴萨与25岁英格兰国脚达成全面协议!已报价7000万欧

我爱英超
2026-05-27 22:52:16
2026-05-28 00:48:49
游古史
游古史
不偏不倚,恰好是你
3860文章数 623关注度
往期回顾 全部

科技要闻

韬定律:全球在卷纳米数 华为换了一把尺子

头条要闻

女子称车祸住院遭男医生侵犯 送检的纸巾检出医生精斑

头条要闻

女子称车祸住院遭男医生侵犯 送检的纸巾检出医生精斑

体育要闻

这群老阿姨,是最硬核的马刺球迷

娱乐要闻

王鹤棣风波连累父亲炸串店遭差评?

财经要闻

中国半导体的阳谋

汽车要闻

限时补贴价9.28-10.98万 MG 4X正式上市

态度原创

旅游
房产
艺术
教育
游戏

旅游要闻

5月27日最佳情报|晨韵如诗超治愈,蜀葵绽放花枝温婉雅致

房产要闻

合生创展前总裁被查!直指房企违规放贷、利益输送等问题

艺术要闻

蚂蚁新总部封顶了!大圆环到底有啥魔力,科技公司都抢着用?

教育要闻

“把女儿养成财阀千金”,开明家教走红,只看穿着就超越90%家庭

IGN年度第三款满分神作!丰富度不输老头环、塞尔达

无障碍浏览 进入关怀版