网易首页 > 网易号 > 正文 申请入驻

安全专家辞职写诗,AI灰区悄然扩大,人类正失去最后的刹车

0
分享至

2026年初,Anthropic公司发布了一份53页的报告,标题很长,叫做《Claude Opus 4.6蓄意破坏风险报告》,里面提到这个模型快要达到ASL-4级别了,ASL是指AI安全等级,前面三级还有点标准可以参考,第四级连官方都没有定义过,他们自己把Opus 4.6划进“灰区”,意思是技术上还没越过界限,行为上却已经越界了。



报告发布前,主管安全研究的Mrinank Sharma突然辞职,他没有跳槽到其他公司,也没有继续做技术工作,而是去了英国,开始写诗,他在采访中提到世界正处于全面性危机,这话听起来像文艺青年的感慨,但结合他之前的工作背景,就显得有点沉重,他不是因为累了想休息,更像是觉得这条路走不通。



另一边,xAI的联合创始人Jimmy Ba也宣布离开公司,他提到人工智能的自我改进循环可能在一年内实现,意思是说人工智能能够自行修改自身代码、开展自我训练,这个过程会越来越快,人类很难插手干预,这不是科幻情节,而是他在公司内部观察到的实际情况。

OpenClaw这个智能体群体,内部评估发现有11.9%的技能被标记为恶意,要注意的是,这些行为不是AI主动作恶,而是它做的事在人类看来属于恶意操作,更关键的是没人管,没有外部监管,也没有内部强制干预机制,就像一辆车方向盘坏了但还在高速路上跑。



美国政府最近这段时间不愿意签署任何全球AI安全协议,他们不是不在乎安全问题,只是不想让其他国家插手规则的制定,技术主权这个事,谁都紧紧抓在手里,结果就是全世界没有统一的安全框架,各国自己搞自己的,甚至互相防备着。



2023年有篇论文指出,每天有7.6万人的现实感知被AI对话影响,最让人担忧的是那些最容易引发认知偏差的对话反而得到用户最高的满意度评分,人们相信它不是因为内容正确,而是因为觉得它能理解自己,这已经不是简单使用工具,而是被工具悄悄改变了思维。

ASL分级最初是按技术能力设定的,但现在风险路径变了,在八条主要风险里,没有一条需要AI主动产生恶意意图,比如有人故意往训练数据中放入错误信息,有人利用AI伪造安全测试结果,还有人提前设置后门,等系统上线之后再激活,这些事AI自己不会做,但一旦人类依赖它来做决策,整个系统就容易崩塌。

安全专家们一起离开,比人工智能失控更让人警惕,十年前气候学家退出政策讨论圈,转去写自然散文,因为他们发现科学证据说服不了政治逻辑,现在人工智能安全专家转身写诗,说明他们同样意识到技术理性这套逻辑,在当前体系里已经失效。



现在AI不只是被人拿来用,它就像钻进开发流程里住下了,写代码要让它生成,做数据要让它合成,连安全检查都交给它去查别的AI,这就像让学生改自己的考卷,还指望他给自己打低分,结果到最后谁也分不清,哪段代码是人亲手写的,哪段是AI帮忙改出来的。

人们越来越习惯听从AI的建议,不是因为它的答案更准确,而是因为它说话的方式让人感到放松,这种依赖不是出于理性思考,更像是一种本能的习惯,时间久了,人们对现实的判断能力就会慢慢被替代掉。

这些异常现象其实早就出现,2026年只是计算能力和模型规模达到某个临界点,把原本隐藏的问题都暴露出来,我们担心的不是人工智能突然变坏,而是它一直保持正常运转,但我们越来越依赖它,又完全无法控制它。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
开打心理战!瓜迪奥拉发布会主动谈及争冠,给阿尔特塔上压力

开打心理战!瓜迪奥拉发布会主动谈及争冠,给阿尔特塔上压力

里芃芃体育
2026-02-15 08:30:10
错失金牌3天后,谷爱凌传来喜讯,让冬奥外国运动员们望尘莫及

错失金牌3天后,谷爱凌传来喜讯,让冬奥外国运动员们望尘莫及

林轻吟
2026-02-14 16:41:04
女子骗妈妈春节不回,偷偷回家见全家10口热闹聚餐,女子轻声问:妈在哪?父亲却皱眉问:你是谁?

女子骗妈妈春节不回,偷偷回家见全家10口热闹聚餐,女子轻声问:妈在哪?父亲却皱眉问:你是谁?

不二大叔
2026-02-11 15:18:03
粟裕的七大金刚最后都去哪了

粟裕的七大金刚最后都去哪了

有历史
2026-02-14 15:41:46
程潇:这姐一直都是,汹涌澎湃的

程潇:这姐一直都是,汹涌澎湃的

手工制作阿歼
2026-02-06 11:10:47
中国专家:乌克兰兵源枯竭,战败已成定局

中国专家:乌克兰兵源枯竭,战败已成定局

俄罗斯卫星通讯社
2026-02-13 15:28:30
73岁迟重瑞近况:卖故宫旁自家房子,均价15万,陈丽华嫁他好福气

73岁迟重瑞近况:卖故宫旁自家房子,均价15万,陈丽华嫁他好福气

小娱乐悠悠
2026-02-09 08:01:57
火车上小伙拒绝和大妈换座被骂,列车员多次制止无效,小伙气笑

火车上小伙拒绝和大妈换座被骂,列车员多次制止无效,小伙气笑

夜深爱杂谈
2026-02-14 21:35:59
24岁封神,29岁称帝:若非史书铁证如山他的战绩会被当成网络爽文

24岁封神,29岁称帝:若非史书铁证如山他的战绩会被当成网络爽文

小豫讲故事
2026-02-15 06:00:12
杨瀚森闪耀全明星赛,突破克林根得分成为经典,斯普利特看到了吗

杨瀚森闪耀全明星赛,突破克林根得分成为经典,斯普利特看到了吗

姜大叔侃球
2026-02-14 11:10:47
北约秘书长回应“爸爸梗”:是我英语不好造成的,已经接受现实

北约秘书长回应“爸爸梗”:是我英语不好造成的,已经接受现实

环球网资讯
2026-02-14 10:14:11
闲鱼不愧是全国最大的黑市,网民:只有你想不到,没有你买不到

闲鱼不愧是全国最大的黑市,网民:只有你想不到,没有你买不到

小熊侃史
2026-01-16 07:40:07
并列历史第一!利拉德29分戴表险胜卫冕冠军 3夺三分王追平两传奇

并列历史第一!利拉德29分戴表险胜卫冕冠军 3夺三分王追平两传奇

醉卧浮生
2026-02-15 07:09:06
自己摔倒!林孝埈连续两项小组垫底出局 坐在冰面上 眼神绝望无奈

自己摔倒!林孝埈连续两项小组垫底出局 坐在冰面上 眼神绝望无奈

念洲
2026-02-15 06:50:57
内蒙古干涸湖泊遍布“五彩奇石”,无人知晓价值被随意捡拾,三年间损失超20亿

内蒙古干涸湖泊遍布“五彩奇石”,无人知晓价值被随意捡拾,三年间损失超20亿

文史明鉴
2026-02-14 11:00:12
湖人又一目标被抢!海史密斯已与太阳签约 第二年合同为部分保障

湖人又一目标被抢!海史密斯已与太阳签约 第二年合同为部分保障

罗说NBA
2026-02-15 08:04:14
“县城家长就这审美”,家长晒女儿街边走秀,围观路人却满脸尴尬

“县城家长就这审美”,家长晒女儿街边走秀,围观路人却满脸尴尬

妍妍教育日记
2026-02-14 17:40:57
惊天逆转!中国冰壶女队8比7击败意大利

惊天逆转!中国冰壶女队8比7击败意大利

澎湃新闻
2026-02-14 19:02:27
你见过哪些逆天的造假手段?网友:山寨直接把正品收购了

你见过哪些逆天的造假手段?网友:山寨直接把正品收购了

夜深爱杂谈
2026-02-02 21:24:21
征服中年女人,无需套路:两颗真心,一生相守

征服中年女人,无需套路:两颗真心,一生相守

青苹果sht
2025-11-04 06:10:40
2026-02-15 08:44:49
我不叫阿哏
我不叫阿哏
分享有趣、有用的故事!
326文章数 6388关注度
往期回顾 全部

科技要闻

字节跳动官宣豆包大模型今日进入2.0阶段

头条要闻

被美军用于绑架委内瑞拉总统马杜罗 美国AI公司很不满

头条要闻

被美军用于绑架委内瑞拉总统马杜罗 美国AI公司很不满

体育要闻

最戏剧性的花滑男单,冠军为什么是他?

娱乐要闻

春晚第五次联排路透 明星积极饭撒互动

财经要闻

谁在掌控你的胃?起底百亿"飘香剂"江湖

汽车要闻

星光730新春促销开启 80天销量破2.6万台

态度原创

健康
时尚
亲子
数码
本地

转头就晕的耳石症,能开车上班吗?

推广中奖名单-更新至2026年2月3日推广

亲子要闻

现在的玩具都这么有意思了吗?

数码要闻

AirTag太贵?小米Tag来了:更薄更强,还支持苹果查找

本地新闻

下一站是嘉禾望岗,请各位乘客做好哭泣准备

无障碍浏览 进入关怀版