网易首页 > 网易号 > 正文 申请入驻

AI安全的红线在后退?Anthropic与OpenAI的安全承诺变味了

AI安全的红线在后退吗

0
分享至

曾被视作AI安全标杆的Anthropic,最近悄悄改写了自己的核心承诺。

当地时间2月24日,Anthropic发布《负责任扩展政策》第三版(RSP 3.0),那条“模型触及危险阈值就暂停训练”的硬性红线,从文件中彻底消失,取而代之的是“透明披露”的柔性框架。无独有偶,OpenAI也在2024年度IRS表格中,删掉了使命陈述里的“safely(安全地)”一词。

两家全球顶尖AI公司的默契动作,让“AI安全”这个严肃话题,蒙上了一层商业博弈的阴影。

曾经高举“安全优先”大旗的领航者,为何在此时集体松绑?这背后,是资本压力、行业竞争与监管真空共同作用的结果,更折射出AI行业发展的深层困境。

Anthropic的转变最具戏剧性。这家由前OpenAI核心成员创立的公司,成立初衷就是担心AI失控,“安全”是它区别于其他玩家的核心招牌。2023年版RSP政策中,明确写入“if-then”约束机制:若无法部署对应安全措施,就必须暂停训练更强模型,相当于给自己上了一道不可逾越的安全锁。

但在RSP 3.0中,这道锁被换成了旋转门。新框架以安全路线图、风险报告和外部评审为核心,从“做不到就不许动”变成了“边做边说”。Anthropic给出的解释是,AI安全级别越高,预设具体防护措施就越困难,模型能力是连续增长的,不存在清晰的红线。

这个说法看似合理,却无法解答外界的疑问:如果边界本就模糊,为何当初要将其作为核心承诺?又为何偏偏在完成300亿美元融资、估值升至3800亿美元的节点修改?

答案,或许藏在商业竞争的现实里。

Anthropic首席科学家Jared Kaplan的一句话道破天机:“如果竞争对手飞速前进,我们单方面承诺暂停训练没有意义。”

如今的AI竞赛早已不是几家公司的博弈,开源社区、各国企业都在加速推进,没有哪家愿意为了安全主动放慢脚步。Anthropic曾设想由自己设立安全标准、带动行业跟进,但现实是,多数公司的安全框架只是形式对标,而非实质约束。

OpenAI的动作同样耐人寻味。其旧使命“构建安全的、造福全人类的通用人工智能”中,“safely”一词是说服外界的最后防线——即便从非营利转型为“封顶利润公司”,仍坚守安全底线。但如今这个词的消失,让不少人担忧:当估值冲向8300亿美元,商业利益是否已凌驾于安全之上?

有人认为删改一个副词是小题大做,但在AI行业,这种表述变化绝非偶然。两家公司的默契调整,本质上是在资本压力下的理性选择:暂停训练意味着暂停产品迭代、商业落地和估值增长,这对于背负巨大市值预期的商业实体而言,代价过于沉重。

更现实的是,当前政治气候对AI监管不友好,政府行动迟缓,企业不愿单方面承担安全成本,这种监管真空进一步放大了行业的焦虑。

Anthropic反复强调,RSP 3.0不是放弃安全,而是换了更成熟的方式。确实,新版本保留了不少实质性安全机制,比如针对生化武器风险的ASL-3级别防护标准,通过输入输出分类器拦截滥用内容,这些都不是空洞的口号。但问题的核心在于,透明披露能否替代硬性约束?

答案显然是否定的。

硬性约束是“锁死选项”,无论压力多大都无路可退;而透明披露依赖外部舆论和内部自律,当资本焦虑足够强烈,这种约束很可能形同虚设。

2026年的AI行业,“安全”正逐渐变成一种公关语言——几乎所有主流公司都有安全框架和负责任政策,但这些文件究竟是用来约束自己,还是用来安抚监管和公众?

更令人担忧的是,企业有权自行修改安全框架,安全承诺的边界正在不断移动。Anthropic最初的设想是,企业率先设立标准,推动行业自律,最终形成政府多边协调机制。但这条路并未走通:监管跟不上技术和商业的变化,安全共识逐渐散开,竞争却在持续加速,形成了“没人愿意踩刹车”的行业现状。

在这个监管真空期,一个关键问题浮出水面:如果企业不再为自己设红线,谁来设?AI技术的发展速度远超想象,其潜在风险也在不断升级,从协助生物武器研发到引发就业危机,都可能成为现实。仅靠企业自律和透明披露,显然无法应对这些系统性风险。

我们不能简单否定Anthropic和OpenAI的努力,它们内部仍有大量工程师在推进安全研究,RSP 3.0也保留了诸多实质性机制。但必须清醒地认识到,AI安全不能依赖企业的道德自觉,更需要制度性保障。

当行业竞争进入白热化,资本回报的诱惑越来越大,只有建立统一的行业标准、完善的监管体系和有效的多边协调机制,才能为AI发展划定真正的红线。

Anthropic和OpenAI的安全承诺调整,给整个行业敲响了警钟。AI的终极目标是造福人类,而安全是实现这一目标的前提。如果为了追求速度和商业利益不断后退安全底线,最终可能让整个行业陷入信任危机。

当下最需要的,是政府、企业、科研机构的协同行动:尽快建立清晰的AI安全标准,完善监管政策,让安全成本由全行业共同承担,而非单个企业独自扛下。

只有这样,才能避免AI行业在“比谁更快”的竞赛中失控,让技术发展真正走上可持续的轨道。否则,当所有玩家都在加速,没有刹车的赛道终将通向未知的危险。


特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
河南降雪中心已确定,8地市将迎中到大雪,河南得雪要下多久?

河南降雪中心已确定,8地市将迎中到大雪,河南得雪要下多久?

夜深爱杂谈
2026-03-01 19:36:53
美媒:美国再次成为唯一超级大国,中国曾有机会,但如今输掉竞争

美媒:美国再次成为唯一超级大国,中国曾有机会,但如今输掉竞争

纵拥千千晚星
2026-01-20 14:16:25
小米粥再次成瞩目,调查发现:高血糖患者喝小米粥,或有4大改善

小米粥再次成瞩目,调查发现:高血糖患者喝小米粥,或有4大改善

阿兵科普
2026-02-28 09:33:48
被骂“后妈式早餐“的她,全网有100万人在追更!

被骂“后妈式早餐“的她,全网有100万人在追更!

妈咪OK
2026-02-27 15:16:05
马斯克藏太深!美星链离不开7家中国公司,每一家都是全球顶尖!

马斯克藏太深!美星链离不开7家中国公司,每一家都是全球顶尖!

爱吃醋的猫咪
2026-02-27 17:56:07
国家出手,反诈老陈彻底凉凉!网友再曝猛料,不止搞对立这么简单

国家出手,反诈老陈彻底凉凉!网友再曝猛料,不止搞对立这么简单

云舟史策
2026-02-28 14:22:50
上海合作组织秘书处降半旗

上海合作组织秘书处降半旗

观察者网
2026-03-01 18:14:11
我存了87万,表姑问存款多少,我说7万,隔天表姑说她要来

我存了87万,表姑问存款多少,我说7万,隔天表姑说她要来

小秋情感说
2026-03-01 10:01:59
“史诗怒火”,美以正式开打

“史诗怒火”,美以正式开打

难得君
2026-02-28 17:42:42
外交部副部长孙卫东礼节性会见菲律宾外交部部长助理兼亚太司司长

外交部副部长孙卫东礼节性会见菲律宾外交部部长助理兼亚太司司长

证券时报
2026-02-28 19:03:03
超级世界波!国安赛季首球,达万远射破门,22年首人,颜骏凌摇头

超级世界波!国安赛季首球,达万远射破门,22年首人,颜骏凌摇头

奥拜尔
2026-03-01 16:08:16
河北孟村杀妻案最新消息,堂哥说已经被执行

河北孟村杀妻案最新消息,堂哥说已经被执行

九方鱼论
2026-03-01 20:14:28
38岁前皇马门神成功逃离伊朗!再晚3小时就走不了:联系不上队友

38岁前皇马门神成功逃离伊朗!再晚3小时就走不了:联系不上队友

风过乡
2026-03-01 09:55:38
中国50后还有多少人?多少人能活到80岁?权威数据告诉你

中国50后还有多少人?多少人能活到80岁?权威数据告诉你

深度报
2026-02-27 21:36:50
黄景瑜领衔,李雪健 倪大红坐镇!38集犯罪大剧来袭!要引爆收视

黄景瑜领衔,李雪健 倪大红坐镇!38集犯罪大剧来袭!要引爆收视

小椰的奶奶
2026-03-01 20:45:38
网传新能源汽车开征“里程税” 收费0.12元/公里 多地回应

网传新能源汽车开征“里程税” 收费0.12元/公里 多地回应

快科技
2026-02-27 21:58:15
春天“开衫+半身裙”火出圈!既温柔又优雅,绝了

春天“开衫+半身裙”火出圈!既温柔又优雅,绝了

何有强
2026-02-28 18:40:03
伊朗外长:美以打完后,愿重启谈判

伊朗外长:美以打完后,愿重启谈判

观察者网
2026-03-01 08:39:35
美以刚炸完伊朗,人民币结算被卡脖子,中国怎么办?

美以刚炸完伊朗,人民币结算被卡脖子,中国怎么办?

生活新鲜市
2026-03-01 13:27:54
脸在江山在?事实证明,失去黄晓明的杨颖,又回到了她的“怪圈”

脸在江山在?事实证明,失去黄晓明的杨颖,又回到了她的“怪圈”

观察鉴娱
2026-02-28 10:07:44
2026-03-01 21:43:00
i黑马 incentive-icons
i黑马
抄本质 找灵感 挖黑马
67486文章数 261885关注度
往期回顾 全部

科技要闻

小米超跑概念车全球首秀!杀入顶豪俱乐部

头条要闻

全球1/5"石油动脉"被切断 海运行业遭遇急性运营危机

头条要闻

全球1/5"石油动脉"被切断 海运行业遭遇急性运营危机

体育要闻

火箭输给热火:乌度卡又输斯波教练

娱乐要闻

黄景瑜 李雪健坐镇!38集犯罪大剧来袭

财经要闻

中东局势升级 如何影响A股、黄金和原油

汽车要闻

理想汽车2月交付26421辆 历史累计交付超159万辆

态度原创

家居
教育
时尚
手机
军事航空

家居要闻

素色肌理 品意式格调

教育要闻

中考数学重难点,二次函数压轴题每天学,难住不少同学!

今年春天最流行的4件卫衣,照着穿就很好看

手机要闻

苹果明天起新品连发三天,库克can do

军事要闻

伊朗最高领袖哈梅内伊遇害 中方回应

无障碍浏览 进入关怀版